Google представила технологию распознавания музыки нового поколения

С выходом Pixel 2 Google представила функцию Now Playing, которая способна распознавать музыку, играющую в фоне. Now Playing постоянно анализирует окружающие звуки, не требует подключения к Интернету, вся база треков хранится на самом устройстве, основной особенностью новой функции стало использование нейросетей для идентификации треков. В блоге Google AI компания сообщила о том, что внедрила подобную нейросеть в распознавание Sound Search, расположенное на стороне сервера и доступное каждому.

Google представила технологию распознавания музыки нового поколения. Фото.

Теперь, спросив у ассистента “Окей Google, какая это песня?”, можно получить такой же быстрый и точный ответ, как и в случае с Now Playing:

Google представила технологию распознавания музыки нового поколения. Фото.

Для распознавания в Now Playing компания использует отпечаток записи окружающего пространства, после чего подобный отпечаток сравнивается с отпечатками в базе данных смартфона. В Now Playing хранится тысячи песен, база данных постоянно обновляется, добавляются новые треки, а непопулярные удаляются. Это создает некоторые ограничения.

В случае с Sound Search база данных в 1000 раз больше, что позволяет более точно идентифицировать трек и попросту с большей долей вероятности выводить хоть какой-либо результат.

Под отпечатком понимается нечто подобное:

Google представила технологию распознавания музыки нового поколения. Фото.

У нас имеется запись длиной в 9 секунд, полученная с помощью сверточных нейронных сетей, которая разбивается на 2-секундные куски с интервалом в 1 секунду. Тем временем в базе данных хранятся точно такие же отпечатки. Now Playing с помощью двухфазного алгоритма сравнивает отпечаток с базой данных. На первой фазе с помощью гибрид пространственного разбиения и векторного разбиения анализируется вся база на поиск более менее похожих треков. На втором этапе среди кандидатов происходит более глубокий анализ каждого двухсекундного куска.

Из-за слишком большой базы в Sound Search разработчики доработали технологию, в 4 раза увеличив размер нейросети, отрезки сократили до 1 секунды с интервалом в 0,5 секунды. К слову, нечто подобное в распознавании голоса использует компания Yandex.

Мнением делитесь в Telegram-чате или ниже в комментариях.

Теги
Лонгриды для вас
Почему даже три камеры не сделают Google Pixel 10 настоящим флагманом

Благодаря открытости Google в отношении ранних анонсов, мы уже знаем, как будет выглядеть новая серия Pixel 10. Самое значительное обновление коснется базовой модели, которая впервые получит третий объектив камеры на задней панели. Это настолько важное улучшение, что делает Pixel 10 идеальным телефоном для большинства пользователей — теперь не будет привычного различия между Pro и обычной моделью. Однако стоит понимать: Pro и обычные модели Pixel остаются двумя разными устройствами. Даже если базовый вариант получает серьезное улучшение, это все еще не настоящее Pro-обновление. Google обязательно сохранит премиальность своего топового предложения, даже если разрыв в функциях сократится.

Читать далее
Основные типы искусственного интеллекта: от простых машин до сверхразума будущего

Искусственный интеллект кардинально меняет нашу жизнь, работу и взаимодействие с технологиями. От виртуальных помощников до беспилотных автомобилей — ИИ управляет многими инструментами, на которые мы полагаемся ежедневно. Однако не все системы искусственного интеллекта одинаковы, и понимание различных типов ИИ поможет разобраться в их возможностях сегодня и потенциале завтра.

Читать далее
Почему смартфоны с батареей на 20 000 мА*ч есть только у ноунеймов, а популярные бренды их не делают

Мы любим рассуждать об автономности современных гаджетов и возмущаться тем, что производители упорно не хотят выпускать смартфоны с большими батареями. Вот только не все задумываются, чем в таком случае пришлось бы пожертвовать и компаниям, и самим пользователям. И всего-то ради нескольких дополнительных часов работы от одного заряда. В Samsung наглядно показали, почему смартфоны от топовых брендов до сих пор топчутся в районе 5000 мА*ч.

Читать далее
Новости партнеров