Google представила технологию распознавания музыки нового поколения

С выходом Pixel 2 Google представила функцию Now Playing, которая способна распознавать музыку, играющую в фоне. Now Playing постоянно анализирует окружающие звуки, не требует подключения к Интернету, вся база треков хранится на самом устройстве, основной особенностью новой функции стало использование нейросетей для идентификации треков. В блоге Google AI компания сообщила о том, что внедрила подобную нейросеть в распознавание Sound Search, расположенное на стороне сервера и доступное каждому.

Google представила технологию распознавания музыки нового поколения. Фото.

Теперь, спросив у ассистента “Окей Google, какая это песня?”, можно получить такой же быстрый и точный ответ, как и в случае с Now Playing:

Google представила технологию распознавания музыки нового поколения. Фото.

Для распознавания в Now Playing компания использует отпечаток записи окружающего пространства, после чего подобный отпечаток сравнивается с отпечатками в базе данных смартфона. В Now Playing хранится тысячи песен, база данных постоянно обновляется, добавляются новые треки, а непопулярные удаляются. Это создает некоторые ограничения.

В случае с Sound Search база данных в 1000 раз больше, что позволяет более точно идентифицировать трек и попросту с большей долей вероятности выводить хоть какой-либо результат.

Под отпечатком понимается нечто подобное:

Google представила технологию распознавания музыки нового поколения. Фото.

У нас имеется запись длиной в 9 секунд, полученная с помощью сверточных нейронных сетей, которая разбивается на 2-секундные куски с интервалом в 1 секунду. Тем временем в базе данных хранятся точно такие же отпечатки. Now Playing с помощью двухфазного алгоритма сравнивает отпечаток с базой данных. На первой фазе с помощью гибрид пространственного разбиения и векторного разбиения анализируется вся база на поиск более менее похожих треков. На втором этапе среди кандидатов происходит более глубокий анализ каждого двухсекундного куска.

Из-за слишком большой базы в Sound Search разработчики доработали технологию, в 4 раза увеличив размер нейросети, отрезки сократили до 1 секунды с интервалом в 0,5 секунды. К слову, нечто подобное в распознавании голоса использует компания Yandex.

Мнением делитесь в Telegram-чате или ниже в комментариях.

Теги
Лонгриды для вас
Доступные смартфоны закончились: Xiaomi спалила цены на POCO X8 Pro, и они вам не понравятся

Компания случайно (или нет) засветила маркетинговые материалы линейки POCO X8 Pro. В них фигурируют рендеры, расцветки и, самое интересное, европейские цены на POCO X8 Pro и POCO X8 Pro Max. Если утечка подтвердится, то новинки станут ощутимо дороже прошлогоднего X7 Pro.

Читать далее
Как сдать Т-Банку биометрию, не выходя из дома, и платить на кассах лицом

Есть два досадных момента, которые обычно всплывают в самый неподходящий момент: телефон разрядился, а кошелек с картами остался в другой куртке. И вот стоишь на кассе с полной корзиной продуктов и судорожно придумываешь, что сказать, когда кассир произнесет “оплачивайте”. В этот момент было бы круто, если бы оплата работала вообще без ничего. Собственно, так и устроена оплата по биометрии: ее можно подключить заранее и пользоваться в магазинах, где есть подходящие терминалы.

Читать далее
Самый брутальный смартфон для настоящего мужика. Обзор огромного Oscal Tank 1

Когда впервые взял в руки Oscal Tank 1, первое ощущение было неоднозначным. Он просто огромный. Весит примерно 640 граммов, по размеру в разы больше iPhone Pro Max, внешне выглядит так, что его можно кидать в стену, если её надо сломать… Я понимал, что вряд ли его можно назвать устройством на каждый день, но это не недостаток, а особенность, к которой можно привыкнуть, но, забегая вперед, скажу, что на каждый день я бы себе такой и не купил. Вот только у меня готовилось мотопутешествие, в котором всегда есть проблемы с зарядкой смартфона из-за постоянной работы навигатора и музыки, и поиска сети. Поэтому появление именно такого тестового образца оказалось как никогда кстати. А что из этого получилось, я сейчас и расскажу.

Читать далее
Новости партнеров