Google представила технологию распознавания музыки нового поколения

С выходом Pixel 2 Google представила функцию Now Playing, которая способна распознавать музыку, играющую в фоне. Now Playing постоянно анализирует окружающие звуки, не требует подключения к Интернету, вся база треков хранится на самом устройстве, основной особенностью новой функции стало использование нейросетей для идентификации треков. В блоге Google AI компания сообщила о том, что внедрила подобную нейросеть в распознавание Sound Search, расположенное на стороне сервера и доступное каждому.

Google представила технологию распознавания музыки нового поколения. Фото.

Теперь, спросив у ассистента “Окей Google, какая это песня?”, можно получить такой же быстрый и точный ответ, как и в случае с Now Playing:

Google представила технологию распознавания музыки нового поколения. Фото.

Для распознавания в Now Playing компания использует отпечаток записи окружающего пространства, после чего подобный отпечаток сравнивается с отпечатками в базе данных смартфона. В Now Playing хранится тысячи песен, база данных постоянно обновляется, добавляются новые треки, а непопулярные удаляются. Это создает некоторые ограничения.

В случае с Sound Search база данных в 1000 раз больше, что позволяет более точно идентифицировать трек и попросту с большей долей вероятности выводить хоть какой-либо результат.

Под отпечатком понимается нечто подобное:

Google представила технологию распознавания музыки нового поколения. Фото.

У нас имеется запись длиной в 9 секунд, полученная с помощью сверточных нейронных сетей, которая разбивается на 2-секундные куски с интервалом в 1 секунду. Тем временем в базе данных хранятся точно такие же отпечатки. Now Playing с помощью двухфазного алгоритма сравнивает отпечаток с базой данных. На первой фазе с помощью гибрид пространственного разбиения и векторного разбиения анализируется вся база на поиск более менее похожих треков. На втором этапе среди кандидатов происходит более глубокий анализ каждого двухсекундного куска.

Из-за слишком большой базы в Sound Search разработчики доработали технологию, в 4 раза увеличив размер нейросети, отрезки сократили до 1 секунды с интервалом в 0,5 секунды. К слову, нечто подобное в распознавании голоса использует компания Yandex.

Мнением делитесь в Telegram-чате или ниже в комментариях.

Теги
Лонгриды для вас
Это новый Vivo Y500. Самый защищенный смартфон с большой батареей

Vivo Y500 — это смартфон среднего класса с упором на автономность и повышенную водозащиту: здесь установлена полутвердотельная батарея на 8200 мАч, а корпус сертифицирован по стандарту IP69+ для длительного контакта с водой и экстремальных условий эксплуатации. Устройство ориентировано на тех, кому важны длительная работа без подзарядки, устойчивость к погодным факторам, а также стабильная связь в сложных сценариях вроде лифтов, подвалов и загородных зон.

Читать далее
Qualcomm выпустила процессор, который сделает флагманские смартфоны дешевле

Компания представила новый мобильный процессор Snapdragon 8 Gen 5. Этот чип занимает промежуточную нишу между флагманским и средним уровнями, предлагая максимум производительности по умеренной цене. Первые устройства с новым процессором появятся уже в ближайшие недели. Рассказываем, что это за чип и в каких смартфонах он будет установлен.

Читать далее
Новый компактный компьютер, который заменит большой системник. Обзор Ninkear M8

Помните времена, когда даже рабочий компьютер занимал целый стол? Огромный монитор, большой системный блок, и всё это работало очень шумно. Сейчас технологии дошли до того, что даже в компактном корпусе можно разместить очень производительные компоненты. Поэтому форм-фактор мини-ПК начал набирать всё больше популярности, и всё больше брендов выпускает подобные устройства. Не надо думать о совместимости, компонентах и выделении места. Подключил провод и пользуйся! А если понадобится взять его с собой, положил буквально в карман и пошёл по своим делам. Сейчас расскажу о новом таком компьютере от хорошо известного вам бренда Ninkear.

Читать далее
Новости партнеров