Google представила технологию распознавания музыки нового поколения

С выходом Pixel 2 Google представила функцию Now Playing, которая способна распознавать музыку, играющую в фоне. Now Playing постоянно анализирует окружающие звуки, не требует подключения к Интернету, вся база треков хранится на самом устройстве, основной особенностью новой функции стало использование нейросетей для идентификации треков. В блоге Google AI компания сообщила о том, что внедрила подобную нейросеть в распознавание Sound Search, расположенное на стороне сервера и доступное каждому.

Google представила технологию распознавания музыки нового поколения. Фото.

Теперь, спросив у ассистента “Окей Google, какая это песня?”, можно получить такой же быстрый и точный ответ, как и в случае с Now Playing:

Google представила технологию распознавания музыки нового поколения. Фото.

Для распознавания в Now Playing компания использует отпечаток записи окружающего пространства, после чего подобный отпечаток сравнивается с отпечатками в базе данных смартфона. В Now Playing хранится тысячи песен, база данных постоянно обновляется, добавляются новые треки, а непопулярные удаляются. Это создает некоторые ограничения.

В случае с Sound Search база данных в 1000 раз больше, что позволяет более точно идентифицировать трек и попросту с большей долей вероятности выводить хоть какой-либо результат.

Под отпечатком понимается нечто подобное:

Google представила технологию распознавания музыки нового поколения. Фото.

У нас имеется запись длиной в 9 секунд, полученная с помощью сверточных нейронных сетей, которая разбивается на 2-секундные куски с интервалом в 1 секунду. Тем временем в базе данных хранятся точно такие же отпечатки. Now Playing с помощью двухфазного алгоритма сравнивает отпечаток с базой данных. На первой фазе с помощью гибрид пространственного разбиения и векторного разбиения анализируется вся база на поиск более менее похожих треков. На втором этапе среди кандидатов происходит более глубокий анализ каждого двухсекундного куска.

Из-за слишком большой базы в Sound Search разработчики доработали технологию, в 4 раза увеличив размер нейросети, отрезки сократили до 1 секунды с интервалом в 0,5 секунды. К слову, нечто подобное в распознавании голоса использует компания Yandex.

Мнением делитесь в Telegram-чате или ниже в комментариях.

Теги
Лонгриды для вас
HUAWEI тоже готовит свой ультратонкий смартфон. Им станет Mate 70 Air

Тонкие смартфоны стали новым трендом в мире смартфонов. Многие производители пытаются удивить пользователей. Первый была Samsung, а когда Apple выпустила iPhone Air, можно не сомневаться, что тонкие корпуса станут приоритетом в разработках почти у всех производителей. Huawei Mate 70 Air уже засветился на сайте China Telecom, а новые утечки проливают свет на дату релиза и ключевые характеристики гаджета.

Читать далее
Китайские компании повально отказываются от выпуска тонких смартфонов. Во всем виновата Apple

iPhone Air должен был вернуть моду на тонкие устройства, но вместо этого стал примером того, как не стоит делать, и что даже самый громкий бренд может ошибаться в своих оценках. Слабый спрос на новинку оказался настолько показателен, что вынудил крупнейших китайских производителей отменить собственные проекты по выпуску сверхтонких смартфонов.

Читать далее
Как искусственный интеллект лишает людей работы в 2025 году

К середине 2025 года крупнейшие IT-компании США уволили уже около 94 000 сотрудников. Причина не в экономическом кризисе (или не только в нем), а в стремительном внедрении искусственного интеллекта, который меняет саму структуру IT-сферы. Компании массово пересматривают свои кадровые ресурсы, чтобы соответствовать новым реалиям рынка и сосредоточиться на развитии и интеграции ИИ. Что именно происходит, кто увольняет людей и стоит ли уже напрячься сообщает кадровая компания Final Round AI.

Читать далее
Новости партнеров