Google представила технологию распознавания музыки нового поколения

С выходом Pixel 2 Google представила функцию Now Playing, которая способна распознавать музыку, играющую в фоне. Now Playing постоянно анализирует окружающие звуки, не требует подключения к Интернету, вся база треков хранится на самом устройстве, основной особенностью новой функции стало использование нейросетей для идентификации треков. В блоге Google AI компания сообщила о том, что внедрила подобную нейросеть в распознавание Sound Search, расположенное на стороне сервера и доступное каждому.

Google представила технологию распознавания музыки нового поколения. Фото.

Теперь, спросив у ассистента “Окей Google, какая это песня?”, можно получить такой же быстрый и точный ответ, как и в случае с Now Playing:

Google представила технологию распознавания музыки нового поколения. Фото.

Для распознавания в Now Playing компания использует отпечаток записи окружающего пространства, после чего подобный отпечаток сравнивается с отпечатками в базе данных смартфона. В Now Playing хранится тысячи песен, база данных постоянно обновляется, добавляются новые треки, а непопулярные удаляются. Это создает некоторые ограничения.

В случае с Sound Search база данных в 1000 раз больше, что позволяет более точно идентифицировать трек и попросту с большей долей вероятности выводить хоть какой-либо результат.

Под отпечатком понимается нечто подобное:

Google представила технологию распознавания музыки нового поколения. Фото.

У нас имеется запись длиной в 9 секунд, полученная с помощью сверточных нейронных сетей, которая разбивается на 2-секундные куски с интервалом в 1 секунду. Тем временем в базе данных хранятся точно такие же отпечатки. Now Playing с помощью двухфазного алгоритма сравнивает отпечаток с базой данных. На первой фазе с помощью гибрид пространственного разбиения и векторного разбиения анализируется вся база на поиск более менее похожих треков. На втором этапе среди кандидатов происходит более глубокий анализ каждого двухсекундного куска.

Из-за слишком большой базы в Sound Search разработчики доработали технологию, в 4 раза увеличив размер нейросети, отрезки сократили до 1 секунды с интервалом в 0,5 секунды. К слову, нечто подобное в распознавании голоса использует компания Yandex.

Мнением делитесь в Telegram-чате или ниже в комментариях.

Теги
Лонгриды для вас
Почему не приходят уведомления на Андроид, и как это исправить

Одна из главных проблем любого смартфона - внезапно перестают приходить уведомления на Android. Это чревато пропуском важных сообщений и иногда даже звонков, если речь о соцсетях и мессенджерах. Самое интересное, что вернуть пропавшие уведомления не получится. Зато можно постараться предотвратить исчезновение пушей на телефоне. Вот несколько рабочих способов.

Читать далее
Ждете Samsung Galaxy S26? Лучше ищите другой смартфон. Новинка уже почти разочаровала

Ещё несколько месяцев назад ожидания от линейки Samsung Galaxy S26 были чрезвычайно высокими. Ходили слухи, что базовую модель заменит мощный Galaxy S26 Pro, «переходная» Plus-версия уступит место продвинутому Galaxy S26 Edge, а Ultra останется вершиной инженерного совершенства. Предполагалось, что Samsung наконец-то перегруппирует линейку и вернёт новшествам прежний масштаб. Однако новые утечки и слухи рушат все надежды. Вместо прогресса мы получаем очередное поколение смартфонов без прорыва и без вдохновения.

Читать далее
Приложения на Android будут устанавливаться целый день — что происходит

У Android долгое время была одна важная свобода, за которую систему и любили: можно было без проблем ставить приложения в обход Google Play. Мы уже рассказывали, как устанавливать APK на Android, и именно эта возможность всегда отличала платформу от iPhone. Но теперь Google решила серьезно усложнить этот сценарий. Если приложение загружается не из официального магазина и его разработчик не прошел проверку, установка APK на Android может растянуться почти на сутки.

Читать далее
Новости партнеров