Google представила технологию распознавания музыки нового поколения

С выходом Pixel 2 Google представила функцию Now Playing, которая способна распознавать музыку, играющую в фоне. Now Playing постоянно анализирует окружающие звуки, не требует подключения к Интернету, вся база треков хранится на самом устройстве, основной особенностью новой функции стало использование нейросетей для идентификации треков. В блоге Google AI компания сообщила о том, что внедрила подобную нейросеть в распознавание Sound Search, расположенное на стороне сервера и доступное каждому.

Google представила технологию распознавания музыки нового поколения. Фото.

Теперь, спросив у ассистента “Окей Google, какая это песня?”, можно получить такой же быстрый и точный ответ, как и в случае с Now Playing:

Google представила технологию распознавания музыки нового поколения. Фото.

Для распознавания в Now Playing компания использует отпечаток записи окружающего пространства, после чего подобный отпечаток сравнивается с отпечатками в базе данных смартфона. В Now Playing хранится тысячи песен, база данных постоянно обновляется, добавляются новые треки, а непопулярные удаляются. Это создает некоторые ограничения.

В случае с Sound Search база данных в 1000 раз больше, что позволяет более точно идентифицировать трек и попросту с большей долей вероятности выводить хоть какой-либо результат.

Под отпечатком понимается нечто подобное:

Google представила технологию распознавания музыки нового поколения. Фото.

У нас имеется запись длиной в 9 секунд, полученная с помощью сверточных нейронных сетей, которая разбивается на 2-секундные куски с интервалом в 1 секунду. Тем временем в базе данных хранятся точно такие же отпечатки. Now Playing с помощью двухфазного алгоритма сравнивает отпечаток с базой данных. На первой фазе с помощью гибрид пространственного разбиения и векторного разбиения анализируется вся база на поиск более менее похожих треков. На втором этапе среди кандидатов происходит более глубокий анализ каждого двухсекундного куска.

Из-за слишком большой базы в Sound Search разработчики доработали технологию, в 4 раза увеличив размер нейросети, отрезки сократили до 1 секунды с интервалом в 0,5 секунды. К слову, нечто подобное в распознавании голоса использует компания Yandex.

Мнением делитесь в Telegram-чате или ниже в комментариях.

Теги
Лонгриды для вас
Чем хорош защищенный смартфон Blackview XPLORE 2 и где его купить с топовой скидкой

Компания Blackview решила порадовать поклонников защищенных смартфонов хорошей скидкой на модель XPLORE 2. Это устройство создано для тех, кто хочет получить нормальную производительность, современный экран и максимальное время работы. Смартфон одинаково уверенно чувствует себя в экстремальных условиях и в повседневной работе, предлагая отличную функциональность.

Читать далее
Еще есть время купить видеокарту по хорошей цене. США отложили повышение пошлин

Власти США решили отсрочить повышение пошлин на ввоз из Китая компьютерных комплектующих, включая видеокарты, материнские платы и продукцию с микросхемами. Первоначально планировалось ввести дополнительные пошлины в размере 25% уже в ближайшее время, однако теперь срок перенесён на 31 августа 2025 года. И это касается не только американского рынка, ведь многие видеокарты везутся к нам с этого рынка, а кроме этого после введения пошлин они должны подорожать везде.

Читать далее
LineageOS 23.0 расширяет поддержку Android 16: какие смартфоны теперь совместимы

Команда LineageOS продолжает активно расширять список поддерживаемых устройств, добавляя к Android 16 всё новые и новые телефоны. Это означает, что владельцы различных смартфонов получают возможность обновить свои гаджеты до последней версии операционной системы, даже если производитель уже перестал выпускать обновления. Мы собрали список устройств, владельцы которых теперь смогу установить себе обновление.

Читать далее
Новости партнеров