Google представила технологию распознавания музыки нового поколения

С выходом Pixel 2 Google представила функцию Now Playing, которая способна распознавать музыку, играющую в фоне. Now Playing постоянно анализирует окружающие звуки, не требует подключения к Интернету, вся база треков хранится на самом устройстве, основной особенностью новой функции стало использование нейросетей для идентификации треков. В блоге Google AI компания сообщила о том, что внедрила подобную нейросеть в распознавание Sound Search, расположенное на стороне сервера и доступное каждому.

Google представила технологию распознавания музыки нового поколения. Фото.

Теперь, спросив у ассистента “Окей Google, какая это песня?”, можно получить такой же быстрый и точный ответ, как и в случае с Now Playing:

Google представила технологию распознавания музыки нового поколения. Фото.

Для распознавания в Now Playing компания использует отпечаток записи окружающего пространства, после чего подобный отпечаток сравнивается с отпечатками в базе данных смартфона. В Now Playing хранится тысячи песен, база данных постоянно обновляется, добавляются новые треки, а непопулярные удаляются. Это создает некоторые ограничения.

В случае с Sound Search база данных в 1000 раз больше, что позволяет более точно идентифицировать трек и попросту с большей долей вероятности выводить хоть какой-либо результат.

Под отпечатком понимается нечто подобное:

Google представила технологию распознавания музыки нового поколения. Фото.

У нас имеется запись длиной в 9 секунд, полученная с помощью сверточных нейронных сетей, которая разбивается на 2-секундные куски с интервалом в 1 секунду. Тем временем в базе данных хранятся точно такие же отпечатки. Now Playing с помощью двухфазного алгоритма сравнивает отпечаток с базой данных. На первой фазе с помощью гибрид пространственного разбиения и векторного разбиения анализируется вся база на поиск более менее похожих треков. На втором этапе среди кандидатов происходит более глубокий анализ каждого двухсекундного куска.

Из-за слишком большой базы в Sound Search разработчики доработали технологию, в 4 раза увеличив размер нейросети, отрезки сократили до 1 секунды с интервалом в 0,5 секунды. К слову, нечто подобное в распознавании голоса использует компания Yandex.

Мнением делитесь в Telegram-чате или ниже в комментариях.

Теги
Лонгриды для вас
Когда выйдет MagicOS 10: сроки релиза и список поддерживаемых устройств HONOR

HONOR представила новую версию фирменной прошивки MagicOS 10. Она работает на базе Android 16 и получила полностью переработанный интерфейс. Помимо визуальных изменений, система предлагает улучшенную работу искусственного интеллекта и более глубокую интеграцию между устройствами. Когда выйдет прошивка для вашего смартфона?

Читать далее
Этому внешнему аккумулятору на 10000 мАч не нужен дополнительный провод. Обзор Baseus PicoGo

Современный ритм жизни требует от нас постоянной мобильности, а значит — и надежных источников энергии для наших гаджетов. Смартфоны, планшеты, ноутбуки стали неотъемлемой частью повседневности, и их разрядка в самый неподходящий момент может стать серьезной проблемой. Именно поэтому внешний аккумулятор — незаменимый аксессуар для каждого, кто ценит свободу и независимость от розетки. Baseus PicoGo 45 Вт 10000 мАч — это компактное решение, которое, как заверяет производитель, созданно для тех, кто не готов идти на компромиссы между мощностью, удобством и стилем. Но так ли это на самом деле. Мы проверили и у нас есть ответ.

Читать далее
Чем отличается ультразвуковой сканер отпечатков в телефоне от оптического и какой лучше

Сегодня почти у каждого смартфона есть сканер отпечатков пальцев, и почти всегда он прячется в экране. Прошло то время, когда его ставили в кнопки и островки на спинке устройств, теперь его место — дисплей. Однако сканеры в экране бывают разные. Их ключевое отличие — технология работы. Существуют оптические и ультразвуковые сканеры, и от того, какой именно установлен дактилоскоп, будет зависеть удобство использования смартфона.

Читать далее
Новости партнеров