Google представила технологию распознавания музыки нового поколения

С выходом Pixel 2 Google представила функцию Now Playing, которая способна распознавать музыку, играющую в фоне. Now Playing постоянно анализирует окружающие звуки, не требует подключения к Интернету, вся база треков хранится на самом устройстве, основной особенностью новой функции стало использование нейросетей для идентификации треков. В блоге Google AI компания сообщила о том, что внедрила подобную нейросеть в распознавание Sound Search, расположенное на стороне сервера и доступное каждому.

Google представила технологию распознавания музыки нового поколения. Фото.

Теперь, спросив у ассистента “Окей Google, какая это песня?”, можно получить такой же быстрый и точный ответ, как и в случае с Now Playing:

Google представила технологию распознавания музыки нового поколения. Фото.

Для распознавания в Now Playing компания использует отпечаток записи окружающего пространства, после чего подобный отпечаток сравнивается с отпечатками в базе данных смартфона. В Now Playing хранится тысячи песен, база данных постоянно обновляется, добавляются новые треки, а непопулярные удаляются. Это создает некоторые ограничения.

В случае с Sound Search база данных в 1000 раз больше, что позволяет более точно идентифицировать трек и попросту с большей долей вероятности выводить хоть какой-либо результат.

Под отпечатком понимается нечто подобное:

Google представила технологию распознавания музыки нового поколения. Фото.

У нас имеется запись длиной в 9 секунд, полученная с помощью сверточных нейронных сетей, которая разбивается на 2-секундные куски с интервалом в 1 секунду. Тем временем в базе данных хранятся точно такие же отпечатки. Now Playing с помощью двухфазного алгоритма сравнивает отпечаток с базой данных. На первой фазе с помощью гибрид пространственного разбиения и векторного разбиения анализируется вся база на поиск более менее похожих треков. На втором этапе среди кандидатов происходит более глубокий анализ каждого двухсекундного куска.

Из-за слишком большой базы в Sound Search разработчики доработали технологию, в 4 раза увеличив размер нейросети, отрезки сократили до 1 секунды с интервалом в 0,5 секунды. К слову, нечто подобное в распознавании голоса использует компания Yandex.

Мнением делитесь в Telegram-чате или ниже в комментариях.

Теги
Лонгриды для вас
Xiaomi выпускает флагман для бедных в цвете iPhone 17 Pro: когда выйдет и каким будет Redmi Turbo 5 Max

Redmi официально подтвердила дату запуска линейки Turbo 5. Новые смартфоны еще на этапе анонса позиционируются как убийцы флагманов, а такое мы любим. Согласитесь, что здорово, когда производитель делает недорого и при этом мощно с точки зрения начинки. Презентация серии Redmi Turbo 5 состоится 29 января в Китае, и в неё войдут сразу две модели: Turbo 5 и Turbo 5 Max. Причём старшая версия явно нацелена на то, чтобы конкурировать со смартфонами, которые стоят заметно дороже.

Читать далее
Google создает новую ОС для компьютеров. Какой будет Aluminium OS?

Google готовится к выпуску новой операционной системы под названием Aluminium OS. Это платформа, которая объединяет Android, ChromeOS и современные ИИ-возможности. Если проект окажется успешным, Google сможет конкурировать с Windows и macOS на их территории. Уже сейчас анонс вызывает большой интерес, ведь речь идет о создании единой среды для смартфонов, планшетов и ПК. Но что это значит на практике?

Читать далее
Android-смартфоны все больше похожи на iPhone. Что с этим делать

За последние годы я протестировал множество флагманских Android-устройств от разных производителей. И с каждым новым релизом замечаю одну тревожную тенденцию: смартфоны становятся все более похожими на iPhone. Мы говорили об этом несколько лет назад, но сейчас это выражено еще более ярко. Плоские грани, закругленные углы, оранжевый цвет — это дизайнерское решение Apple теперь копируют практически все крупные бренды. Проблема не только в отсутствии оригинальности. Телефоны с плоскими краями менее удобны в использовании по сравнению с моделями, имеющими скругленные или скошенные грани. Они выглядят и ощущаются толще, чем есть на самом деле, напоминая кирпич в руке.

Читать далее
Новости партнеров