Google представила технологию распознавания музыки нового поколения

С выходом Pixel 2 Google представила функцию Now Playing, которая способна распознавать музыку, играющую в фоне. Now Playing постоянно анализирует окружающие звуки, не требует подключения к Интернету, вся база треков хранится на самом устройстве, основной особенностью новой функции стало использование нейросетей для идентификации треков. В блоге Google AI компания сообщила о том, что внедрила подобную нейросеть в распознавание Sound Search, расположенное на стороне сервера и доступное каждому.

Google представила технологию распознавания музыки нового поколения. Фото.

Теперь, спросив у ассистента “Окей Google, какая это песня?”, можно получить такой же быстрый и точный ответ, как и в случае с Now Playing:

Google представила технологию распознавания музыки нового поколения. Фото.

Для распознавания в Now Playing компания использует отпечаток записи окружающего пространства, после чего подобный отпечаток сравнивается с отпечатками в базе данных смартфона. В Now Playing хранится тысячи песен, база данных постоянно обновляется, добавляются новые треки, а непопулярные удаляются. Это создает некоторые ограничения.

В случае с Sound Search база данных в 1000 раз больше, что позволяет более точно идентифицировать трек и попросту с большей долей вероятности выводить хоть какой-либо результат.

Под отпечатком понимается нечто подобное:

Google представила технологию распознавания музыки нового поколения. Фото.

У нас имеется запись длиной в 9 секунд, полученная с помощью сверточных нейронных сетей, которая разбивается на 2-секундные куски с интервалом в 1 секунду. Тем временем в базе данных хранятся точно такие же отпечатки. Now Playing с помощью двухфазного алгоритма сравнивает отпечаток с базой данных. На первой фазе с помощью гибрид пространственного разбиения и векторного разбиения анализируется вся база на поиск более менее похожих треков. На втором этапе среди кандидатов происходит более глубокий анализ каждого двухсекундного куска.

Из-за слишком большой базы в Sound Search разработчики доработали технологию, в 4 раза увеличив размер нейросети, отрезки сократили до 1 секунды с интервалом в 0,5 секунды. К слову, нечто подобное в распознавании голоса использует компания Yandex.

Мнением делитесь в Telegram-чате или ниже в комментариях.

Теги
Лонгриды для вас
Вот это поворот. DJI начала делать роботы-пылесосы

Компания DJI, признанный лидер в производстве дронов, готовится к значительному расширению своего продуктового портфолио. 6 августа производитель представит свой первый робот-пылесос Romo, что станет важным шагом в освоении рынка устройств для умного дома. Это многое говорит о компании, которая начинала несколько лет назад, как производитель коптеров для чужих камер, а сейчас стала лидером не только в этом направлении, но и с производстве устройств для создания контента. Теперь она замахнулась на умный дом. Но есть ли у нее перспективы?

Читать далее
Чем на самом деле хорош Tensor G5 в новом Pixel 10. Его скрытые возможности

Процессор Tensor стал секретным оружием серии Pixel, обеспечивая смартфоны уникальными AI-возможностями и достойной производительностью. Однако Google была необычно сдержанна в раскрытии подробностей о Tensor G5 внутри серии Pixel 10, что заставляет задуматься о том, что компания скрывает что-то от общественности. Конечно, многие вещи о нем действительно может рассказать только Google, но кое-что мы с вами можем выяснить и сами.

Читать далее
Почему емкость батареи больше не главное для смартфонов

В 2025 году автономность смартфона определяется не только емкостью батареи в миллиампер-часах. Благодаря новым технологиям, таким как кремний-углеродные аккумуляторы, китайские производители преодолели барьер в 5000 мАч. Xiaomi 17 Pro Max получил батарею на 7500 мАч, а iQOO 15, OnePlus 15 и модели Realme GT достигли отметки в 7000 мАч. Однако большая емкость не гарантирует длительную работу. На автономность влияют эффективность энергопотребления, тип дисплея, оптимизация программного обеспечения, управление температурным режимом и обработка сетевых соединений. При этом, бюджетный смартфон с батареей 5000 мАч может работать дольше флагмана с 7000 мАч. А вот это действительно важно.

Читать далее
Новости партнеров