Google представила технологию распознавания музыки нового поколения

С выходом Pixel 2 Google представила функцию Now Playing, которая способна распознавать музыку, играющую в фоне. Now Playing постоянно анализирует окружающие звуки, не требует подключения к Интернету, вся база треков хранится на самом устройстве, основной особенностью новой функции стало использование нейросетей для идентификации треков. В блоге Google AI компания сообщила о том, что внедрила подобную нейросеть в распознавание Sound Search, расположенное на стороне сервера и доступное каждому.

Google представила технологию распознавания музыки нового поколения. Фото.

Теперь, спросив у ассистента “Окей Google, какая это песня?”, можно получить такой же быстрый и точный ответ, как и в случае с Now Playing:

Google представила технологию распознавания музыки нового поколения. Фото.

Для распознавания в Now Playing компания использует отпечаток записи окружающего пространства, после чего подобный отпечаток сравнивается с отпечатками в базе данных смартфона. В Now Playing хранится тысячи песен, база данных постоянно обновляется, добавляются новые треки, а непопулярные удаляются. Это создает некоторые ограничения.

В случае с Sound Search база данных в 1000 раз больше, что позволяет более точно идентифицировать трек и попросту с большей долей вероятности выводить хоть какой-либо результат.

Под отпечатком понимается нечто подобное:

Google представила технологию распознавания музыки нового поколения. Фото.

У нас имеется запись длиной в 9 секунд, полученная с помощью сверточных нейронных сетей, которая разбивается на 2-секундные куски с интервалом в 1 секунду. Тем временем в базе данных хранятся точно такие же отпечатки. Now Playing с помощью двухфазного алгоритма сравнивает отпечаток с базой данных. На первой фазе с помощью гибрид пространственного разбиения и векторного разбиения анализируется вся база на поиск более менее похожих треков. На втором этапе среди кандидатов происходит более глубокий анализ каждого двухсекундного куска.

Из-за слишком большой базы в Sound Search разработчики доработали технологию, в 4 раза увеличив размер нейросети, отрезки сократили до 1 секунды с интервалом в 0,5 секунды. К слову, нечто подобное в распознавании голоса использует компания Yandex.

Мнением делитесь в Telegram-чате или ниже в комментариях.

Теги
Лонгриды для вас
5 важных изменений, которых ждут поклонники Samsung в серии Galaxy S26

Серия Galaxy S25 разочаровала многих поклонников Samsung. Дело не в том, что эти смартфоны плохие, но апгрейд по сравнению с предыдущим поколением оказался минимальным. Дизайн остался без изменений, камеры те же, емкость батарей и скорость зарядки тоже не изменились. Если Samsung хочет вернуть доверие своих пользователей, компании предстоит серьезная работа над Galaxy S26. Вот минимальный набор того, что надо улучшить в новых смартфонах, чтобы они получили популярность и вернули уважение фанатов марки к флагманской линейке.

Читать далее
Илон Маск что-то задумал. Его стартап xAI привлекает огромные средства

Стартап xAI, основанный Илоном Маском в 2023 году, стал одним из самых заметных игроков на рынке искусственного интеллекта. Компания ведёт переговоры о привлечении $4,3 млрд акционерного капитала. Это финансирование должно дополнить уже заявленные $5 млрд, которые xAI планирует получить через продажу долговых обязательств. Такая «возня» говорит о том, что у миллиардера явно есть какие-то планы развития, под которые инвесторы готовы выделять огромные средства. Видимо, нас ждет что-то очень интересное.

Читать далее
Легендарные смарт-часы Pebble возвращаются на рынок

Поклонники носимых устройств получили долгожданную новость о возрождении легендарного бренда Pebble. Компания Core Devices успешно восстановила права на использование торговой марки, что позволяет выпускать новые смарт-часы под знаменитым названием. Когда-то они были очень популярны, но будут ли они снова пользоваться спросом посе такого большого перерыва?

Читать далее
Новости партнеров