Google представила технологию распознавания музыки нового поколения

С выходом Pixel 2 Google представила функцию Now Playing, которая способна распознавать музыку, играющую в фоне. Now Playing постоянно анализирует окружающие звуки, не требует подключения к Интернету, вся база треков хранится на самом устройстве, основной особенностью новой функции стало использование нейросетей для идентификации треков. В блоге Google AI компания сообщила о том, что внедрила подобную нейросеть в распознавание Sound Search, расположенное на стороне сервера и доступное каждому.

Google представила технологию распознавания музыки нового поколения. Фото.

Теперь, спросив у ассистента “Окей Google, какая это песня?”, можно получить такой же быстрый и точный ответ, как и в случае с Now Playing:

Google представила технологию распознавания музыки нового поколения. Фото.

Для распознавания в Now Playing компания использует отпечаток записи окружающего пространства, после чего подобный отпечаток сравнивается с отпечатками в базе данных смартфона. В Now Playing хранится тысячи песен, база данных постоянно обновляется, добавляются новые треки, а непопулярные удаляются. Это создает некоторые ограничения.

В случае с Sound Search база данных в 1000 раз больше, что позволяет более точно идентифицировать трек и попросту с большей долей вероятности выводить хоть какой-либо результат.

Под отпечатком понимается нечто подобное:

Google представила технологию распознавания музыки нового поколения. Фото.

У нас имеется запись длиной в 9 секунд, полученная с помощью сверточных нейронных сетей, которая разбивается на 2-секундные куски с интервалом в 1 секунду. Тем временем в базе данных хранятся точно такие же отпечатки. Now Playing с помощью двухфазного алгоритма сравнивает отпечаток с базой данных. На первой фазе с помощью гибрид пространственного разбиения и векторного разбиения анализируется вся база на поиск более менее похожих треков. На втором этапе среди кандидатов происходит более глубокий анализ каждого двухсекундного куска.

Из-за слишком большой базы в Sound Search разработчики доработали технологию, в 4 раза увеличив размер нейросети, отрезки сократили до 1 секунды с интервалом в 0,5 секунды. К слову, нечто подобное в распознавании голоса использует компания Yandex.

Мнением делитесь в Telegram-чате или ниже в комментариях.

Теги
Лонгриды для вас
Почему сканер отпечатка пальца на самом деле не защищает ваш смартфон

Сегодня почти каждый смартфон оснащен сканером отпечатка пальца. Такое положение дел неслучайно, ведь биометрический способ разблокировки экрана считается одновременно и удобным, и безопасным. Однако все это — маркетинговые уловки. На деле же отпечаток пальца не защищает телефон. И если вы до сих пор готовы с этим спорить, то познакомьтесь с доводами, которые подтверждают данный тезис.

Читать далее
5 недорогих 50-дюймовых телевизоров на Андроид ТВ, которые я бы купил себе

Казалось бы, что может быть проще, чем купить телевизор. Пришел в магазин, посмотрел на картинку и выбрал тот, который нравится. Вот только есть во всей этой процедуре парочка проблем. Во-первых, покупать в рознице большую часть техники стало дороговато, а во-вторых, промо ролики, которые крутят в магазинах, даже из самого плохого телека сделают конфетку. Именно поэтому это совершенно не наш путь. К тому же проверить скорость работы на месте и удобство операционной системы вам особо никто не даст.

Читать далее
10 крутых товаров с АлиЭкспресс, которые нужно успеть купить до повышения цен

В последние недели валюта начала стремительно дорожать, из-за чего цены на гаджеты с АлиЭкспресс стали уже не такими привлекательными. При этом далеко не все товары подорожали - на маркетплейсе по-прежнему можно найти много интересного, что в обычных магазинах обойдется дороже. Товары для дома, спорта и многое другое - вот ключ к выгодным покупкам: полазили на Али и нашли десяток хороших товаров, которые лучше купить заранее, не дожидаясь роста цен. Смотрите, что мы для вас приготовили!

Читать далее