Google представила технологию распознавания музыки нового поколения

С выходом Pixel 2 Google представила функцию Now Playing, которая способна распознавать музыку, играющую в фоне. Now Playing постоянно анализирует окружающие звуки, не требует подключения к Интернету, вся база треков хранится на самом устройстве, основной особенностью новой функции стало использование нейросетей для идентификации треков. В блоге Google AI компания сообщила о том, что внедрила подобную нейросеть в распознавание Sound Search, расположенное на стороне сервера и доступное каждому.

Теперь, спросив у ассистента “Окей Google, какая это песня?”, можно получить такой же быстрый и точный ответ, как и в случае с Now Playing:

Для распознавания в Now Playing компания использует отпечаток записи окружающего пространства, после чего подобный отпечаток сравнивается с отпечатками в базе данных смартфона. В Now Playing хранится тысячи песен, база данных постоянно обновляется, добавляются новые треки, а непопулярные удаляются. Это создает некоторые ограничения.

В случае с Sound Search база данных в 1000 раз больше, что позволяет более точно идентифицировать трек и попросту с большей долей вероятности выводить хоть какой-либо результат.

Под отпечатком понимается нечто подобное:

У нас имеется запись длиной в 9 секунд, полученная с помощью сверточных нейронных сетей, которая разбивается на 2-секундные куски с интервалом в 1 секунду. Тем временем в базе данных хранятся точно такие же отпечатки. Now Playing с помощью двухфазного алгоритма сравнивает отпечаток с базой данных. На первой фазе с помощью гибрид пространственного разбиения и векторного разбиения анализируется вся база на поиск более менее похожих треков. На втором этапе среди кандидатов происходит более глубокий анализ каждого двухсекундного куска.

Из-за слишком большой базы в Sound Search разработчики доработали технологию, в 4 раза увеличив размер нейросети, отрезки сократили до 1 секунды с интервалом в 0,5 секунды. К слову, нечто подобное в распознавании голоса использует компания Yandex.

Мнением делитесь в Telegram-чате или ниже в комментариях.

Теги
Лонгриды для вас
Google Объектив научился быстро переводить текст со скриншотов

Приложение Google Объектив или Google Lens, если говорить на языке оригинала, давно стало неотъемлемой частью смартфонов многих пользователей. Я даже говорю не про те устройства, где ”Объектив” является частью камеры и интегрирован в штатное приложение. Его можно скачать на любой смартфон и пользоваться тогда, когда захочется. Оно постоянно обрастает новыми функциями и теперь вышла еще одна, которая позволяет переводить текст со скриншотов. Рассказывать о том, когда это может пригодиться, не стоит, лучше показать, как пользоваться новой функцией. Вот этим и займемся. Тем более, что перевод всегда был полезной и актуальной функцией смартфона.

Читать далее
Скрытые функции Samsung на One UI, о которых надо знать

Нам каждый раз говорят, что та или иная операционная система очень удобная и интуитивно понятная. Вот только это не так. Иначе, почему тогда каждый раз есть, о чем рассказать в статье, вроде этой? Уверен, что многие из вас скажут что-то, вроде ”Вау, вот оказывается, как можно было!”. Проблема в том, что из-за большого количества функций и настроек, многие действительно полезные из них просто теряются. В этой статье расскажу о них и покажу, как активировать ту или иную настройку в смартфонах Samsung, работающих на оболочке ONE UI. То есть почти на всех современных моделях и тем более на флагманах, вроде Galaxy S21.

Читать далее
Chromecast
Как я пользуюсь Chromecast и нужно ли его покупать

Помню, как в свое время я долго выбирал, какой медиаплеер купить, чтобы смотреть видео с флешек и жестких дисков. Теперь времена изменились, и оффлайн видео если еще не до конца ушло в прошлое, то постепенно делает это. Оно уступило место потоковым сервисам. Про сами сервисы мы сейчас говорить не будем, тем более их много и каждый выберет свой. Поговорим лучше про главный аксессуар от Google в этом направлении электроники. Я имею в виду Google Chromacast. У него есть как плюсы, так и минусы. Я не могу пользоваться им на постоянной основе, но у меня он все равно есть. В этой статье я хочу рассказать о своем отношении к этому прибору и услышать ваше мнение. Может быть вы посоветуете что-то интересное или поделитесь каким-то малоизвестным ”юзкейсом”.

Читать далее
1 комментарий
  1. iWolf

    Вся база в оффлайне храниться?

Новый комментарий