ИИ от Google поможет сделать их голосовой ассистент лучшим на рынке

На сегодняшний день голосовые ассистенты довольно неплохо распознают речь. Но есть одна проблема: как правило, помощники работают хорошо до тех пор, пока они слышат более или менее «правильную» речь. Стоит с ними заговорить с акцентом или же просто невнятно, и от «ума» ассистента не останется и следа. Однако же исследователи лаборатории Google AI, работающие совместно с учеными из Института по изучению бокового амиотрофического склероза (болезни, от которой страдал известный физик Стивен Хокиг), разработали ИИ-систему, которая может распознавать произношение людей с нарушениями речи или акцентом.

ИИ от Google поможет сделать их голосовой ассистент лучшим на рынке. Фото.

Зачем улучшать голосовых ассистентов?

Исследователи из Google говорят, что их подход поможет улучшить автоматическое распознавание речи, да и в целом их технологию можно без труда интегрировать в практически любую существующую систему по распознаванию голоса. Люди с боковым амиотрофическим склерозом часто имеют невнятную речь, но существующие системы ИИ обычно обучаются на голосовых данных от тех, кто говорит без каких-либо затруднений. Новый подход позволит значительно улучшить работу подобных алгоритмов. При этом голосовые ассистенты смогут куда лучше распознавать в принципе любую невнятную речь.

Сама система носит название Project Euphonia и для того, чтобы ее обучить, эксперты использовали более 36 часов голосовых аудиозаписей, полученных от 67 человек, страдающих боковым амиотрофическим склерозом. В результате после обучения, Project Euphonia сумел гораздо эффективнее распознавать речь. Если говорить о невнятной речи, то процент узнавания вырос на 62%, а вот в случае с акцентом данные куда скромнее — алгоритм справился «всего» на 35% лучше стандартных программ для распознавания голоса.

Это интересно: Как запретить голосовым ассистентам подслушивать вас.

Стоит заметить, что все тестирование проходило на английском языке, но алгоритм, по словам создателей, легко можно интегрировать и в другие голосовые пакеты. К тому же, сейчас Project Euphonia находится лишь на начальном этапе разработки и нельзя исключать улучшения показателей в будущем. О новейших разработках в этой сфере мы обязательно сообщим вам в нашем новостном Телеграм-канале. Так что рекомендуем подписаться.

Более того, Project Euphonia, наряду с другими похожими проектами Google, нацелен на то, чтобы в ближайшее время сделать Google Ассистент доступным для людей с ограниченными возможностями, поэтому сильно «затягивать» с разработкой поисковый гигант не намерен. Среди других интересных особенностей, которые может получить в будущем голосовой ассистент от Google, числятся Live Relay, функция, которая облегчает телефонные звонки для слабослышащих людей, а также Project Diva, нацеленный на введение функций для невербального общения.

Теги
Лонгриды для вас
Как проверить долги на Госуслугах

Иногда долги появляются неожиданно: забытый штраф, начисление по налогам или после судебного производства. Чтобы не попасть в неприятную ситуацию, например, при выезде за границу или покупке автомобиля, стоит регулярно проверять задолженности.

Читать далее
Google опровергает сообщения о масштабной утечке данных Gmail. Что произошло

На этой неделе множество новостных изданий сообщили о якобы произошедшей утечке более 183 миллионов паролей от аккаунтов Gmail. Однако Google публично опровергла эти заявления, объяснив, что речь идет о недопонимании природы агрегированных баз данных скомпрометированных учетных записей. Кто на самом деле прав и почему Google так решительно отрицает объявления.

Читать далее
Как сделать фото на паспорт дома и без фотоаппарата при помощи Gemini

Фото на паспорт — классическая проблема любого человека. Пожалуй, это актуально во всем мире, но особенно остро стоит вопрос качества фотографий на документы в России. Причины такой несправедливости не поддаются объяснению. Но в наших силах дать вам в руки инструмент, который избавит от ужасов в формате “три на четыре” и походов в фотосалон.

Читать далее
Новости партнеров