ИИ от Google поможет сделать их голосовой ассистент лучшим на рынке

На сегодняшний день голосовые ассистенты довольно неплохо распознают речь. Но есть одна проблема: как правило, помощники работают хорошо до тех пор, пока они слышат более или менее «правильную» речь. Стоит с ними заговорить с акцентом или же просто невнятно, и от «ума» ассистента не останется и следа. Однако же исследователи лаборатории Google AI, работающие совместно с учеными из Института по изучению бокового амиотрофического склероза (болезни, от которой страдал известный физик Стивен Хокиг), разработали ИИ-систему, которая может распознавать произношение людей с нарушениями речи или акцентом.

Зачем улучшать голосовых ассистентов?

Исследователи из Google говорят, что их подход поможет улучшить автоматическое распознавание речи, да и в целом их технологию можно без труда интегрировать в практически любую существующую систему по распознаванию голоса. Люди с боковым амиотрофическим склерозом часто имеют невнятную речь, но существующие системы ИИ обычно обучаются на голосовых данных от тех, кто говорит без каких-либо затруднений. Новый подход позволит значительно улучшить работу подобных алгоритмов. При этом голосовые ассистенты смогут куда лучше распознавать в принципе любую невнятную речь.

Сама система носит название Project Euphonia и для того, чтобы ее обучить, эксперты использовали более 36 часов голосовых аудиозаписей, полученных от 67 человек, страдающих боковым амиотрофическим склерозом. В результате после обучения, Project Euphonia сумел гораздо эффективнее распознавать речь. Если говорить о невнятной речи, то процент узнавания вырос на 62%, а вот в случае с акцентом данные куда скромнее — алгоритм справился «всего» на 35% лучше стандартных программ для распознавания голоса.

Это интересно: Как запретить голосовым ассистентам подслушивать вас.

Стоит заметить, что все тестирование проходило на английском языке, но алгоритм, по словам создателей, легко можно интегрировать и в другие голосовые пакеты. К тому же, сейчас Project Euphonia находится лишь на начальном этапе разработки и нельзя исключать улучшения показателей в будущем. О новейших разработках в этой сфере мы обязательно сообщим вам в нашем новостном Телеграм-канале. Так что рекомендуем подписаться.

Более того, Project Euphonia, наряду с другими похожими проектами Google, нацелен на то, чтобы в ближайшее время сделать Google Ассистент доступным для людей с ограниченными возможностями, поэтому сильно «затягивать» с разработкой поисковый гигант не намерен. Среди других интересных особенностей, которые может получить в будущем голосовой ассистент от Google, числятся Live Relay, функция, которая облегчает телефонные звонки для слабослышащих людей, а также Project Diva, нацеленный на введение функций для невербального общения.

Теги
Лонгриды для вас
Google Ассистент
Google Ассистент на Android научился зачитывать сообщения в проводных наушниках

Год назад Apple научила Siri зачитывать входящие сообщения, если в момент их поступления к iPhone подключены AirPods. Затем эта функция появилась ещё на нескольких моделях Beats, но левые наушники её поддержку так и не получили. В принципе, это было логично – всё-таки для работы голосового ассистента явно нужно какое-то продвинутое железо, которым «уши» сторонних производителей явно не обладают. Но Google – вот уж от кого не ждали – смогла доказать, что функция зачитывания сообщений поддерживает абсолютно любые наушники. По крайней мере, на Android и в паре с Google Ассистентом.

Читать далее
Android 12
Когда Google выпустит Android 12? Что известно к настоящему моменту

У Google очень необычная методика запуска новых версий Android. Вместо того, чтобы сначала презентовать обновление, затем начать предварительные испытания, а после – выпустить его в релиз, компания действует совершенно иначе. Мало того, что Google перепутала порядок запуска программы бета-тестирования и анонса, так ещё и придумала проводить испытания обновлений Android в два независимых этапа, которые разделяет презентация с объявлением всех предстоящих нововведений. Поэтому запуск первого этапа – это почти всегда неожиданность. Но только не в случае с Android 12.

Читать далее
Как сохранить общение в Google Meet в виде текста

Иногда во время видеоконференции не совсем понятно, что происходит. Особенно, если она уже далеко не первая за этот день. После ее окончания хочется пойти, налить себе чая и снова пересмотреть какие-то моменты. Встречаются и другие ситуации, когда надо зафиксировать чьи-то слова, чтобы была хоть какая-то видимость договоренности. Какая бы не была причина, но запись конференции (естественно, с согласия ее участников) иногда просто необходима. Вот только далеко не всегда это можно сделать. Тем более штатными средствами сервиса. Примером может служить Google Play, который сам по себе очень минималистичен. Но и для него есть сторонний прокачанный способ записать конференцию.

Читать далее
Новый комментарий