Google представляет «Translatotron», технологию прямого перевода вашей речи на другой язык

Понимание и перевод живой речи намного сложнее, чем просто обработка письменного текста, ведь в действительности, в отличие от человеческого мозга, машинам обычно приходится проходить три отдельных этапа для преобразования устной речи с одного языка на другой. Первоначально речь должна быть интерпретирована машиной и расшифрована в текст, который затем будет переведен на нужный язык, прежде чем поступить в механизм преобразования текста в речь для произнесения его вслух. В данный момент компания Google как раз работает над тем, чтобы упростить и ускорить этот процесс, а мы с вами на выходе получили перевод нашей речи с одного языка на другой практически без задержки.

Google представляет «Translatotron», технологию прямого перевода вашей речи на другой язык. Фото.

Описанный выше процесс перевода речи с одного языка на другой, который сейчас используется повсеместно, имеет каскадную структуру, и хотя он понятен для пользователя и относительно быстр, Google решил не стоять на месте и разработать еще более естественный метод преобразования устной речи, который получил название Translatotron. Этот метод, в отличие от старого, не требует промежуточной обработки речи, а поэтому должен работать значительно эффективнее.

Google представляет «Translatotron», технологию прямого перевода вашей речи на другой язык. Фото.

Вообще, перевод устной речи не является чем-то новым, Google уже сделала эту функцию доступной в своем приложении Переводчик с 2011 года и недавно ее также получил фирменный Ассистент, а компания Microsoft, за счёт внедрения этой функции, расширила функциональность Skype, научив его переводить живою речь прямо во время разговора онлайн. Однако, как я уже сказал, эти функции обычно используют метод каскадной обработки данных для исполнения своей функциональности. Так как прямая интерпретация речи лишена промежуточных этапов, она работает быстрее, уменьшает ошибки интерпретации, которые могут возникнуть во время преобразования, и может даже игнорировать слова, которые не нужно переводить. Что также впечатляет, так это то, что Translatotron может сохранять оригинальный голос говорящего на выбранном для перевода языке, делая диалог более естественным.

На самом деле, этот эксперимент все еще находится в стадии разработки, хотя и сейчас уже может похвастаться довольно многообещающими результатами. Например, текущие результаты по-прежнему превосходят традиционные каскадные методы перевода, причем некоторые из них совершенно идентичны настоящей человеческой речи. Стоит признать, что хотя Translatotron и может имитировать оригинальный голос говорящего, он звучит очень робко, неестественно и медленно, что не даёт нам забыть о том, что прямой перевод речи все еще находится на ранней стадии разработки, но он обнадеживает и уже сейчас может облегчить преодоление языковых барьеров для многих пользователей.

Делитесь своим мнением в комментариях под этим материалом и в нашем Telegram-чате.

Теги
Лонгриды для вас
Почему искусственный интеллект убивает настоящее искусство фотографии

Сегодня камеры в мобильных телефонах настолько совершенны, что способны конкурировать с профессиональными цифровыми фотоаппаратами. Несколько объективов, крупные сенсоры, мощная стабилизация изображения и нейро-процессоры — еще недавно все эти опции можно было встретить только у дорогой фототехники. Но несмотря на прогресс, само искусство фотографии, акт осмысленного запечатления момента, не выдерживает гонки со стремительным технологическим развитием камер. Сейчас получить яркое и резкое фото проще простого, однако выразительность и честность снимков часто остаются под вопросом. Почему же между технологиями и искусством все шире становится пропасть?

Читать далее
Специалисты по ИИ массово бегут из Apple к Цукербергу

Современный рынок искусственного интеллекта превратился в настоящее поле битвы за таланты. Компании готовы тратить миллиарды долларов, чтобы заполучить лучших специалистов в области ИИ. Особенно ярко эта тенденция проявляется в противостоянии между Meta* и Apple, где первая компания активно переманивает ключевых экспертов у второй. Это не единичные случаи, что может говорит о наличии у купертиновцев какого-то плана или о том, что они теряют шансы на лидерство в этом направлении.

Читать далее
Как искусственный интеллект лишает людей работы в 2025 году

К середине 2025 года крупнейшие IT-компании США уволили уже около 94 000 сотрудников. Причина не в экономическом кризисе (или не только в нем), а в стремительном внедрении искусственного интеллекта, который меняет саму структуру IT-сферы. Компании массово пересматривают свои кадровые ресурсы, чтобы соответствовать новым реалиям рынка и сосредоточиться на развитии и интеграции ИИ. Что именно происходит, кто увольняет людей и стоит ли уже напрячься сообщает кадровая компания Final Round AI.

Читать далее
Новости партнеров