Google сделает Chrome удобным для слепых

Нарушения зрения — ещё не повод отказываться от работы за компьютером. Во-первых, так можно быть наверняка уверенным, что глаза вы уже не испортите. А, во-вторых, вспомогательные инструменты, встроенные в современные операционные системы, позволят без особого труда сориентироваться в незнакомых приложениях. Но если озвучивание названий элементов интерфейса и текста, в общем-то, — вполне обыденная функция и для мобильных, и для настольных устройств, то как быть с описаниями медиафайлов, встречающимися в интернете, не знал почти никто. Но Google нашла, как решить эту проблему.

Google сделает Chrome удобным для слепых. Chrome станет по-настоящему инклюзивным благодаря нейронным сетям. Фото.

Chrome станет по-настоящему инклюзивным благодаря нейронным сетям

Google работает над интеграцией в Chrome поддержки машинного обучения для формирования описаний элементов, которые могут встретиться пользователю. Начать было решено с изображений и фотографий, составляющих значимую часть всего интернет-контента. Но поскольку на них обычно изображается не какой-то конкретный объект, а присутствует ещё и фон, который имеет значение для точного восприятия, обойтись технологией Google Lens, определяющей названия объектов реального мира, было нельзя.

Как работают нейронные сети

Судя по тому, что Chrome умеет уже сейчас, распознавание происходит довольно точно, хоть и не мгновенно. Например, эту фотографию браузер описал как “Фрукты или овощи на прилавке”.

Как работают нейронные сети. Фрукты или овощи на прилавке. Фото.

Фрукты или овощи на прилавке

Понятное дело, что овощей на снимке нет, а кокосы чисто технически всё-таки являются орехами, но, во-первых, алгоритмы оставили себе место для манёвра, использовав союз “или”, а, во-вторых, поняли, что перед ними именно рыночный прилавок, что довольно здорово, хотя под фруктами его практически не видно.

Читайте также: Чёрный экран в Google Chrome? Как исправить

Не ошибся Chrome и здесь. Браузер без труда понял не только то, что перед ним колесо обозрения, но и определил время суток — ночь.

Как работают нейронные сети. Колесо обозрения ночью. Фото.

Колесо обозрения ночью

Пожалуй, было бы не лишним уточнить, что колёс на самом деле два, а место действия является парк, но не будем придираться. В конце концов, пока это тестовая версия технологии, которая в дальнейшем будем только совершенствоваться, обучая саму себя.

Что умеет Google Chrome

Поскольку за определение отвечают нейронные сети, встроить их в Chrome в буквальном смысле было бы проблематично, если не сказать, невозможно. Поэтому разработчики решили проблему встраиванием механизма, который, определив присутствие на экране изображения, отправляет запрос на сервера Google, которые формируют его описание, а затем отправляют его браузеру. Отсюда и задержка в несколько секунд, которая может увеличиваться в зависимости от скорости подключения к интернету, а также от сложности самого изображения. При этом гарантий того, что распознавание вообще произойдёт, нет, поскольку алгоритмы пока могут формулировать описание только нескольких миллионов комбинаций.

Подпишись на наш чат в Telegram. Только там ты сможешь пообщаться с единомышленниками в уютной обстановке.

Что касается инклюзивности, то тут Google ещё очень далеко до Apple, которой нет равных в этой области. Компания из Купертино одной из первых занялась внедрением в свои устройства функций универсального доступа, которые облегчают использование людям с ограниченными возможностями. В результате для управления компьютерами Mac даже не обязательно прикасаться к клавиатуре или мыши, управляя происходящим на экране при помощи голоса или вспомогательных инструментов. Тем не менее, попытки Google сделать что-то полезное для развития концепции универсального доступа заслуживает самой горячей похвалы.

Теги
Лонгриды для вас
Может ли Apple догнать Android производителей. Что она выпустит в ближайшее время

По информации из различных, включая довольно авторитетные, источников, компания Apple планирует запустить несколько новых устройств в 2027 году. Среди них - два новых iPhone, включая складной смартфон и телефон с "преимущественно стеклянным, изогнутым" дизайном. Компания также работает над умными очками и настольным роботом. Про это говорят уже давно и некоторые прогнозы пока не сбылись, но есть много причин, чтобы через два года компания все же представила все эти гаджеты. Вот и давайте разберемся, может ли это повлиять на мир Android, или он будет продолжать развиваться параллельно.

Читать далее
Сооснователь Valve уверен, что лучшими разработчиками станут те, кто не умеет кодить

Гейб Ньюэлл, соучредитель Valve, в беседе с YouTube-каналом Залкара Салиева высказал мнение, что искусственный интеллект способен изменить представление о том, кто может быть эффективным разработчиком. ИИ дает возможность людям без навыков программирования быть столь же, а иногда даже более продуктивными, чем опытные программисты, если они умеют применять современные инструменты.

Читать далее
GPT-5 станет идеальной нейронкой для программистов

OpenAI готовится представить новую модель GPT-5, которая может кардинально изменить подход к программированию и разработке программного обеспечения. Ожидаемый в августе релиз обещает значительные улучшения в области кодинга и логического мышления. Нейросети для программистов есть и сейчас, но совсем скоро у них может появится еще более серьезный инструмент и не абы от кого, а от самой Open AI.

Читать далее
Новости партнеров