Google сделает Chrome удобным для слепых

Нарушения зрения — ещё не повод отказываться от работы за компьютером. Во-первых, так можно быть наверняка уверенным, что глаза вы уже не испортите. А, во-вторых, вспомогательные инструменты, встроенные в современные операционные системы, позволят без особого труда сориентироваться в незнакомых приложениях. Но если озвучивание названий элементов интерфейса и текста, в общем-то, — вполне обыденная функция и для мобильных, и для настольных устройств, то как быть с описаниями медиафайлов, встречающимися в интернете, не знал почти никто. Но Google нашла, как решить эту проблему.

Google сделает Chrome удобным для слепых. Chrome станет по-настоящему инклюзивным благодаря нейронным сетям. Фото.

Chrome станет по-настоящему инклюзивным благодаря нейронным сетям

Google работает над интеграцией в Chrome поддержки машинного обучения для формирования описаний элементов, которые могут встретиться пользователю. Начать было решено с изображений и фотографий, составляющих значимую часть всего интернет-контента. Но поскольку на них обычно изображается не какой-то конкретный объект, а присутствует ещё и фон, который имеет значение для точного восприятия, обойтись технологией Google Lens, определяющей названия объектов реального мира, было нельзя.

Как работают нейронные сети

Судя по тому, что Chrome умеет уже сейчас, распознавание происходит довольно точно, хоть и не мгновенно. Например, эту фотографию браузер описал как “Фрукты или овощи на прилавке”.

Как работают нейронные сети. Фрукты или овощи на прилавке. Фото.

Фрукты или овощи на прилавке

Понятное дело, что овощей на снимке нет, а кокосы чисто технически всё-таки являются орехами, но, во-первых, алгоритмы оставили себе место для манёвра, использовав союз “или”, а, во-вторых, поняли, что перед ними именно рыночный прилавок, что довольно здорово, хотя под фруктами его практически не видно.

Читайте также: Чёрный экран в Google Chrome? Как исправить

Не ошибся Chrome и здесь. Браузер без труда понял не только то, что перед ним колесо обозрения, но и определил время суток — ночь.

Как работают нейронные сети. Колесо обозрения ночью. Фото.

Колесо обозрения ночью

Пожалуй, было бы не лишним уточнить, что колёс на самом деле два, а место действия является парк, но не будем придираться. В конце концов, пока это тестовая версия технологии, которая в дальнейшем будем только совершенствоваться, обучая саму себя.

Что умеет Google Chrome

Поскольку за определение отвечают нейронные сети, встроить их в Chrome в буквальном смысле было бы проблематично, если не сказать, невозможно. Поэтому разработчики решили проблему встраиванием механизма, который, определив присутствие на экране изображения, отправляет запрос на сервера Google, которые формируют его описание, а затем отправляют его браузеру. Отсюда и задержка в несколько секунд, которая может увеличиваться в зависимости от скорости подключения к интернету, а также от сложности самого изображения. При этом гарантий того, что распознавание вообще произойдёт, нет, поскольку алгоритмы пока могут формулировать описание только нескольких миллионов комбинаций.

Подпишись на наш чат в Telegram. Только там ты сможешь пообщаться с единомышленниками в уютной обстановке.

Что касается инклюзивности, то тут Google ещё очень далеко до Apple, которой нет равных в этой области. Компания из Купертино одной из первых занялась внедрением в свои устройства функций универсального доступа, которые облегчают использование людям с ограниченными возможностями. В результате для управления компьютерами Mac даже не обязательно прикасаться к клавиатуре или мыши, управляя происходящим на экране при помощи голоса или вспомогательных инструментов. Тем не менее, попытки Google сделать что-то полезное для развития концепции универсального доступа заслуживает самой горячей похвалы.

Теги
Лонгриды для вас
Что умеет новая нейросеть Алиса AI от Яндекса, и как ею пользоваться на Android

В Москве состоялась большая презентация Яндекса, на которой российская компания анонсировала ребрендинг своего искусственного интеллекта и добавление новых фишек. Теперь YandexGPT называется более лаконично Алиса AI, предлагая все те же возможности вкупе с ИИ-агентами — инструментами, позволяющими пользоваться сервисами бренда от такси до бронирования отелей через ИИ. Рассказываем подробно, что умеет нейросеть Алиса AI.

Читать далее
Как включить полезную функцию «Обвести и найти» на Android, и что она даст

В начале 2024 года компания Google анонсировала функцию Circle to Search (в русскоязычной локализации — «Обвести и найти»). Изначально она была доступна на смартфонах Pixel, чуть позже добралась до флагманов Samsung, а сейчас присутствует на устройствах почти всех известных производителей. И, надо сказать, Circle to Search пользуется большой популярностью, ведь это — совершенно новый способ взаимодействия со смартфоном, который не ограничивается одним лишь поиском по фото. Рассказываем, как включить функцию «Обвести и найти» и правильно с ней работать.

Читать далее
Превращаем любую фотографию в реалистичную 3D-модель с помощью нейросетей

Еще недавно компьютеры с трудом обрабатывали готовые фотографии, а теперь они способны буквально штамповать картинки пачками. Что уж говорить про 3D-графику, которую раньше делали только на профессиональных системах, а сейчас десятки бесплатных нейросетей позволяют создавать практически блокбастеры, причем все это в рамках браузера. В том числе сейчас можно превратить любой объект на фотографии в трехмерную модель.

Читать далее
Новости партнеров