Как работают рекомендации YouTube?

Есть ли среди читателей те, кто не посещает YouTube хотя бы один раз в день? Сервис уже стал неотъемлемой частью нашей с вами жизни. Сложно представить, что для просмотра видеороликов мы будем использовать что-то другое. YouTube предлагает огромную базу контента. Всего сервис насчитывает 1,9 млрд активных пользователей каждый месяц. По статистике 79% пользователей Интернета имеют аккаунт на YouTube. Так как же Google удается поддерживать работу такого огромного продукта? В этом материале мы рассмотрим принцип работы алгоритма предложений YouTube, и он интересен, поверьте.

Как работают рекомендации YouTube? Рекомендации YouTube умнее, чем вам кажется. Фото.

Рекомендации YouTube умнее, чем вам кажется

Основываться данный материал будет на официальной публикации Google, в которой объясняется принцип работы алгоритмов рекомендаций YouTube на основе нейросетей. Почему же я решил изучить данный вопрос? Дело в том, что не так давно перед сном я решил включить звуки водопада (белый шум), чтобы быстрее уснуть. На следующий вечер в то же время я заметил, что на самом первом месте в рекомендациях располагалось то самое видео. Я опять включил его. На третий день в то же время это видео опять было на той же самой первой позиции. И это при том, что в любое другое время YouTube мне рекомендует совсем другие видеоролики.

И тут я окончательно понял, что алгоритмы YouTube работают куда сложнее, чем нам кажется. Как минимум, они способны адаптироваться под ваши предпочтения в различное время суток. Тогда же я решил изучить, как работают алгоритмы YouTube и наткнулся на интересную информацию, которой готов поделиться с читателями.

Перед разработчиками YouTube при разработке алгоритма стояло несколько проблем:

  • Огромное количество видеороликов в различной тематике, что усложняет оптимальный подбор в рекомендациях
  • Высокая динамика сервиса. Каждый час на YouTube загружаются сотни-тысячи часов видеороликов. Необходимо, чтобы система рекомендаций была гибкой и динамичной
  • Непостоянность интересов зрителей
  • Оптимизация ресурсов на подбор рекомендаций, так как работа алгоритмов подбора — сложный процесс, требующий немало мощностей

Архитектура рекомендательной системы YouTube

Архитектура рекомендательной системы YouTube. Алгоритм работы рекомендаций YouTube. Фото.

Алгоритм работы рекомендаций YouTube

На вход в систему подаются миллионы видеороликов, а на выходе она предлагает те самые десятки видео, которые попадают пользователю на экран во вкладке «Рекомендации».

Система состоит из двух сверточных нейронных сетей: «candidate generation» и «ranking» (ранжирование). Первая сеть из миллионов видео отбирает сотни наиболее подходящих, вторая нейросеть ранжирует полученную подборку от наиболее до менее интересных пользователю. При составлении выборки система учитывает всю историю пользователя и контекст. Под контекстом понимается, например, время суток, возраст, пол, географическое положение. Также в момент создания выборки происходит A/B тестирование, когда ради эксперимента пользователю показывают различные выборки, если какая-либо из выборок оказывается более просматриваемой, система самообучается и адаптируется под данную выборку.

При оценке выборки учитывается не только время просмотра но и CTR (click through rate) — число пользователей, которые начали просмотр видеоролика по отношению к числу пользователей, кто увидел видео в рекомендациях.

На этапе ранжирования выборка строится по показателю expected watch time, поэтому чем дольше пользователи смотрят видео, тем выше шанс того, что оно попадет в топ рекомендаций. YouTube не основывается только на click through rate, так как видео может быть простым кликбейтом. Целью обучения нейросети ранжирования является предсказание времени просмотра видео.

Итого

Рекомендации YouTube формируются из двух нейросетей. Первая нейросеть отвечает за подбор видео по теме, нейросеть второго уровня среди отобранных отсекает кликбейт и малоинтересные видеоролики с низкой вовлечённостью пользователей. Именно поэтому видеоролики, которые дольше смотрят, чаще лайкают и комментируют попадают на самые первые места в рекомендациях, если соответствуют тематике, которая интересна пользователю. Интересно, не правда? Давайте обсудим данную тему в Телеграм.

Читайте также: В YouTube на Android теперь можно влиять на работу алгоритма подборки видео

Система действительно сложная и я не стану пытаться объяснять сложные термины и полную архитектуру этапов формирования подборки, просто потому, что сам до конца не понимаю как именно она работает, но очевидно, что подбор рекомендаций наравне с поиском Google — сложнейший алгоритм, над которым работают лучшие умы мира.

По материалам konoden

Теги
Лонгриды для вас
Android 17 получила неожиданное кодовое название в честь популярного десерта

На протяжении большей части истории Android Google публично обозначала каждый релиз номером версии и кодовым именем. Традиционно кодовым именем был десерт, такой как Marshmallow, Jelly Bean или Froyo. Эьто было частью культуры, а многие пользователи называли версии операционной системы не цифрой а именно десертом. Однако с выходом Android 10 в 2019 году Google прекратила эту публичную практику, чтобы сделать брендинг более глобально доступным. Правда внутри компании разработчики продолжили «сладкую» традицию. И вот разработчики определились с десертным кодовым именем для Android 17 — и это не то, что можно было предугадать.

Читать далее
Как сделать фото на паспорт дома и без фотоаппарата при помощи Gemini

Фото на паспорт — классическая проблема любого человека. Пожалуй, это актуально во всем мире, но особенно остро стоит вопрос качества фотографий на документы в России. Причины такой несправедливости не поддаются объяснению. Но в наших силах дать вам в руки инструмент, который избавит от ужасов в формате “три на четыре” и походов в фотосалон.

Читать далее
Как WhatsApp и Telegram ответили на блокировку звонков в России

13 августа Роскомнадзор сообщил об ограничении звонков в WhatsApp и Telegram, объявив их «основными голосовыми сервисами, используемыми для обмана и вымогательства денег, вовлечения в диверсионную и террористическую деятельность российских граждан». Теперь при попытке совершить вызов пользователи слышат шипение, бульканье и другие признаки неполадок. Но действительно ли мессенджеры — главное логово вымогателей денег и прочих злоумышленников? На блокировку звонков в Telegram и WhatsApp ответили как представители приложений, так и — внезапно — Центральный банк Российской Федерации.

Читать далее
Новости партнеров