Павел Иевлев

Текст

Когда интернет был молод, а термин «социальные сети» еще не родился, каждый пользователь искал себе контент сам. Подписывался на обновления сайтов через RSS, отслеживал посты и комментарии на форумах, сидел в чатах и так далее. Довольно хлопотно, но это была ситуация свободного выбора. С тех пор все изменилось

С тех пор, как интернет пришел к каждому второму человеку планеты и даже вошел в число основных человеческих прав, количество контента возросло до немыслимых величин. И социальные сети, в которых еще недавно можно было прочитать все интересные посты за час, столкнулись с тем, что пользователи не могут увидеть даже пятой части от того, на что подписаны.

Явление Алгоритма Великого

Изначально во всех социалках использовался простой хронологический способ формирования ленты. Пользователь видел обновления аккаунтов и сообществ, на которые он подписан, по порядку и без какой-либо селекции. Однако вскоре исследования пользовательского поведения выявили, что средний подписчик успевает просматривать менее 20 % всех публикаций новостной ленты, а значит, очень многое упускает. Поэтому родилась идея показывать ему не все подряд, а начинать с самого важного.

Первой алгоритмизировала выдачу контента пользователю сеть Facebook. Уже в 2006 году новостная лента этой социалки стала самостоятельно ранжировать новости, а появление в 2007 году кнопки «лайк» сделало это ранжирование диверсифицированным для разных пользователей. Будучи пионером «алгоритмической выдачи», компания собрала максимум негатива и стала объектом наиболее пристальных исследований как самого алгоритма, так и последствий его применения. С тех пор на алгоритмическую выдачу перешли буквально все – с 2014 года функцию «показа популярного» ввел Instagram, в 2016-м на алгоритмы перешли Twitter и «ВКонтакте». В некоторых сетях сохранилась возможность возврата на хронологическую выдачу, в некоторых нет, а в некоторых формально сохранилась, но на самом деле только меняет алгоритм, но не отключает его полностью. Компании оправдывались тем, что пользователю это не нужно – в Twitter, например, заявили, что после введения алгоритмической ленты только 2 % пользователей вернулись в хронологическую.

В результате теперь пользователь видит в своей ленте то, что ему хочет показать социальная сеть, и не видит того, чего она не хочет показывать. Фактически никакого способа повлиять на это у человека нет.

Для чего алгоритм социалке

Рассуждая про социальные сети, всегда надо помнить, что это коммерческие предприятия, имеющие целью в первую очередь заработок. Изменения в алгоритмах, разумеется, делаются в заботе о пользователе, но эта забота имеет определенный уклон – добиться того, чтобы пользователь проводил в этой сети как можно больше времени. Все развитие социальных сетей идет строго по вектору увеличения аддиктивности для пользователей. И они в этом весьма успешны. Аудитория социальных сетей перевалила за отметку в 3,8 миллиарда, соцсети занимают почти половину (46 %) всего экранного времени использования телефонов, 78 % россиян используют интернет преимущественно для социальных сетей. Есть статистически значимый слой пользователей, для которых интернет и есть любимая социальная сеть – они получают в ней новости, играют, смотрят кино, слушают музыку и общаются, вообще не покидая платформу. Этому мы обязаны именно алгоритмам выдачи контента.

Наверняка многие замечали, что, открыв на секунду Facebook, буквально «залипаешь» на ленте и всегда проводишь больше времени, чем собирался. Это не случайно – самообучающийся ИИ, который формирует вашу ленту, постоянно отслеживает реакцию пользователя – на что он смотрел дольше, что проскроллил сразу, какой пост развернул, чтобы прочитать. Это не считая «лайков», которые являются прямой обратной связью с пользователем. С каждым разом ИИ все лучше понимает, что вам нравится, что не нравится, что способно задержать ваше внимание, а что вызовет реакцию отторжения и вы, скорее всего, закроете ленту и вернетесь к работе. Разумеется, Facebook заинтересован в первом исходе, а не во втором – ведь так вы увидите больше рекламы, и он заработает на вас больше денег. Поэтому алгоритм выдает вам те новости, которые должны вызвать у вас максимально эмоциональное вовлечение – спровоцировать выброс дофамина или, наоборот, агрессию, раздражение и желание отреагировать. Хотя сам Facebook отрицает, но такие независимые исследователи, как NewsWhip, в исследовании от 2019 года отмечали, что алгоритм с определенной частотой специально подсовывает провокативный контент, чтобы вызвать негативную реакцию. В определенном, точно рассчитанном порядке чередуя дофаминовый контент с адреналиновым, пользователя вводят в состояние «эмоционального маятника», из которого очень сложно выбраться. Поэтому вовлеченность в Facebook возрастает на 50 % из года в год, а биполярное аффективное расстройство (БАР) стало одним из самых массовых психических отклонений.

Занося руку над клавиатурой для гневного комментария, помните – на вас только что заработал Цукерберг.

Как за нас думает Facebook

Подробности работы алгоритма Facebook строго секретны. Вполне возможно, что этой информацией не владеет во всей полноте ни один человек в мире, потому что ситуация, когда один ИИ пишет алгоритм для другого ИИ – уже норма. Самообучающиеся системы такого уровня сложности в какой-то момент превращаются в «черный ящик» – можно понять, что он делает, но нельзя понять, как и почему. Однако есть люди, кровно заинтересованные в его исследовании – СММ-специалисты. Прежде всего потому, что их основная задача – этот алгоритм обмануть.

Facebook страшно не любит, когда кто-то пытается на нем заработать. Ведь это он должен зарабатывать на пользователях, а не наоборот! Однако маркетологи хотят продвигать свои бренды в соцмедиа и не хотят за это платить. Начинается «борьба брони и снаряда» – сеть старается максимально пессимизировать в выдаче посты, имеющие признаки «продвигающих» (ссылки на внешние ресурсы, упоминания брендов и т. д.), а СММ-щики пытаются это обойти. В результате «инструкции по продвижению» появляются, теряют актуальность, появляются новые… Побочным результатом этого процесса становится понимание, как работают алгоритмы.

Первое – не существует жесткого алгоритма привычного для программистов вида «если-то». Вместо этого используется многоуровневая система машинного обучения и ранжирования. Она не просто реагирует на конкретный пост, а строит прогноз, какие сообщения будут наиболее ценными и значимыми для пользователя в долгосрочной перспективе.

Второе – алгоритм постоянно развивается. В последнее время с развитием самообучающихся программ это стало непрерывным процессом, и завтрашний порядок действий отличается от сегодняшнего, причем неизвестным образом. Однако основные вехи развития можно выстроить.

2006

Появилась лента новостей Facebook.

2007

Появилась кнопка «Нравится».

2009

Введено лайк-ранжирование.

2015

Facebook начать понижать рейтинг некоторых постов (в первую очередь рекламных) и дал пользователю инструмент «Видеть первым».

2016

Появился внутренний маркер «потраченное время» – оценка на основе времени просмотра/прочтения.

2017

Вводится ранжирующий сигнал «скорость завершения» для видео, определяющий, досмотрели ли его до конца, и приоритет эмоций над лайками.

2018

Объявлено о приоритете эмоциональных обсуждений и личных взаимодействий над публичным контентом (от чего маркетологи сначала забегали, заламывая руки, но потом все равно приспособились).

2019

Сделан упор на приоритет контента от друзей, включая тех, с кем пользователь общается в мессенджере (теперь учитывается еще и WhatsApp).

2020

Алгоритм начал самостоятельно оценивать достоверность и качество новостных статей, чтобы «не продвигать дезинформацию», и разрешил пользователям персонализировать рекламу.

После всех этих нововведений архитектура ранжирования выдачи приблизительно следующая:

1. Сбор публикаций-кандидатов, которые могут быть ранжированы для этого пользователя (посты друзей, посты с его упоминанием, паблики, на которые он подписан, публикации, которые были ранжированы в предыдущих сессиях и получили новое комментирование и так далее);

2. Список из пункта 1 оценивается с помощью многозадачных предиктивных нейронных сетей для прогнозирования того, как отреагирует на них конкретный юзер на основании его предыдущих реакций;

3. Оцениваются контекстные функции для разнообразия типов контента, чтобы юзер не заскучал, видя изо дня в день одно и то же;

4. Оцениваются взаимодействия – согласно наблюдаемым склонностям пользователя реагировать на информацию того или иного рода. Источники с более высокой корреляцией получают большую ценность;

5. Самый загадочный момент – вводится некая «поправка на ветер». То есть соответствие образовавшейся выборки теневой политике компании. Facebook отрицает наличие таковой, однако после президентских выборов в США и поддержки BLM им не верит буквально никто.

Что делать пользователю?

Пользователь в отношениях с социальной платформой является не субъектом, а ресурсом. Генератором/потребителем контента и (в первую очередь) монетизированной рекламной базой. Существуют и постоянно возникают новые альтернативные соцсети, однако социологи утверждают, что переход в иную среду крайне болезнен для пользователя из-за невозможности переноса сложившихся социальных взаимодействий. Средний пользователь имеет около 200 сетевых связей внутри платформы, а значит, он должен уговорить двести человек перейти вместе с ним. Единственный массовый исход, зафиксированный в истории социалок – это переток пользовательской массы LiveJournal в Facebook в результате самоубийственной контентной политики владельцев. С тех пор мир поделен между несколькими глобальными и национальными сетями.

Именно поэтому люди, ругающие манипулятивные алгоритмы Facebook, обычно делают это в самом Facebook. Иначе как бы мы об этом узнали?

Использованные источники: