Могут ли данные социальных сетей предсказать победителя президентских выборов в США 2020 года? Взгляд на последние тенденции
Опубликовано: 2021-03-02Могут ли данные социальных сетей предсказать исход выборов?
Это ключевой вопрос, который задают многие, и над его расшифровкой из множества доступных пользовательских данных. Но пока нет однозначного ответа, особенно когда речь идет о современной политике США.
Частично это, вероятно, связано со статусом знаменитости президента США Дональда Трампа и тем, как он использовал социальные сети для связи со своими избирателями. Огромный охват Трампа в социальных сетях, похоже, несколько искажает данные - например, предыдущие академические исследования показали, что количество упоминаний является лучшим показателем эффективности кандидата и вероятности победы.
Исследование Dublin City University в 2011 году показало , что объем твит был «самой большой прогностической переменным» в результатах выборов, открытие , которое было отражено в другом исследовании , проведенном в Техническом университете Мюнхена:
«Простое количество твитов отражает предпочтения избирателей и приближается к традиционным избирательным опросам».
Объем твитов, отражающий относительную дискуссию и популярность, был постоянным показателем последующей деятельности кандидата, однако этого не произошло на президентских выборах в США в 2016 году.
В этом случае президент Трамп фактически проиграл общее голосование, несмотря на то, что он был самым упоминаемым кандидатом на социальных платформах.

Президент Трамп все еще мог претендовать на победу через систему коллегии выборщиков, но окончательные результаты показали, что, хотя Трамп доминировал в обсуждениях в социальных сетях, это не отразилось на поведении при голосовании.
Это, как уже отмечалось, может указывать на то, что статус Трампа сдвигает чашу весов с точки зрения прогнозных показателей, поэтому мы не можем с уверенностью сказать, что является отличным индикатором вероятного исхода выборов. Но для контекста рассмотрим некоторые текущие данные и то, как два кандидата в президенты США отслеживают ключевые социальные показатели.
Во-первых, при упоминании - согласно данным аналитической панели Facebook CrowdTangle, Трамп побил Байдена по общему взаимодействию в социальной сети за последние три месяца.

Публикации здесь могут быть наиболее важными - в то время как прямое взаимодействие с вашими сообщениями является хорошим показателем популярности и резонанса сообщений, акции по сути представляют собой распространение сообщений и указывают на то, что люди хотят передать ваши сообщения другим людям в своих собственных сетях.
Охват - ключевая сила социальной сети, и репосты - ключевой элемент этого - и, как вы можете видеть, на этом фронте Трамп наблюдает более чем в 5 раз больше активности на платформе.
Конечно, Трамп также начинает с большей базы - у Трампа 32,5 миллиона подписчиков в Facebook по сравнению с 3,7 миллионами у Байдена. Это может исказить данные, при этом также непонятно, почему люди делятся сообщениями Трампа.
Многие комментарии Трампа, такие как его недавнее заявление о протестах #BlackLivesMatter, были подвергнуты критике, что снова искажает данные. Но при прямом сравнении Трамп явно ведет дискуссию в самой влиятельной социальной сети.
Как сообщает The New York Times, Трамп также получил почти вдвое больше лайков и комментариев в Instagram, чем Байден, за последний месяц, что подчеркивает его присутствие, в чистых показателях объема.
Но в то же время Байден набирает обороты. По данным компании Socialbakers, занимающейся аналитикой социальных сетей, в 2020 году аккаунт Байдена в Twitter значительно вырос :
«В январе 2020 года у Байдена было 2657870 полных взаимодействий, что составляет всего 8,2% от среднемесячного показателя Трампа (60 518 463). Всего через 7 месяцев Байден достиг пика в 32 283 027 полных взаимодействий в августе, что составляет колоссальные 50,34% от среднемесячного показателя Трампа».

Недавний анализ Conviva также показал, что Байден теперь опережает Трампа по вовлеченности в твит.

Таким образом, хотя Байден не находится на том же уровне, что и Трамп с точки зрения общих упоминаний или вовлеченности, данные показывают, что он выиграл в относительном выражении, что, учитывая знаменитость Трампа, может быть показательным.
Возможно, просто невозможно ожидать, что кандидат сможет догнать Трампа по объему, учитывая его доминирование в социальных сетях, и поэтому относительный выигрыш может быть лучшим показателем эффективности. До окончания опроса, конечно, нельзя будет сказать.
Следующий шаг - попытаться понять, как упоминается каждый кандидат.
Используя инструмент аналитики Twitter HappyGrumpy, базовый анализ показывает, что настроения вокруг твитов Трампа на 27% положительные и 38% отрицательные, по сравнению с Байденом, который считает, что 20% положительных и 40% отрицательных. Таким образом, Трамп получает больше положительных отзывов, но разрыв между ними довольно близок.
Это несколько похоже на то, что исследователь Каджал Ядав обнаружила в своем анализе настроений в отношении двух кандидатов, основанном на данных Twitter, еще в августе.

Более конкретная методология Ядава фактически обнаружила обратное - что Байден получает больше положительных отзывов по сравнению с отрицательными. Но в целом разрыв довольно близок, здесь нет ничего определенного и нет явного победителя в общих настроениях.
Ядав также отмечает ограничение в анализе из-за сарказма, который обычно не улавливается автоматизированными системами аналитики:
«Итак, если предложение содержит большое количество положительных слов, таких как« величайший »,« отлично », в отрицательном комментарии, написанном саркастическим тоном. Таким образом, оно определенно классифицирует его как положительное мнение».
Это действительно делает сантименты сложным элементом.
Остается рассмотреть еще один ключевой фактор - рост аудитории и количество подписчиков, ведущих к участию в опросе, что может свидетельствовать об относительной популярности среди избирателей.
Что касается лайков на странице Facebook, то за последние три месяца Байден значительно вырос.

Итак, опять же, прямое сравнение общих цифр не даст особого понимания, учитывая ранее существовавший статус знаменитости Трампа. Но в относительном выражении Байден набирает обороты.
Та же тенденция отражена и в Твиттере - скриншоты с помощью Wayback Machine показывают, что:

По объему, с точки зрения вовлеченности и аудитории, Трамп - безусловно лидер. Но тенденции показывают, что в последний период Байден выигрывает на обоих фронтах в относительном выражении.
Итак, что это означает с точки зрения общего прогноза? Как уже отмечалось, несколько прошлых исследований показали, что один только объем является лучшим предсказателем, но статус Трампа меняет это и может изменить результаты.
Имея это в виду и зная, что прямое сравнение объемов неэффективно, может оказаться, что вам нужно изолированно взглянуть на недавний рост, который показывает, что Байден набирает обороты в отношении участия в Твиттере, подписчиков в Твиттере, лайков в Фейсбуке. Но Трамп по-прежнему доминирует в этой сфере, и его широкое присутствие в социальных сетях дает ему значительные возможности для распространения своих сообщений.
Что является лучшим показателем успеха? Мы не узнаем об этом до начала следующего месяца, но эти тенденции в данных могут дать новое представление о предсказательной способности социальных сетей в отношении результатов выборов.
