Семинар Ингмара Вебера «Политическая поляризация в поисковых логах и Твиттере»

0

16 августа в московском офисе компании Яндекс состоялся семинар "Политическая поляризация в поисковых логах и Твиттере". Провел семинар Ингмар Вебер (Ingmar Weber), научный сотрудник исследовательского центра компании Yahoo! Ингмар Вебер работает в междисциплинарной области, существующей на стыке информатики, социологии и политологии. Интернет и его возможности в рамках данного подхода используется как телескоп для изучения общества в целом.

Сегодня широкое распространение получили системы машинного обучения, которые способны оценивать положительные или отрицательные настроения пользователей социальных сетей по отношению к различных событиям политической жизни. Использование таких систем позволяет освободить людей от выполнения таких рутинных задач, как анализ 100 000 твиттов пользователей и попытка выстраивания положительного или отрицательного тренда аудитории.

Спикер представил слушателям семинара, прошедшего в офисе Яндекса 16 августа, результаты исследования политической поляризации интернет-пользователей в США на примере поисковых логов Yahoo! и Twitter. Исследование проводилось с использованием специально разработанного Вебером и его командой сервиса, который позволяет отслеживать тренды в политических запросах и проанализировать настроение и отношение пользователей социальных сетей к тому или иному политическому деятелю или политическому событию. Наибольший интерес для Вебера представляла политическая ситуация в США и отклик аудитории, что весьма актуально в преддверии предстоящих этой осенью выборов президента страны. Анализ пользователей и выстраивание политических трендов производится с помощью разработанного исследователями инструмента Yahoo! Political Search Trends, а также ряда других сервисов, разработанных компанией. Инструмент классифицирует поисковые в соответствии с политическими предпочтениями. Главная страница сервиса Political Search Trends демонстрирует пользователям список политических трендов, имеющих место в поисковых запросах, которые набирали пользователи в течение последней недели. Пользователям доступна аналогичная информация и за другие периоды. На сегодня в рамках анализа учитываются более 1000 наиболее посещаемых политических блогов, различной политической направленности.

Разработанная исследователями система анализа данных позволяет не только анализировать явно положительные и отрицательные высказывания, но и определять настроения в политических хэштегах. Анализ строится следующим образом. Исследователи выделяют лидеров мнения, которые обладают явной политической позицией, правой или левой. В частности, для анализа запросов используются блоги с известными политическими предпочтениями: 387 левых и 644 правых блогов. После анализируются все пользователи Twitter, которые ретвитят сообщения этих лидеров мнения. Исследователи по умолчанию считают, что те, кто ретвитят того или иного политика или блогера, придерживаются аналогичных политических взглядов. Далее анализируются хэштеги, которые используют в своих лентах классифицированные на «правых» и «левых» пользователи Twitter, и на основании этого анализа делается заключение о политической направленности того или иного хэштега. Так, например, исследователям удалось выяснить, что хэштэг #obamacare — преимущественно правый, а хэштег #obamacares — левый. Цель исследования — распознать и объяснить изменения в политической поляризации, когда, например, хэштеги внезапно становятся из правых левыми и наоборот. Обычно, отмечает исследователь, это происходит в результате действий «налетчиков», которые участвуют в «войне хэштэгов».

Если анализ политических настроений в Twitter сложная, но все же решаемая задача, так как все сообщения пользователей, как правило, уже содержат положительную или отрицательную коннотацию, то вот анализ запросов, которые набирают пользователи в поисковиках несколько сложнее. Дело в том, что люди, как правило, набирают несколько слов в поисковой строке, не придавая им положительного или отрицательного значения. Например, пользователи набирают в поиске «президент Обама», но, как правило, из такого запроса сложно сделать вывод о положительном или отрицательном отношении пользователя к политику.Команда исследовательского центра Yahoo! Вместе с Ингмаром Вебером разработала такой инструмент анализа, который позволяет сделать выводы об отношении пользователя к событию, которое он ищет, опираясь на информацию о переходах пользователя по тем или иным ссылкам в результатах поиска. То есть, все сайты, представленные в результатах выдачи, можно классифицировать с зависимости от контента, направленности (правые или левые), других параметров на сайты, которые привлекают положительно настроенных к действующей власти пользователей и ее активных оппонентов. Конечно, классифицировать сами сайты помогают специалисты политологи и социологи, пока еще машина автоматически не может определить эти параметры. То есть, отношение пользователей к тому или иному событию можно оценить на основе набранных в поисковике поисковых запросов, анализируя ресурсы, на которые переходят пользователи.