BotMaker защищает Twitter от спама

1

Twitter разработал и построил систему борьбы со спамом BotMaker. Система уже обрабатывает миллиарды событий ежедневно, благодаря чему с момента запуска ключевые показатели спама снизились на 40%.

Целью любой анти-спам системы является уменьшение количества видимого спама и отсутствие ложных срабатываний. Спам в Twitter отличается от традиционного спама в других системах: для легкого взаимодействия с платформой Twitter предоставляет разработчикам API, а контент публикуется в режиме реального времени. Это означает, что спамеры узнают почти все системы анти-спама Twitter через API. Кроме того, анти-спам системы должны избегать задержки в видимых пользователю операциях. В более традиционных системах, например, в электронной почте, задержка на десятки секунд остается незамеченной.

Три ключевых принципа Botmaker:

  • Предотвращение создания спама. Усложнение создания спама приводит к уменьшению его видимого количества.
  • Уменьшение времени, в течение которого спам виден на Twitter.
  • Сокращение времени реакции на новые спам-атаки.

Для достижения этих целей BotMaker получает информацию о событиях от распределенных систем в Twitter, проверяет данные в соответствии с набором правил, а затем применяет предусмотренные действия.

Правила BotMaker, называемые ботами, разделяются на две части: условия для принятия решения о реакции на события, а также действия, которые следует предпринять в связи с данным событием. Например, простое правило для запрета публикации твита со спам-гиперссылкой выглядит так:

В результате этого правила BotMaker будет запрещать любые твиты, соответствующие поставленному условию.

Для того, чтобы систему борьбы со спамом могли преодолеть основные записи Twitter (твиты, ретвиты, избранное и подписки), система поддерживает правила, основанные на машинном обучении. Кроме того, инженеры Twitter имеют возможность мгновенно изменять и создавать новые правила.

График показывает снижение количества спама в Twitter на 55% после включения BotMaker. 

BotMaker также значительно снижает время реакции на спам-атаки. До появления системы на внесение изменений требовалось несколько часов или дней, теперь процесс занимает считанные минуты.

Разработчики BotMaker после его запуска увидели снижение характеристик отслеживания спама на 40%.

BotMaker уже используется в Twitter как главный двигатель борьбы со спамом. Кроме того, принципы функционирования BotMaker могут помочь в разработке и реализации систем, отвечающих за управление, поддержку и защиту распределенных систем.

В сентябре 2013 Twitter представил функцию, которая была призвана сократить количество спама и «информационного шума». В категорию Filtered начали попадать сообщения, которые Twitter уже «очистил» от спама при помощи собственного алгоритма.