ВКонтакте создала нейросеть для генерации новостных заголовков

Команда прикладных исследований ВКонтакте разработала нейросеть, которая создаёт новостные заголовки на русском и английском языках. Об этом сообщила пресс-служба компании.

Презентация нейросети состоялась ранее в этом месяце на Европейской конференции по информационному поиску (European Conference On Information Retrieval 2019) в Кёльне.

Заголовок генерируется на основе текста новости. Модель обрабатывает его и формулирует заголовок из фрагментов слов — так она добивается правильных падежей и склонений и в итоге получает связное предложение.

Чтобы создать нейросеть, разработчики использовали архитектуру Universal Transformer и технику компрессии данных BPE (Byte Pair Encoding) — они обычно применяются в машинном переводе и позволяют ограничиться небольшим словарём для генерации заголовков. Для обучения нейросети использовались тексты агентства «РИА Новости» и издания The New York Times.

При этом сотрудники ВКонтакте – первые, кто использовал BPE для модели суммаризации текста, а также первые, кто обучал такую модель на русскоязычных новостных материалах.

Чтобы проверить качество работы модели, разработчики провели отдельное исследование, в котором показывали добровольцам новость и два заголовка к ней. По словам опрошенных, в 45% случаев машинный заголовок был не хуже оригинального, а в 15% — даже лучше.

Даниил Гаврилов, разработчик-исследователь ВКонтакте:

«Наша и другие разработки помогут быстро выделять главную мысль из длинных текстов — это действительно полезно, ведь информации вокруг нас уже много и становится только больше. Использоваться технология может для самых разных задач, связанных с удобством потребления контента — например, ВКонтакте её потенциально можно применить для умного сокращения постов в ленте пользователя или для создания новостных дайджестов».

Подробное описание того, как создавалась эта модель, доступно в статье (на английском языке).

Команда прикладных исследований ВКонтакте была создана в 2018 году. Она занимается исследованиями и разработкой методов машинного обучения и искусственного интеллекта, а также решает широкий спектр задач: от классификации видео до машинного перевода.

preview В России введена идентификация пользователей мессенджеров по номеру телефона

В России введена идентификация пользователей мессенджеров по номеру телефона

С 5 мая в России вступили в силу новые правила идентификации пользователей мессенджеров...
preview F8 2019: редизайн Facebook, Messenger для десктопов и другие анонсы

F8 2019: редизайн Facebook, Messenger для десктопов и другие анонсы

В Сан-Франциско прошла очередная ежегодная конференция Facebook для разработчиков F8. В рамках мероприятия компания традиционно представила ряд нововведений в своих сервисах
preview Google позволит автоматически удалять историю местоположений и поиска

Google позволит автоматически удалять историю местоположений и поиска

Google готовит к запуску новую настройку, которая позволит пользователям автоматически удалять историю местоположений и веб-поиска...
preview С файлами Google Docs теперь можно работать в офлайн-режиме

С файлами Google Docs теперь можно работать в офлайн-режиме

Google запустил офлайн-режим для работы с файлами Google Документов, Таблиц и Презентаций на Google Диске
preview СМИ: Mail.ru Group планирует запустить голосового помощника этим летом

СМИ: Mail.ru Group планирует запустить голосового помощника этим летом

Mail.ru Group планирует запустить собственного голосового помощника «Маруся» в конце июня-начале июля...
preview Одноклассники открыли вертикальные видео для пользователей и рекламодателей

Одноклассники открыли вертикальные видео для пользователей и рекламодателей

Одноклассники открыли для пользователей и рекламодателей новый формат видеоконтента — вертикальные ролики