Яндекс.Переводчик объединил статистический перевод с нейросетью

Яндекс.Переводчик начал использовать гибридную систему перевода. К статистическому переводчику, который использовался до сих пор, добавилась технология перевода на основе нейронной сети. Теперь перевод выполняют обе модели, а затем алгоритм на основе метода машинного обучения CatBoost сравнивает результаты и предлагает лучший.

При переводе нейросеть не разбивает тексты на отдельные слова и фразы — она обрабатывает целые предложения. За счет этого переведенный текст хорошо читается: порой даже можно подумать, что его написал человек. Статистический переводчик так не умеет, зато хорошо запоминает и переводит редкие и сложные слова и фразы. Работая вместе, две системы компенсируют недостатки друг друга.

Чтобы снизить количество грамматических ошибок, Яндекс.Переводчик проводит дополнительную проверку переводов, выполненных нейронной сетью. Они проходят через модель языка — так называется свод знаний о языке перевода, накопленный системой. Если в предложении есть рассогласования, например «папа пошла» или «сильный боль», модель исправит их.

Сейчас гибридная система работает только для переводов с английского на русский. Это самое популярное направление перевода — на него приходится около 80% запросов. Пользователи веб-версии Яндекс.Переводчика могут сравнить результат работы гибридной системы и статистического переводчика и выбрать вариант, который им больше понравится.

Напомним, Яндекс.Переводчик заработал в 2011 году. На старте он мог работать с тремя языками: русским, украинским и английским. Сейчас он знает 94 языка, включая экзотические наподобие коса или папьяменто, и может выполнять переводы между любой парой.
17 августа 2017 года стало известно, что должность руководителя сервиса Яндекс.Переводчик занял бывший менеджер Google Дэвид Талбот.

Оксана Мамчуева
Журналист, новостной редактор, работает на сайте с 2009 года. Специализация: интернет-маркетинг, SEO, поисковые системы, обзоры профильных мероприятий, отраслевые новости рунета.

Прокомментировать

avatar
  Подписаться  
Уведомление о