В Яндекс.Переводчике появился перевод с китайского и тайского языков

Команда сервиса Яндекс.Перевод сообщила о появлении возможности перевода с двух новых языков – китайского и тайского.

Всего Яндекс.Перевод знает уже 44 языка, и у каждого свои «трудности перевода», которые приходится учитывать разработчикам сервиса. В китайском, например, нет пробелов, и сочетание иероглифов 松鼠 может быть как одним словом, «белка», так и двумя отдельными словами — «сосна» и «мышь». Обычный морфологический подход здесь бессилен, ведь в китайском нет окончаний. Тут на помощь Яндекс.Переводчику приходит статистика — анализируя тексты, машина составляет представление о сочетаемости иероглифов и использует эти знания в переводе.

Статистический подход используется не только при работе с китайским, — технология статистического машинного перевода лежит в основе работы всего сервиса Яндекс.Перевод. Специальный алгоритм обрабатывает огромное количество текстов на разных языках и определяет, какие пары слов и фраз лучше всего соответствуют друг другу.

В случае с обратным переводом, статистический подход похоже не оправдывает себя. При переводе с русского на китайский эта самая белка почему-то переводится как 蛋白质 (что означает «белок», в смысле вещество), а вовсе не сочетанием иероглифов 松鼠 (сонг шу), как положено:

Это надо иметь в виду тем, кто собирается при помощи сервиса писать деловые и личные письма китайским партнерам. Однако, при помощи Яндекс.Перевода можно отлично переводить описание товаров в китайских интернет-магазинах на русский или изучить историю достопримечательностей Таиланда на местных сайтах, перед тем, как ехать в путешествие.

В мобильном приложении Яндекс.Перевод для iOS китайский и тайский языки уже доступны, скоро они появятся и в приложении для Android.

Напомним, последний раз список поддерживаемых сервисом языков был расширен в апреле 2014 года. Тогда он пополнился вьетнамским, индонезийским, малайским и мальтийским. 

Журналист, новостной редактор, работает на сайте с 2009 года. Специализация: интернет-маркетинг, SEO, поисковые системы, обзоры профильных мероприятий, отраслевые новости рунета. Языки: румынский, испанский. Кредо: Арфы нет, возьмите бубен.