Технология синтеза речи Яндекса научилась воспроизводить эмоции

Сегодня мобильное приложение Яндекс.Диктовка для интерактивного написания и редактирования текста голосом появилось в AppStore и Google Play. Его главной задачей является демонстрация части новых возможностей комплекса речевых технологий, над которым работают специалисты Яндекса.

Яндекс уже давно предоставляет бесплатное мобильное API, которое можно использовать, например, для распознавания адресов и голосовых запросов к поиску. За этот год его качество было доведено почти до того же уровня, на котором такие запросы и реплики понимают сами люди. Как итог — появилась модель для распознавания свободной речи на любую тему.

Кроме этого технологии синтеза речи теперь поддерживают эмоции в голосе. В зависимости от выбранного параметра робот может прочитать текст «добрым», «злым», нейтральным и даже «больным» голосом. Синтез речи доступен пользователям облачного сервиса распознавания речи для корпоративных клиентов SpeechKit Cloud, созданного на базе технологии распознавания речи Яндекса SpeechKit. Теперь это первый в мире коммерческий сервис синтеза речи с поддержкой эмоций.

Любая компания может взять технологии распознавания от Яндекса, не тратя несколько лет на разработку собственных. Использование SpeachKit Cloud обойдётся в $5 за 1000 голосовых запросов. Яндекс ориентирует SpeechKit Cloud на клиентов с сотнями тысяч запросов в сутки. Тем, кто не зарабатывает на своем сервисе, а делает мир немного лучше — Яндекс готов предоставлять свои технологии бесплатно.

Обо всем этом, а также о некоторых других возможностях SpeechKit: об активации голосом, автоматической расстановке пунктуационных знаков и распознавании смысловых объектов в тексте — читайте в техноблоге Яндекса.

Напоминаем, облачный сервис распознавания речи SpeechKit Cloud был представлен Яндексом в апреле 2014 года, а мобильное приложение Яндекс.Диктовка было выпущено в конце октября.

Журналист, новостной редактор, работает на сайте с 2009 года. Специализация: интернет-маркетинг, SEO, поисковые системы, обзоры профильных мероприятий, отраслевые новости рунета. Языки: румынский, испанский. Кредо: Арфы нет, возьмите бубен.