Microsoft совершил прорыв в области распознавания речи

1086

Специалисты Microsoft разработали технологию, которая способна распознавать разговорную речь так же хорошо, как человек.

«Мы достигли равенства с человеком. Это революционный результат», — заявил главный научный сотрудник по речевым технологиям Microsoft Сюэ Дун Хуан (Xuedong Huang).

На фото – сотрудники исследовательской группы Speech & Dialog, работавшие над созданием новой технологии.
На фото – сотрудники исследовательской группы Speech & Dialog, работавшие над созданием новой технологии.

Новая система демонстрирует беспрецедентную точность распознавания речи. По данным Microsoft, процент неправильно распознанных слов у неё составляет 5,9%. Примерно такой же результат был получен среди профессиональных транскрибаторов – специалистов, которые занимаются переводом аудио- и видеозаписей в текст.

Система использует нейронные языковые модели, которые группируют похожие слова и делают возможным правильное обобщение. Microsoft планирует использовать эту технологию в Cortana.

Достигнутые результаты впечатляют. Однако компании ещё есть над чем работать. Пока технология используется в условиях ограниченного круга речевых ситуаций и голосов. В реальной жизни они намного разнообразнее. Что касается Cortana, искусственному интеллекту нужно научиться не только распознавать слова, но и понимать их значение и действовать сообразно с этим пониманием.

Напомним, что в начале этого месяца Microsoft объявил о создании нового подразделения Microsoft AI and Research Group. В его рамках компания объединила инженеров и научных сотрудников, которые занимаются разработками в области искусственного интеллекта (ИИ). Группа насчитывает более 5 тысяч человек.

Редактор-переводчик. Специализируется на западном интернет-маркетинге и SEO. Освещает события в этой области с 2014 года.

Прокомментировать

Оставьте первый комментарий!

Notify of
wpDiscuz