Специалисты Microsoft разработали технологию, которая способна распознавать разговорную речь так же хорошо, как человек.
«Мы достигли равенства с человеком. Это революционный результат», - заявил главный научный сотрудник по речевым технологиям Microsoft Сюэ Дун Хуан (Xuedong Huang).[caption id="attachment_36040" align="aligncenter" width="640"] На фото – сотрудники исследовательской группы Speech & Dialog, работавшие над созданием новой технологии.[/caption]
Новая система демонстрирует беспрецедентную точность распознавания речи. По данным Microsoft, процент неправильно распознанных слов у неё составляет 5,9%. Примерно такой же результат был получен среди профессиональных транскрибаторов – специалистов, которые занимаются переводом аудио- и видеозаписей в текст.
Система использует нейронные языковые модели, которые группируют похожие слова и делают возможным правильное обобщение. Microsoft планирует использовать эту технологию в Cortana.
Достигнутые результаты впечатляют. Однако компании ещё есть над чем работать. Пока технология используется в условиях ограниченного круга речевых ситуаций и голосов. В реальной жизни они намного разнообразнее. Что касается Cortana, искусственному интеллекту нужно научиться не только распознавать слова, но и понимать их значение и действовать сообразно с этим пониманием.
Напомним, что в начале этого месяца Microsoft объявил о создании нового подразделения Microsoft AI and Research Group. В его рамках компания объединила инженеров и научных сотрудников, которые занимаются разработками в области искусственного интеллекта (ИИ). Группа насчитывает более 5 тысяч человек.