Google показал, как эволюционировал диалоговый поиск

4

Корпорация Google представила 8-минутный короткометражный документальный фильм Behind the Mic: The Science of Talking With Computers («За микрофоном: Наука разговора с компьютерами»). Видео рассказывает об эволюции диалога человека и машин и тех трудностях, с которыми сталкиваются разработчики при создании алгоритмов изучения языка.

В своей основе диалоговое общение с машинами строиться на основе тех же этапов, по которым развивается речь человека:

  • распознавание речи;
  • изучение языка;
  • формирование нейронных сетей, интерпретирующих язык.

«Мы приходим в этот мир, обладая врождёнными способностями к изучению того, как взаимодействовать с другими живыми существами. Предположим, что вам пришлось бы взаимодействовать с другими людьми путём написания небольших сообщений. Это было бы мучительно. Так мы взаимодействуем с компьютерами. Намного легче с ними разговаривать. Было бы намного легче, если бы компьютер мог понимать, что мы говорим», — рассказал в видео научный сотрудник Google Джеффри Хинтон (Geoffrey Hinton).

Путь к диалогу с машинами на настоящий момент – это история длиной в 62 года. Он начался в 1952 в исследовательском центре Bell Laboratories в США. Там разрабатывали машину, способную распознавать цифры, которые произносил один конкретный человек. Система распознавания речи Харпи (Harpy speech recognition system) Карнеги Мэллона (Carnegie Mellon) и другие математические подходы, например скрытая марковская модель (Hidden Markov model) начали медленный путь к тому, что сейчас понимают под распознаванием речи.

Дальше видео рассказывает о том, как современная технология разделяет речь на фонемы, строительные блоки языка, и как это впечатляющее достижение инженерной мысли представляет всего лишь часть процесса создания реального диалога между человеком и машиной.

Следующий большой шаг – изучение языка, которое по убеждению инженеров Google и учёных будет реализовано в форме нейронных сетей, имитирующих процесс интерпретации языка человеческим мозгом.

Напомним, что, несмотря на десятилетия использования клавиатуры для взаимодействия с компьютерами, недавнее исследование Google показало, что подростки чаще используют голосовой поиск на смартфонах, чем поколение их родителей.

Google активно использует технологии глубокого обучения в своих разработках. Последние несколько лет лидер поиска был занят построением самообучающейся сети, известной как Google Brain. Google Brain – неофициальное название исследовательского проекта Google, посвященного глубокому обучению (Deep Learning). В рамках этого проекта исследователи компании смогли создать примерную модель работы нейронов головного мозга – «нейрональную» самообучающуюся сеть, соединив 16 тыс. процессоров и подключив её к сети Интернет. Полученная система сумела самостоятельно обучиться распознавать образ котов.

Компания также использует технологии глубокого обучения для борьбы со спамом. В сентябре был опубликован патент Google на классификацию поискового спама «Классификация ресурсов с использованием самообучающейся сети» (Classifying Resources Using a Deep Network).