Google внедряет BERT в поиск на русском языке

2220

Google объявил, что самое крупное обновление алгоритмов работы поиска за последние 5 лет – BERT Update – в этом месяце будет внедрено в поиск на русском языке.

BERT – это технология предварительного обучения обработке текста на естественном языке. Она анализирует не отдельные слова, а запросы целиком, позволяя лучше понимать контекст запросов и точнее находить для них ответ. 

Использование моделей BERT позволяет сделать поиск более эффективным для длинных и разговорных запросов, а также запросов с предлогами. В итоге поисковая система способна лучше понимать контекст и показывать соответствующие результаты, а значит пользователи могут вводить более естественные запросы.

Система обработки текста на естественном языке BERT была впервые представлена в 2018 году.

Внедрение BERT в поиск Google на английском языке началось в октябре 2019 года. С этого месяца технология также начнёт работать для поисковых запросов на русском языке.

Статьи по теме:

Редактор-переводчик. Специализируется на западном интернет-маркетинге и SEO. Освещает события в этой области с 2014 года.

2
Прокомментировать

avatar
1 Цепочка комментария
1 Ответы по цепочке
2 Последователи
 
Популярнейший комментарий
Цепочка актуального комментария
2 Авторы комментариев
ВалентинСтас Авторы недавних комментариев
  Подписаться  
новее старее большинство голосов
Уведомление о
Стас
Гость
Стас

Забавно, что в блоге Гугла в качестве примера работы BERT приводится ответ на запрос «Может ли преподаватель выгнать студента с занятия?». И в качестве ответа — текст про школу и учеников, т. е. совсем не про то, про что спрашивали. Спрашивали-то про вузы и студентов, а не про школы. Ответ абсолютно нерелевантный.

А вот у Яндекса ответ релевантный — именно про студентов и пары. Ой, чую я, что переколбас будет к Новому Году по-хлеще всех предыдущих вместе взятых…

Валентин
Гость
Валентин

Это просто калька с разговорного английского, где любой учащийся это студент, вне зависимости от того школа это или универ, или ещё что.
Как они сами и пишут: «Так что мы можем взять модели, обученные на базе английского (который используется в подавляющем большинстве материалов в Интернете), и применить их для других языков.»