Новый алгоритм Google создаёт оригинальный контент из содержимого сайтов

5973

Google опубликовал научную статью, посвящённую новому алгоритму, который способен брать содержимое разных сайтов и на его основе создавать «логически согласованные» статьи. Генерируя оригинальный контент, новый алгоритм может отвечать на вопросы пользователей, не перенаправляя их на другие сайты.

Как работает новый алгоритм

На первом этапе новый алгоритм обобщает веб-контент, используя алгоритм, который «извлекает» контент сайта, а затем отсекает нерелевантные части – подобно алгоритмам, которые используются для создания готовых ответов (featured snippets).

Результаты, генерируемые с помощью этого алгоритма, в статье называются «извлекаемыми сводками» (Extractive Summaries), поскольку они состоят из контента, извлечённого из веб-страниц.  По сути, эти сводки представляют собой выборку самых важных предложений, имеющих отношение к вопросу пользователя.

На втором этапе новый алгоритм использует ещё один вид алгоритма под названием Abstractive Summary, который является формой перефразирования. Недостатком искусственного перефразирования является тот факт, что практически треть таких сводок содержит фейковые факты.

Согласно статье, исследователи Google нашли способ объединить лучшие стороны обоих подходов. Они используют Extractive Summaries для извлечения самых важных фактов из веб-документов, а затем применяют Abstractive Summary для перефразирования этого контента. В результате получается новый документ, основанный на информации, найденной в интернете. Таким образом Google создаёт собственную версию Wikipedia.

Featured Snippets – это первый шаг

Блоки с ответами – это пример Extractive Summarization, описанного выше. Новый двухфазный алгоритм может применяться для книг, открытых баз данных, а также любых публичных веб-страниц.

В исследовании в качестве поисковых запросов использовались темы из Wikipedia, а в качестве источника «извлекаемых сводок» – результаты поиска Google. Алгоритм затем перефразировал этот контент для создания совершенно новых статей. Алгоритм также проводил параллельный тест, генерируя второй набор статей, используя только ссылки, упоминаемые Wikipedia.

Результаты эксперимента

Подводя итоги, исследователи отмечают, что эксперимент был успешным. Google может создавать свой собственный контент путём обобщения содержимого веб-страниц, тем самым отвечая на вопрос пользователя и не перенаправляя его на другие сайты.

Когда Google начнёт применять этот алгоритм, в статье не уточняется.

Ознакомиться с новой разработкой Google можно здесь: Generating Wikipedia by Summarizing Long Sequences

ИСТОЧНИКSearch Engine Journal
Редактор-переводчик. Специализируется на западном интернет-маркетинге и SEO. Освещает события в этой области с 2014 года.

15
Прокомментировать

avatar
7 Цепочка комментария
8 Ответы по цепочке
0 Последователи
 
Популярнейший комментарий
Цепочка актуального комментария
11 Авторы комментариев
Dmytro YashchenkoАлекс ЛитвиновAndrey AndrievskyAlex YudinСергей Иванов Авторы недавних комментариев
  Подписаться  
новее старее большинство голосов
Уведомление о
Антон Антивойд
Гость
Антон Антивойд

А имеет ли право Гугл использовать таким образом контент, который ему не принадлежит?

kat0d9
Гость
kat0d9

а они кого то спрашивать обязаны ? ведь они «знают», что лучше для пользователя, теперь они определяют что такое «оригинальный контент».
а потом они скажут что интернет это гугл и вам больше ничего другого не нужно.

IsmailovRuslan
Гость
IsmailovRuslan

😀

IsmailovRuslan
Гость
IsmailovRuslan

Тоже интересует, или они будут ставить ссылки на сайты источники?

Сергей Кокшаров
Гость

Disallow: /
Решит проблему 🙂

Алекс Литвинов
Гость
Алекс Литвинов

суровое решение)))

Алекс Литвинов
Гость
Алекс Литвинов

я думаю имеет, т.к текст как я понимаю будет взят не целиком, а частично (коротким обрезком или цитатой) — так что в таком случае допускается использование произведений без разрешения правообладателя и без выплаты вознаграждения)))

Сергей Иванов
Гость
Сергей Иванов

Ну пусть тогда сами гугл овцы и сидят сами и херачат контент, цитаты блин.они релевантную информацию в топ вывести не могут, а тут они сами релевантный генерируемый контент вывести хотят

Алекс Литвинов
Гость
Алекс Литвинов

зачем самим херачить когда есть МЫ))))

Andrew Kuznecov
Гость
Andrew Kuznecov

Дорвей в чистом виде.

Александр Чудинов
Гость
Александр Чудинов

Вот же мудаки

Сергей Иванов
Гость
Сергей Иванов

И ещё, поправьте если я не прав, с финансовой стороны гугл понесёт в такой ситуации убытки? С кмс уйдут партнёрские сайты, тк смысла размещать рекламу на сайте, если твой контент будет дублировать гугл ом и естественно будет вы ше ранжироваться. Поисковая реклама станет намного дороже, тк ЭТО Ж ВЫ БУДЕТЕ в поиске гугла выше САМОГО умного контент гугла, соответственно небольшие интернет магазины уйдут с рынка, останутся гиперы… Значит нужно полностью уходить в соц сети под свою ЦА..

Alex Yudin
Гость
Alex Yudin

Первые шаги в сторону отпадания в надобности создании уникального контента — единственное, что делает информационные сайты полезным.
Последствие первое — вымирание копирайтеров

Andrey Andrievsky
Гость
Andrey Andrievsky

Ну это было понятно давно, они к этому стремятся и об этом мечтают. Но полная монополизация ТОПа Гуглом думаю будет очень и очень не скоро! Все таки рискованно вот так взять и обнаглеть с ходу!

Dmytro Yashchenko
Гость
Dmytro Yashchenko

Та чего в панику разводите. Эти ответы и summary в буржунете уже фиг знает сколько в выдаче и никто там не разорился, там всегда есть ссылка на более развернутый ответ — сайт источник. А вот справочникам действительно не поздоровится.