Мэтт Каттс раскрыл основные принципы работы поиска Google

На днях в интернете появился видеоролик, в котором главный инженер и руководитель команды Google по борьбе с поисковым спамом Мэтт Каттс (Matt Cutts) ответил на вопрос пользователя, касающийся основных принципов работы поисковой системы. Представителя крупнейшего в мире поисковика попросили разъяснить, как происходит процесс оценки и ранжирования сайта, начиная со сканирования ресурса поисковыми роботами, и, заканчивая присвоением ему позиции в выдаче.

«Существуют 3 ключевые вещи, которые вам придется научиться делать, если вы хотите стать лучшей в мире поисковой системой. Во-первых вы должны уметь всесторонне и глубоко сканировать глобальную сеть; во-вторых — грамотно индексировать страницы; в-третьих — правильно ранжировать ресурсы в выдаче, обеспечивая максимальную релевантность запросу пользователя», — начал свое объяснение Мэтт Каттс.

Согласно, заявлению главного инженера Google, на полное сканирование интернета у Google уходит порядка месяца (30 дней), а в течение следующих двух недель поисковик осуществляет индексацию и последующую обработку данных для присвоения сайтам позиций в выдаче. При этом, Мэтт Каттс сообщил: «Чем выше у страницы Page Rank — тем вероятнее, что поисковые алгоритмы быстрее просканируют сайт. Более того, поисковые роботы регулярно заходят на сайты с высоким PR, поскольку именно оттуда они черпают информацию о появлении новых качественных ресурсов, на которые ссылаются авторитетные сайты».

На следующем этапе производится индексация документов. Данный процесс г-н Каттс показал на простом примере: «Допустим, пользователь вводит в поисковую строку запрос [Katy Perry]. После этого Google приступает к анализу, в каких документах встречается каждое слово в отдельности, а в каких – вместе. Найдя релевантные запросу документы, алгоритмы Google начинают анализировать порядок слов и их употребление в контексте документа. Так, если на странице есть слово [Katy], но отсутствует [Perry] — она не появится в выдаче. Если же в документе упомянуты оба слова – он признается соответствующим запросу».

«Для Google важно найти правильный баланс между соответствием слов, репутацией документа и ссылками, ведущими на эту страницу», — пояснил Мэтт Каттс.

Рассказывая о ранжировании, представитель Google отметил, что для обеспечения данного процесса поисковик давно разработал Page Rank и более 200 ключевых факторов ранжирования.

«Подобная технология работы с сайтами позволяет Google ежедневно предоставлять свежие, релевантные и качественные документы в выдаче для сотен миллионов пользователей по всему миру», — подытожил г-н Каттс.

Узнать о работе Google подробнее можно и приведенного ниже видеоролика:

Редактор-переводчик портала Searchengines.ru, работает на сайте с 2010 года. Специализируется на западном интернет-маркетинге, новостях социальных сетей и поисковых систем. Постоянно принимает участие в профильных семинарах и конференциях в качестве журналиста-обозревателя. Языки: английский, французский.