На днях в интернете появился видеоролик, в котором главный инженер и руководитель команды Google по борьбе с поисковым спамом Мэтт Каттс (Matt Cutts) ответил на вопрос пользователя, касающийся основных принципов работы поисковой системы. Представителя крупнейшего в мире поисковика попросили разъяснить, как происходит процесс оценки и ранжирования сайта, начиная со сканирования ресурса поисковыми роботами, и, заканчивая присвоением ему позиции в выдаче.
«Существуют 3 ключевые вещи, которые вам придется научиться делать, если вы хотите стать лучшей в мире поисковой системой. Во-первых вы должны уметь всесторонне и глубоко сканировать глобальную сеть; во-вторых - грамотно индексировать страницы; в-третьих - правильно ранжировать ресурсы в выдаче, обеспечивая максимальную релевантность запросу пользователя», - начал свое объяснение Мэтт Каттс.
Согласно, заявлению главного инженера Google, на полное сканирование интернета у Google уходит порядка месяца (30 дней), а в течение следующих двух недель поисковик осуществляет индексацию и последующую обработку данных для присвоения сайтам позиций в выдаче. При этом, Мэтт Каттс сообщил: «Чем выше у страницы Page Rank - тем вероятнее, что поисковые алгоритмы быстрее просканируют сайт. Более того, поисковые роботы регулярно заходят на сайты с высоким PR, поскольку именно оттуда они черпают информацию о появлении новых качественных ресурсов, на которые ссылаются авторитетные сайты».
На следующем этапе производится индексация документов. Данный процесс г-н Каттс показал на простом примере: «Допустим, пользователь вводит в поисковую строку запрос [Katy Perry]. После этого Google приступает к анализу, в каких документах встречается каждое слово в отдельности, а в каких – вместе. Найдя релевантные запросу документы, алгоритмы Google начинают анализировать порядок слов и их употребление в контексте документа. Так, если на странице есть слово [Katy], но отсутствует [Perry] - она не появится в выдаче. Если же в документе упомянуты оба слова – он признается соответствующим запросу».
«Для Google важно найти правильный баланс между соответствием слов, репутацией документа и ссылками, ведущими на эту страницу», - пояснил Мэтт Каттс.
Рассказывая о ранжировании, представитель Google отметил, что для обеспечения данного процесса поисковик давно разработал Page Rank и более 200 ключевых факторов ранжирования.
«Подобная технология работы с сайтами позволяет Google ежедневно предоставлять свежие, релевантные и качественные документы в выдаче для сотен миллионов пользователей по всему миру», - подытожил г-н Каттс.
Узнать о работе Google подробнее можно и приведенного ниже видеоролика: