Мэтт Каттс раскрыл основные принципы работы поиска Google

На днях в интернете появился видеоролик, в котором главный инженер и руководитель команды Google по борьбе с поисковым спамом Мэтт Каттс (Matt Cutts) ответил на вопрос пользователя, касающийся основных принципов работы поисковой системы. Представителя крупнейшего в мире поисковика попросили разъяснить, как происходит процесс оценки и ранжирования сайта, начиная со сканирования ресурса поисковыми роботами, и, заканчивая присвоением ему позиции в выдаче.

«Существуют 3 ключевые вещи, которые вам придется научиться делать, если вы хотите стать лучшей в мире поисковой системой. Во-первых вы должны уметь всесторонне и глубоко сканировать глобальную сеть; во-вторых - грамотно индексировать страницы; в-третьих - правильно ранжировать ресурсы в выдаче, обеспечивая максимальную релевантность запросу пользователя», - начал свое объяснение Мэтт Каттс.

Согласно, заявлению главного инженера Google, на полное сканирование интернета у Google уходит порядка месяца (30 дней), а в течение следующих двух недель поисковик осуществляет индексацию и последующую обработку данных для присвоения сайтам позиций в выдаче. При этом, Мэтт Каттс сообщил: «Чем выше у страницы Page Rank - тем вероятнее, что поисковые алгоритмы быстрее просканируют сайт. Более того, поисковые роботы регулярно заходят на сайты с высоким PR, поскольку именно оттуда они черпают информацию о появлении новых качественных ресурсов, на которые ссылаются авторитетные сайты».

На следующем этапе производится индексация документов. Данный процесс г-н Каттс показал на простом примере: «Допустим, пользователь вводит в поисковую строку запрос [Katy Perry]. После этого Google приступает к анализу, в каких документах встречается каждое слово в отдельности, а в каких – вместе. Найдя релевантные запросу документы, алгоритмы Google начинают анализировать порядок слов и их употребление в контексте документа. Так, если на странице есть слово [Katy], но отсутствует [Perry] - она не появится в выдаче. Если же в документе упомянуты оба слова – он признается соответствующим запросу».

«Для Google важно найти правильный баланс между соответствием слов, репутацией документа и ссылками, ведущими на эту страницу», - пояснил Мэтт Каттс.

Рассказывая о ранжировании, представитель Google отметил, что для обеспечения данного процесса поисковик давно разработал Page Rank и более 200 ключевых факторов ранжирования.

«Подобная технология работы с сайтами позволяет Google ежедневно предоставлять свежие, релевантные и качественные документы в выдаче для сотен миллионов пользователей по всему миру», - подытожил г-н Каттс.

Узнать о работе Google подробнее можно и приведенного ниже видеоролика:

Вышел трехмерный релиз 2ГИС 3.6

Компания 2ГИС сообщила о выходе майского релиза офлайн-версии справочника для компьютеров, в котором появилось реалистичное 3D-отображение объектов и новая цветовая гамма

РИФ + КИБ 2012: Андрей Калинин «Почему люди меняют поисковик?»

С 18 по 20 апреля в Подмосковном пансионате «Лесные дали» состоялось самое масштабное весеннее мероприятие рунета - конференция «РИФ+КИБ 2012»

Google рассказал о том, как грамотно переместить контент на новый сайт

В официальном блоге Google для вебмастеров, представители крупнейшего в мире поисковика еще раз напомнили оптимизаторам о том, как следует грамотно перемещать контент с одного...

Google Street View запустил виртуальный тур по Израилю

Как сообщают западные СМИ, в минувшее воскресенье, 22 апреля 2012 года, после длительных переговоров с государственными властями Израиля Google включил в свой сервис Street...

Яндекс.Карты представили новую версию API 2.0

Компания Яндекс сообщила о выходе новой версии 2.0 JavaScript API Яндекс.Карт. Поведение карты и внешний вид элементов в новой версии API заметно улучшились

Власти США оштрафовали Google на $25 000 за препятствие расследованию

Как сообщает The New Yourk Times, в субботу, 14 апреля 2012 года, Федеральная комиссия по коммуникациям США (Federal Communications Commission, FCC) приняла решение оштрафовать...