Растолкованный PageRank, часть 2

Как вы можете обнаружить, какой у страницы вес?

Вы можете скачать тулбар [toolbar, инструментальная линейка — прим. А. С.] для Internet Explorer со страницы http://toolbar.google.com/ 6.
После инсталляции в верхней части Internet Explorer появится столбцовая
диаграмма, дающая интерпретацию веса PageRank для страницы, которую вы
в данный момент смотрите. Если вы задержите курсор мыши над диаграммой,
то увидите число от нуля до десяти. (Если вы не видите числа, возможно,
у вас установлена старая версия тулбара. Как только вы полностью его
деинсталлируете, перезагрузите компьютер и установите последнюю версию,
вы сможете видеть число.)

Насколько точен тулбар Google?

Тулбар Google показывает вес сайта не очень точно, но это
единственный инструмент, который может дать вам прямо сейчас хоть
какое-то представление. Поскольку вы знаете орграничения тулбара, вы,
по меньшей мере, знаете, что вы видите. Есть два ограничения у тулбара
Google:

  1. Временами тулбар определяет вес приблизительно. Если вы
    откроете страницу, которой нет в индексе Google, но есть страница,
    очень близкая к ней в индексе, то тулбар отобразит свое предположение о
    весе PageRank. Эта догадка бесполезна для наших целей, потому что она
    не представлена ни в каких вычислениях PageRank. Единственный способ
    выяснить, использует ли тулбар догадку, это ввести URL в поисковую
    форму Google и увидеть, появится ли страница. Если нет, значит, он
    предполагает!
  2. Тулбар дает только представление реального веса PageRank!
    В то время как вес PageRank линеен, они решили показывать его на
    нелинейной диаграмме. Так, для тулбара, изменение веса PageRank от 2 до
    3 занимает меньше увеличения веса PageRank от 3 до 4. Это лучше всего
    иллюстрируется сравнительной таблицей; настоящие числа хранятся в
    тайне, поэтому мы будем использовать просто любые числа для
    иллюстрации 7:











Если действительный вес PageRank между То тулбар показывает
0,00000001 и 5 1
6 и 25 2
26 и 125 3
126 и 625 4
626 и 3125 5
3126 и 15625 6
15626 и 78125 7
78126 и 390625 8
390626 и 1953125 9
1953126 и бесконечностью 10

Надо надеяться, что вы можете увидеть из этой иллюстрации, сколь ограничена информация, которую вы получаете из тулбара.

С этого момента я собираюсь использовать термин Настоящий PR для
обозначения подлинного веса PageRank, хранимого Google, и Тулбаровский
PR для обозначения довольно скупого представления того, что тулбар
Google позволяет нам видеть.

Расчет PageRank

Объяснив, что такое вес PageRank, т. е., что вы узнаете, когда
получаете информацию о нем, и насколько он важен… в этом разделе я
расскажу вам примерно как он вычисляется. Знать это не обязательно,
однако, если вы поймете это, вы будете лучше понимать, как следует его
применять.

Когда Google был только исследовательским проектом, они [Брин и Пэйдж — прим. А. С.]
написали статью, подробно описывающую формулу, которая определяет вес
PageRank для страницы. Хотя они, возможно, уже не используют в точности
эту формулу, она представляется достаточно корректной для сегодняшних
целей. Вот она:


PR(A) = (1-d) + d (PR(T1)/C(T1) + … + PR(Tn)/C(Tn)),

где PR(A) — это вес PageRank страницы A (тот вес, который мы хотим вычислить),

D — это коэффициент затухания, который обычно установливают равным 0,85,

PR(T1) — вес PageRank страницы, указывающей на страницу A,

C(T1) — число ссылок с этой страницы,

PR(T1)/C(T1) означает, что мы делаем это для каждой страницы, указывающей на страницу A

Жуть! Для тех из вас, кто не является математиком, здесь есть полная
информация по этой формуле — вы не можете просто вычислить вес
PageRank за один прием, как тут. Чтобы вычислить вес PageRank
страницы A вам понадобится знать веса PageRank всех страниц,
указывающих на страницу A. Их веса PageRank будут частично
зависеть от страницы A, указывающей на них, либо каких-то других
страниц, ссылающихся на них. Какая глупая формула. Что она нам говорит,
так это одну очень важную вещь о весе PageRank любой страницы.

Вес PageRank, передаваемый на страницу A со страницы B,
которая указывает на нее, уменьшается с каждой ссылкой куда-нибудь,
которая находится на странице B. Это означает, что вес страницы,
по существу, это мера его голоса; страница может разделить этот голос
между одной, двумя или многими ссылками, но общая голосующая сила будет
всегда той же самой.

Сейчас забудьте формулу на некоторое время, потому что легче
рассмотреть пример реализации, который очень похож на PageRank. Он
должен помочь нам лучше понять PageRank. Назовем его MiniRank.




6 Аналогичную возможность для русскоязычного интернета предоставляет Yandex.Bar.
Яндекс.Бар показывает «взвешенный индекс цитирования» гораздо точнее,
чем это делает Google — данные отображаются с точностью до сотых.
В то же время, показываемое число касается сайта в целом, и не зависит
от веса его конкретной страницы, которая в данный момент загружена в
окне браузера. Маловероятно, чтобы Яндекс
вычислял веса сайтов вместо весов страниц, скорее всего, «взвешенный
ИЦ» означает вес PageRank главной страницы сайта, либо он вычисляется
на основе весов всех страниц сайта.

Еще один источник информации про вес PageRank для русскоязычных сайтов — каталог поисковой системы Апорт. Если сайт присутствует в каталоге, то рядом с его описанием указывается ИЦ главной страницы сайта. [Прим. А. С.]

Назад к тексту

7 Еще
раз подчеркну, эти числа просто придуманы Крисом, для того, чтобы
показать, что такое нелинейное представление тем, кто о нем не знает.
Никакого отношения к реальным весам PageRank они не имеют. [Прим. А. С.]

Назад к тексту

Основатель Searchengines.ru. С 2005 по 2014 год работал генеральным директором компании "Яндекс.Украина". Основатель и директор крупнейшего коворкинга Одессы — "Терминал 42". Ведет блог, участвует в подкастах. Больше ничего не умеет.