Интересный способ заспамить Altavista

Дэнни Салливан в последнем выпуске Search Engine Update описывает многочисленные случаи повышенного ранжирования в результатах поиска страниц сайтов, попавших в базу Альтависты с помощью программы Trusted Feed.

Напомню, что участие в программе Trusted Feed позволяет сайтам еженедельно предоставлять список страниц, снабженных описанием в формате XML, при этом страницы безоговорочно включаются в базу, никак не выделяются в результатах поиска, индексация текста самих страниц не производится. Т.е., поисковик считает такую страницу поступившей из надежного источника и включает ее в базу, используя представленную информацию для ранжирования и вывода описания страницы.

Салливану удалось найти довольно много примеров, подтверждающих его догадку о преимуществах, получаемых такими страницами в результате участия в программе Trusted Feed. Во-первых, это возможность попадания в базу динамически генерируемых страниц. Во-вторых, намного легче экспериментировать с такими страницами - гарантировано еженедельное обновление результатов. Но это лишь очевидные выгоды.

В качестве примера приведены страницы портала Buy.com, встречающиеся в результатах поиска по запросам “saturday night live”, “tape media” и “marine life”. Таких страниц в обычном случае на сайте портала не существует - это результаты поиска самого портала по указанным запросам. При этом пользователь попадает на страницу http://www.buy.com/clickfrom/searchengine.asp?sURL=/retail/searchresults.asp%3Fquerytype=home%26qu=, где после ‘qu=’ следует текст запроса, а тэги title, description, keywords и body содержат однотипный текст+текст запроса. Т.е. страница генерируется динамически, в зависимости от нужного запроса.

Салливан называет эти страницы типичными дорвеями, и, в принципе, он прав. Всем основным признакам дорвея они отвечают.

Представители Altavista, разумеется, отрицают наличие какого-либо преимущества от участия в Trusted Feed. Главный разработчик системы, Ян Педерсен, называет это скорее проблемой поиска, чем злым умыслом. “Это больше отражает наши проблемы со смешиванием этого контента с результатами нормального индексирования, чем политику компании”, - говорит он.

Проблемы смешивания заключаются, например, в определении link popularity для этих страниц. Поскольку они не находятся по ссылкам с других страниц, такой параметр для них рассчитать попросту невозможно. Он определяется на основании аналогичного параметра сайта, где они находятся, с некоторым уменьшением, поскольку речь идет о внутренних страницах сайта.

Впрочем, и сам Салливан не видит ничего особенно плохого в том, что на вершине результатов поиска по коммерческим запросам находятся явно коммерческие страницы. Учитывая, что результаты поиска по тем же запросам в Google довольно похожи на таковые в Альтависте, стоит сделать вывод о реальной ценности таких страниц.

Полная версия статьи доступна подписчикам Search Engine Watch.

Page Rank теперь продают

В условиях постоянного роста популярности поисковой системы Google, как на западе, так и среди русскоязычных пользователей, владельцы сайтов постоянно пытаются повысить Page...

Аккуратно работаем с Индексом Цитирования (ИЦ)

Самый простой способ поднять ИЦ – это обмен ссылками между сайтами. Это должен быть самый первый шаг к повышению ИЦ

Проектирование удобных доменных имен

“URL” (Uniform Resource Locator) в Интернет представляет собой обозначение определенного ресурса (например, страница, сайт или сервер

Как спамить Рамблер. Любителям первых мест посвящается

Занять первое место в результатах поиска по популярному запросу - предел мечтаний любого владельца сайта, знающего о влиянии поисковых систем на посещаемость сайта

Как работают поисковые системы

Поисковые системы состоят из пяти отдельных программных компонент: 1. spider (паук): браузероподобная программа, которая скачивает веб-страницы. 2

Поисковые слова февраля 2003

Searchengines.ru совместно с аналитическим отделом SpyLOG начинает регулярную публикацию результатов статистических исследований Рунета в части поискового траффика...