Интересный способ заспамить Altavista

Дэнни Салливан в последнем выпуске Search Engine Update описывает многочисленные случаи повышенного ранжирования в результатах поиска страниц сайтов, попавших в базу Альтависты с помощью программы Trusted Feed.

Напомню, что участие в программе Trusted Feed позволяет сайтам еженедельно предоставлять список страниц, снабженных описанием в формате XML, при этом страницы безоговорочно включаются в базу, никак не выделяются в результатах поиска, индексация текста самих страниц не производится. Т.е., поисковик считает такую страницу поступившей из надежного источника и включает ее в базу, используя представленную информацию для ранжирования и вывода описания страницы.

Салливану удалось найти довольно много примеров, подтверждающих его догадку о преимуществах, получаемых такими страницами в результате участия в программе Trusted Feed. Во-первых, это возможность попадания в базу динамически генерируемых страниц. Во-вторых, намного легче экспериментировать с такими страницами — гарантировано еженедельное обновление результатов. Но это лишь очевидные выгоды.

В качестве примера приведены страницы портала Buy.com, встречающиеся в результатах поиска по запросам “saturday night live”, “tape media” и “marine life”. Таких страниц в обычном случае на сайте портала не существует — это результаты поиска самого портала по указанным запросам. При этом пользователь попадает на страницу http://www.buy.com/clickfrom/searchengine.asp?sURL=/retail/searchresults.asp%3Fquerytype=home%26qu=, где после ‘qu=’ следует текст запроса, а тэги title, description, keywords и body содержат однотипный текст+текст запроса. Т.е. страница генерируется динамически, в зависимости от нужного запроса.

Салливан называет эти страницы типичными дорвеями, и, в принципе, он прав. Всем основным признакам дорвея они отвечают.

Представители Altavista, разумеется, отрицают наличие какого-либо преимущества от участия в Trusted Feed. Главный разработчик системы, Ян Педерсен, называет это скорее проблемой поиска, чем злым умыслом. “Это больше отражает наши проблемы со смешиванием этого контента с результатами нормального индексирования, чем политику компании”, — говорит он.

Проблемы смешивания заключаются, например, в определении link popularity для этих страниц. Поскольку они не находятся по ссылкам с других страниц, такой параметр для них рассчитать попросту невозможно. Он определяется на основании аналогичного параметра сайта, где они находятся, с некоторым уменьшением, поскольку речь идет о внутренних страницах сайта.

Впрочем, и сам Салливан не видит ничего особенно плохого в том, что на вершине результатов поиска по коммерческим запросам находятся явно коммерческие страницы. Учитывая, что результаты поиска по тем же запросам в Google довольно похожи на таковые в Альтависте, стоит сделать вывод о реальной ценности таких страниц.

Полная версия статьи доступна подписчикам Search Engine Watch.

Основатель Searchengines.ru. С 2005 по 2014 год работал генеральным директором компании "Яндекс.Украина". Основатель и директор крупнейшего коворкинга Одессы — "Терминал 42". Ведет блог, участвует в подкастах. Больше ничего не умеет.