Сайт 2009: Поиск на сайте

В рамках прошедшей конференции «Сайт 2009» на секции «Современные технологии в сайтостроении» с докладом, посвящённым поиску на сайте, выступил Андрей Калинин (Поисковые технологии, руководитель проекта).

Ситуация с поиском на сайте довольно грустная. Поиска по сайту либо нет, либо он есть, но плохо сортирует или вообще не находит.

Основные задачи поиска на сайте:
— альтернативная навигация;
— доступность архивов сайта;
— увеличение активности посетителей;
— сервис для профессионалов.

Нужен ли поиск на сайте? Для сайта-визитки, имиджевых проектов не нужен. Для корпоративных сайтов он будет полезен. Для ресурсов СМИ — важен. Для контентных проектов поиск на сайте необходимая вещь. А вот для порталов может стать ключевым сервисом.

При выборе движка необходимо обращать внимание на следующие моменты:
1. Самое главное — это ранжирование. Важно определить, какие сайты должны быть выше, какие отранжированы по зоне и по релевантности.
2. Разные форматы документов (все поисковые системы анализируют текстовые документы в формате html, но бывают и другие форматы, например, pdf, word и т.д.).
3. Скорость обновления. Поисковый индекс должен обновляться хотя бы раз в день. Для новостного сайта важно, чтобы время публикации и время попадания в индекс было минимальным.
4. Учет разделов сайта.
5. Подавление дублей навигационной обвязкой. Часто одна новость попадается в разных разделах сайта. Поисковик должен выявлять и группировать такие дубли.
6. Расширение запросов (например, таких, как НДС и т.д.).
7. Качество сниппетов. Хорошая поисковая система должна выделять хороший сниппет, доступный для понимания пользователя.
8. Морфология. На некоторых сайтах используется не один язык. Важно, чтобы поисковая система правильно определяла язык запроса на таких сайтах.

Виды поисковых систем, устанавливаемых на сайт:
— крупные поисковые системы (их недостаток в том, что нет возможности управлять ранжированием);
— поиск, встроенный в CMS;
— средства реляционных СУБД. Это удобно для разработчиков. Но с другой стороны есть недостатки: ограничение на количество документов, все документы должны находиться в базе данных;
— внешний поисковый сервис (например, Google Custom Search). Все данные предоставляются в формате XML. Плохо, что такие поисковые сервисы ходят на сайты снаружи и не могут выделить мета данные, связанные с документом (к примеру, по дате);
— отдельные поисковые продукты. Они сложны в настройках. Поисковые продукты бывают свободные (mnogoSearch, riSearch, Sphinx, Lucene/Nutch) и коммерческие (Яндекс.Сервер, Следопыт (Медиалингва), Поисковая система АиП).

Как оценить качество своего поиска?
— полнота и точность (формальные оценочные параметры);
— отсутствие дублей и навигационного “мусора”;
— время появления нового документа в поисковом индексе;
— сниппеты.

Поисковую систему можно использовать несколько необычными способами:
— перелинковка одного или группы сайтов (например, создать словарь запросов из предметной области сайта, все термины в котором можно использовать для создания ссылок из всех документов на поисковую выдачу по соответствующему запросу);
— организация каталога;
— связанные статьи;
— поиск по чужим сайтам (не надо боятья того, что посетитель покинет сайт, ведь если он ничего не нашёл, то так или иначе покинет этот ресурс).

Инновационные возможности:
— кластеризация результатов поиска, интерфейсные решения (Quintura);
— реферирование документов поисковой выдачи (Девайсик). Показывается краткая выдача;
— инфы (iii.ru).

При выборе поисковой системы для сайта надо ориентироваться на круг решаемых задач и возможности.

Основатель Searchengines.ru. С 2005 по 2014 год работал генеральным директором компании «Яндекс.Украина». Основатель и директор крупнейшего коворкинга Одессы — «Терминал 42». Ведет блог, участвует в подкастах. Больше ничего не умеет.