Разделы статей

Календарь событий


Февраль 2012
Пн Вт Ср Чт Пт Сб Вс
1
01.02.2012
Конференция: All in Top Conf 2012 ( Москва 01.02 - 02.02)
Конкурс: Hi-Fi. Лучший сайт по оценке мировых производителей и ведущих экспертов ( 01.02 - 30.04)
2 3 4 5
6
7
07.02.2012
Конференция: Форум Безопасного Интернета - 2012 ( Москва 07.02 - 07.02)
8 9 10 11 12
13
14
14.02.2012
Конференция: Social Media ( Санкт-Петербург)
15
15.02.2012
Семинар: Привлечение клиентов через интернет ( Москва)
16
16.02.2012
Семинар: Формула сайта: Успешный интернет-магазин от А до Я ( Санкт-Петербург)
Семинар: Мастер-класс по Google Analytics ( Москва 16.02 - 17.02)
18 19
20
20.02.2012
Конференция: SES Лондон  ( 20.02 - 24.02)
21
21.02.2012
Конференция: День интернет-рекламы 2012 ( Санкт-Петербург)
22 23 24
25
25.02.2012
Конференция: UWDC’2012 ( Россия 25.02 - 26.02)
Семинар: SEO-аналитика: ключ к эффективному продвижению ( Киев 25.02 - 25.02)
26
27
28
28.02.2012
Конференция: Search Marketing Expo - SMX West 2012 ( 28.02 - 01.02)
29
 
Март 2012
Пн Вт Ср Чт Пт Сб Вс
1
01.03.2012
Семинар: Бизнес в сети Интернет ( Киев 01.03 - 01.03)
2
02.03.2012
Семинар: Google AdWords для профессионалов ( Киев 02.03 - 02.03)
3 4
5 6 7 8 9 10 11
12
13
13.03.2012
Конференция: i-COMference 2012 ( Москва 13.03 - 14.03)
14 15 16 17 18
19 20 21
22
22.03.2012
Конференция: eTarget-2012.Практика интернет-маркетинга ( Москва 22.03 - 23.03)
23
23.03.2012
Семинар: Действительно продающий текст ( Москва 23.03 - 24.03)
24 25
26 27
28
28.03.2012
Конференция: The Atlantic Systems Guild ( Москва 28.03 - 30.03)
29 30 31
 


SEO Блог

Статьи

Поиск

Как работают поисковые системы

Прислано:03.03.2003 в 23:35

Раздел: Теоретические вопросы


Поисковые системы состоят из пяти отдельных программных компонент:

1. spider (паук): браузероподобная программа, которая скачивает веб-страницы.

2. crawler : «путешествующий» паук, который автоматически идет по всем ссылкам, найденным на странице.

3. indexer (индексатор): «слепая» программа, которая анализирует веб-страницы, скаченные пауками.

4. the database (база данных): хранилище скаченных и обработанных страниц.

5. search engine results engine (система выдачи результатов): извлекает результаты поиска из базы данных.

Spider: Паук – это программа, которая скачивает веб-страницы. Он работает точно как ваш браузер, когды вы соединяетесь с веб-сайтом и загружаете страницу. Паук не имеет никаких визуальных компонент. То же действие (скачивание) вы можете наблюдать, когда просматриваете некоторую страницу и когда выбираете «просмотр HTML-кода» в своем браузере.

Crawler: Как и паук скачивает страницы, он может «раздеть» страницу и найти все ссылки. Это его задача – определять, куда дальше должен идти паук, основываясь на ссылках или исходя из заранее заданного списка адресов.

Indexer: Индексатор разбирает страницу на различные ее части и анализирует их. Элементы типа заголовков страниц, заголовков, ссылок, текста, структурных элементов, элементов BOLD, ITALIC и других стилевых частей страницы вычленяются и анализируются.

Database: База данных – это хранилище всех данных, которые поисковая система скачивает и анализирует. Это часто требует огромных ресурсов.

Search Engine Results Engine: О, самое сердце зверя. Именно система выдачи результатов решает, какие страницы удовлетворяют запросу пользователя. Это та часть поисковой системы, с который вы имеете дело, осуществляя поиск.

Когда пользователь вводит ключевое слово и делает поиск, поисковая система отбирает результаты на основании постоянно меняющихся критериев. Алгоритмом называется метод, по которому она принимает решение. Профессиональные оптимизаторы (SEO) иногда употребляют термин «algos» - это и есть то, о чем мы говорим.

Не смотря на то, что поисковые системы сильно изменились, большинство до сих пор отбирают результаты поиска на основании примерно следующих критериев:

• Title (заголовок): Присутствует ли ключевое слово в заголовке?

• Domain/URL (Домен/адрес): Присутствует ли ключевое слово в имени домена или в адресе страницы?

• Style (стиль): Жирный (STRONG или B), Курсив (EM или I), Заголовки HEAD: если место на странице, где ключевое слово использовано в жирных, курсивных или Hx (H1, H2,…) текстовых заголовках?

• Density (плотность): Как часто ключевое слово употреблено на странице? Количество ключевых слов относительно текста страницы называется плотностью ключевого слова.

• MetaInformation (мета данные): Хотя многие отрицают, некорые поисковые системы до сих пор читают мета ключевые слова (meta keywords) и мета описания (meta description).

• Outbound Links (ссылки наружу): На кого есть ссылки на странице и встречается ли ключевое слово в тесте ссылки?

• Inbound Links (внешние ссылки): Кто еще в Интернет имеет ссылку на данный сайт? Каков текст ссылки? Это называется «внестраничный» критерий, потому что автор страницы не всегда может им управлять.

• Insite Links (ссылки внутри страницы): На какие еще страницы данного сайта содержит ссылки эта страница?

Как видите, поисковой системе необходимо делать множество уточняющих запросов, используя скаченную страницу целиком.

Это сокращенное описания функционирования поисковой системы.

Автор - Бретт Табке.
Перевод - dimok.ru



Новости по теме:

Статьи по теме:

В блогах по теме:

Пресс-релизы по теме:

 

Новости

РЕКЛАМА

Пресс-релизы