Международный поисковый B2B-портал КОМПАСС
+38 (057) 758-78-30, 759-12-66
office@kompass.ua
www.kompass.ua

Полная версия статьи: http://articles.kompass.ua/publ/41-1-0-167

Что такое поисковые сайты, и что за этим скрывается?

В мире существуют сотни поисковых сайтов, а если считать функции поиска, реализованные в самых разных программах, то счет надо вести на тысячи. И как бы ни был реализован процесс поиска, на какой бы математической модели он не основывался, идеи и программы, реализующих поиск, достаточно просты. Хотя эта простота, относится, по-видимому, к той категории, про которую говорят «просто, но работает». Так или иначе, но именно поисковые сайты стали одним из двух новых чудес света, предоставив Homo Sapiens неограниченный и мгновенный доступ к информации. Первым чудом, очевидно, можно считать Интернет как таковой, с его возможностями всеобщей коммуникации.

Существует распространенное убеждение, что каждое новое поколение программ совершенней предыдущего. Иная крайняя точка зрения состоит в том, что «все новое - это хорошо забытое старое». Думаю, что применительно к поисковым сайтам истина лежит где-то посередине.

Поисковый сайт это веб-сайт, предоставляющий возможность поиска информации в Интернете. Большинство поисковых сайтов ищут информацию на сайтах Всемирной паутины, но существуют также системы, способные искать файлы на ftp-серверах, товары в интернет-магазинах, а также информацию в группах новостей. В последнее время появился новый тип поисковых движков, основанных на технологии RSS, а также среди XML-данных разного типа.

Поисковый сайт состоит из трех основных частей:

Spider (он же Crawler, он же Bot, он же Robot) - программа, которая посещает веб-страницы, считывает (индексирует) полностью или частично их содержимое и далее следует по ссылкам, найденным на данной странице. Spider возвращается через определенные периоды времени (например, каждый месяц) и индекисрует страницу снова.

Все, что находит и считывает Spider, попадает в индексы поискового сайта. Индексы системы представляют собой гигантское вместилище информации, где хранятся копии текстовой составляющей всех посещенных и проиндексированных Spider’ом страниц.

Программа, которая в соответствии с запросом пользователя перебирает индексы поисковика в поисках информации, интересующей пользователя, и выдает ему на гора в порядке убывания релевантности найденые документы. Каждый поисковый сайт имеет своего собственного спайдера, со своими собственными "повадками". Каждая поисковик индексирует страницы своим особым способом, и приоритеты при поиске по индексам тоже отличны. Поэтому, произведя запрос по определенным ключевым словам или выражениям, мы будем иметь разные результаты для каждого из поискового сайта.
Автор: Анна Компасс
Источник: http://articles.kompass.ua


Copyright © 2001-2018 "КОМПАСС Украина". Все права защищены. Использование материалов "Articles.KOMPASS.UA" разрешается при условии ссылки (для интернет-изданий - гиперссылки) на "Articles.KOMPASS.UA".