Лекция: Поисковые системы (search engines)
Ярким представителем поисковых систем является, например, международная AltaVista (www.altavista.com) или российский Rambler (www.rambler.ru).
Поисковые системы состоят из трех основных частей:
- Spider (он же Crawler, он же Bot, он же Robot) — программа, которая посещает веб-страницы, считывает (индексирует) полностью или частично их содержимое и далее следует по ссылкам, найденным на данной странице. Spider возвращается через определенные периоды времени (например, каждый месяц) и индекисрует страницу снова.
- Все, что находит и считывает Spider, попадает в индексы поисковой системы. Индексы системы представляют собой гигантское вместилище информации, где хранятся копии текстовой составляющей всех посещенных и проиндексированных Spider'ом страниц.
- Программа, которая в соответствии с запросом пользователя перебирает индексы поисковой системы в поисках информации, интересующей пользователя, и выдает ему на гора в порядке убывания релевантности найденые документы. Каждая поисковая система имеет своего собственного спайдера, со своими собственными «повадками». Каждая система индексирует страницы своим особым способом, и приоритеты при поиске по индексам тоже отличны. Поэтому, произведя запрос по определенным ключевым словам или выражениям, мы будем иметь разные результаты для каждой из поисковых систем.
еще рефераты
Еще работы по информатике
Реферат по информатике
Поисковые системы
8 Января 2016
Реферат по информатике
Поиск файлов
8 Января 2016
Реферат по информатике
Поиск оптимальных решений задач целочисленного программирования с использованием программных средств excel 7.0
8 Января 2016
Реферат по информатике
Поиск максимального из чисел
8 Января 2016