Лекция: Специализированные поисковые системы.
Справочник Интернет является аналогом тематического указателя в библиотеке: он предоставляет перечень наиболее важных документов (Web-страниц) по заданной теме. Пример такой системы — поисковый сервер Yahoo:
Поисковые системы общего назначения позволяют находить документы во Всемирной паутине по ключевым словам. Принцип, на котором основано большинство таких систем, состоит в том. что специальные программы-роботы автоматически «обходят» WWW-серверы, читают и индексируют все встречающиеся документы, выделяя при этом ключевые слова, относящиеся к данному документу, и запоминая их вместе с URL этого документа в базе данных. Большинство поисковых систем разрешают также автору новой Web-страницы самому внести информацию в базу данных.
Обращаясь к такой поисковой системе, вы вводите одно или несколько ключевых слов, которые, по вашему мнению, могли бы вывести вас на интересующую информацию, и отправляете запрос. Через несколько секунд поисковая система вернет вам список документов (с указанием URL), в которых были найдены указанные вами ключевые слова. Примером такой поисковой системы является Rambler:
http//www. Rambler.ru
Специализированные поисковые системы позволяют вам находить информацию, находящуюся в других информационных «слоях» Интернет, смежных со Всемирной паутиной, например, на FTP-серверах. Примером такой системы является Lycos:
http//ftpsearch.lycos.com
Так как информация в Интернет постоянно меняется (создаются новые документы, удаляются старые и т. д.), поисковые роботы не всегда успевают отследить все эти изменения. Информация, хранящаяся в базе данных поискового сервера, может отличаться от реального состояния Интернет, и поэтому иногда пользователь может получить ссылку на уже не существующий или перемещенный документ.
Интерфейс поисковых систем обычно примерно одинаков. Начальная страница поисковой системы содержит список разделов, уточняющих область поиска, и п о л е поиска. В поле поиска пользователь может ввести ключевые слова для поиска документа, т. е. слова, которые, по мнению пользователя, позволят идентифицировать документ.