Лекция: Работа с поисковыми системами и каталогами. Лингвистический и тематический поиск.

Для поиска информации используются специальные поисковые серверы, которые содержат более или менее полную и постоянно обновляемую информацию о Web-страницах, файлах и других документах, хранящихся на десятках миллионов серверов Интернета.

Различные поисковые сервера могут использовать различные механизмы поиска, хранения и предоставления пользователю информации. Поисковые серверы Интернета можно разделить на две группы:

v поисковые системы общего назначения;

v специализированные поисковые системы.

Современные поисковые системы часто являются информационными порталами, которые предоставляют пользователям не только возможности поиска документов в Интернете, но и доступ к другим информационным ресурсам (новостям, информации о погоде, о валютном курсе, интерактивным географическим картам и так далее).

Всеязычные:

v Google (34,4 % Русскоязычного сегмента [5])

v Bing (0,9 % Русскоязычного сегмента)

v Yahoo! (0,2 % Рунета) и принадлежащие этой компании поисковые машины:

v Inktomi

v AltaVista

v Alltheweb

v Англоязычные и международные:

v AskJeeves (механизм Teoma)

Русскоязычные — большинство «русскоязычных» поисковых систем индексируют и ищут тексты на многих языках — украинском, белорусском, английском и др. Отличаются же они от «всеязычных» систем, индексирующих все документы подряд, тем, что в основном индексируют ресурсы, расположенные в доменных зонах, где доминирует русский язык или другими способами ограничивают своих роботов русскоязычными сайтами.

v Яндекс (46,3 % Рунета)

v Mail.ru (8,9 % Рунета)

v Rambler (3,3 % Рунета)

v Nigma (0,5 % Рунета)

v Генон (0,1 % Рунета)

v Gogo.ru (<0,1 % Рунета)

v Aport (<0,1 % Рунета)

Из перечисленных поисковых систем не все имеют собственный поисковый алгоритм — так QIP.ru используют поисковый механизм Яндекса, а Nigma сочетает в себе как свой алгоритм, так и сборную выдачу от других поисковиков.

еще рефераты
Еще работы по информатике