Реферат: Язык запросов русскоязычных поисковых систем

<span Arial Black",«sans-serif»">МОУКоробовская  СОШ

<span Arial",«sans-serif»">Управленияобразования Администрации Шатурского района

<span Arial",«sans-serif»">Московской области

<span Arial Black",«sans-serif»">РЕФЕРАТ

ПО ТЕМЕ

ЯЗЫК ЗАПРОСОВ

РУССКОЯЗЫЧНЫХ

ПОИСКОВЫХ

СИСТЕМ

<img src="/cache/referats/19881/image002.gif" v:shapes="_x0000_i1025">

Реферат подготовила

 ученица 11 класса

Зимина Марина

Преподаватель информатики

Киселёв Владимир Николаевич

2005 год

<span Times New Roman",«serif»;mso-fareast-font-family: «Times New Roman»;mso-ansi-language:RU;mso-fareast-language:RU;mso-bidi-language: AR-SA">
Введение.

Припроведении поиска информации в службе www,когда тема задана достаточно широко, целесообразно использовать поисковыекаталоги и поисковые указатели. Знание основных понятий и терминов позволяетпровести углубленный поиск с применением ключевых слов, наиболее точно характеризующихискомую тему. При этом следует различать приемы простого, расширенного иконтекстного поиска.

·<span Times New Roman"">       

Под простымпоиском понимается поиск Web-ресурсов поключевому слову. Недостаток этого вида поиска заключается в том, что обычно онвыдает слишком много документов, причем наряду с ценной информацией попадаетсямного «мусора».

·<span Times New Roman"">       

При использованиирасширенного поиска ключевые слова связываются между собою операторамилогических отношений(так называемый язык запросов). При помощи логическихотношений поисковое задание формулируется так, чтобы более точно детализироватьзадание и ограничить область отбора.

·<span Times New Roman"">       

Контекстный поиск– это поиск по точной фразе. К сожалению доступен не во всех поисковых системах.К тому же эта операции достаточно медленная.

Язык запросов– язык манипулирования данными, позволяющий описыватьусловия поиска информации, не задавая для этого последовательность действий,нужных для получения ответа.

Порядок действийлогических операторов: сначала выполняются действия вскобках ( ), потом операторы AND, NOTилишь потом OR.

Вразных поисковых системах используются различные приемы связывания между собойключевых слов при помощи логических операторов. В дальнейшем будут приведеныправила построения запросов в трех наиболее распространенных русскоязычных системах.

<span Times New Roman",«serif»;mso-fareast-font-family: «Times New Roman»;mso-ansi-language:RU;mso-fareast-language:RU;mso-bidi-language: AR-SA">
Язык запросов в поисковой системе РАМБЛЕР [1]

Написано

Результат поиска

Примечания и примеры

идти

Все формы по правилам

русского языка

найдётся идти, идёт, шёл,

шла и т.д.

Регистр (shift)

Если подряд идёт не менее

чем два, три или четыре

слова с большой буквы, то

будет производиться только

по имени собственному

ДОМ и дом, nOt и Not

воспринимаются

одинаково

слово1 пробел слово 2

слово 1 & слово 2

слово 1 ANDслово 2

Будут найдены все документы,

где в одном предложении есть оба слова

машина самолёт

машина & самолёт

машина AND самолёт

Слово 1 or слово 2

Слово 1 | слово 2

Будут найдены документы,

содержащие или одно слово, или другое

самолёт or аэродром

самолет | аэродром

Слово 1 not слово 2

Слово 1! слово 2

Будут найдены документы,

содержащие первое слово,

но без второго

машина not самолёт

машина! самолёт

" "

Слова, заключенные в двойные кавычки,

ищутся в документах

именно в том порядке и

 в тех формах, в

которых они указаны

в запросе<span Times New Roman";mso-hansi-font-family:«Times New Roman»; mso-char-type:symbol;mso-symbol-font-family:Symbol">*

самолёт «заправился» посадка

не будет найдено: самолёт

совершил посадку, чтобы

заправиться

(X,Y)

Будут найдены документы, в

которых расстояние между

словами не более Х слов

(2, красная армия)

между словами не стоит ни

одного слова, поскольку лишь в

случае непосредственного их

соседства разница в порядковых

номерах слов меньше 2,

по умолчанию максимальное

расстояние – 40 слов

<span Times New Roman",«serif»;mso-fareast-font-family:«Times New Roman»; mso-ansi-language:RU;mso-fareast-language:RU;mso-bidi-language:AR-SA">

Таблица «Язык запросов  впоисковой системе Рамблер  (окончание)<span Arial",«sans-serif»">

Написано

Результат поиска

Примечания и примеры

( )

Сначала слова группируются по

операторам AND и NOT, и лишь

потом по операторам OR

машина (самолёт | аэродром)

машина и одно из слов самолёт

или аэродром

${counter =ID}

Будут найдены страницы, на

которых размещены счетчики

Top100, TopShop, TopList,

SpyLog, HotLog

сounter – это название

счетчика, а ID – это

номер счетчика

${top100 =193680}- это

открытки

Оформление запросов в поисковой системе Яндекс [2]

Написано

Результат поиска

Примечания и примеры

идти

Все формы по правилам

русского языка

найдётся идти, идёт, шёл,

шла и т.д.

Путина

путина

Если вы набрали слово с большой буквы, будут найдены только слова с большой буквы, в противном случае будут найдены как слова с большой, так и с маленькой буквы

по запросу ‘путина’ найдется и президент, и сезон интенсивного рыболовства. А по запросу ‘Путина’ – президент и те случаи рыболовного сезона, когда он написан с большой буквы.

слово 1 && слово 2

слово 1 <span Times New Roman";mso-hansi-font-family: «Times New Roman»;mso-char-type:symbol;mso-symbol-font-family:Symbol">&

слово 2

+слово 1 +слово 2

Будут найдены документы, в которых есть оба слова

лечебная <span Times New Roman";mso-hansi-font-family: «Times New Roman»;mso-char-type:symbol;mso-symbol-font-family:Symbol">&

физкультура

+лечебная +физкультура

одинарный оператор ищет в пределах предложения, двойной – в пределах документа

слово 1 ~~ слово 2

слово 1 ~ слово 2

слово 1 –слово 2

Будут найдены документы с первым словом, но без второго

руководство VisualC ~~ цена

рак -гороскоп

одинарный оператор ищет в пределах предложения, двойной – в пределах документа

именно знак минус, а не тире и не дефис через пробел от предыдущего и слитно с последующим словом

слово 1 пробел слово 2 пробел слово 3

Будет найдено много документов с этими словами

частные объявления продажа

 велосипедов

несколько слов, разделённые пробелами, означают, что все они должны входить в одно предложение искомого документа

слово 1 | слово 2

Будут найдены документы либо с первым словом,   либо со вторым

фото | фотография

Таблица «Оформление запросов в поисковой системе «Яндекс» (продолжение)

" "

Будут найдены документы, в которых слова, заключенные в кавычки, идут подряд

«красная шапочка»

контекст «а шапочка у неё была красная» найден не будет

! слово

Будут найдены документы, содержащие это слово

! Лужкову

слово 1 /число слово 2

Будут найдены документы, в которых первое слово находится на расстоянии заданного числа от второго

поставщики /2 кофе

найдутся «поставщики колумбийского кофе», «поставщики кофе из Колумбии» и т.д.

слово 1 /(+n –n)

 слово 2

Будут найдены документы, в которых известны расстояния между словами

+n – это минимальное число слов, а –n – максимальное

музыкальное /(-2 4) образование

музыкальное должно находиться от образования в интервале от 2 слов слева до 4 слов справа

если знаки ограничения стоят после двойных операторов, то употреблённые там числа – это расстояние не в словах, а в            предложениях

 $title X

Будут найдены документы с заголовком Х

$titleCompTek

ищет в заголовках документов  слово CompTek

$anchor (X | Y)

Будут найдены документы, в ссылках которых есть одно из слов Х или Y

$anchor (Comp Tek | Dialogic)

#url="www.X.ru"

Ограничить поиск информации сервером Х

Comp Tek

#url=www.comptek.ru

упоминание компании CompTekна сервере www.comptek.ru и в адресах начинающихся с данной последовательности символов

#linkl="http://www.x.ru/*"

Будут найдены документы, содержащие ссылки на определённые URL

#linkl=www.comptek.ru*

найдутся документы, которые сослались на сервер компании

#image="X*"

Будут найдены документы, содержащие ссылки на документы с изображениями Х

#image="tort*"

найдутся ссылки на документы с изображением тортов

возможно, найдётся и портрет черепахи Тортиллы

#hint=(X)

Будут найдены документы, содержащие изображение с подписью Х

#hint=(кино)

документы, содержащие изображение с подписью кино

Таблица. «Оформление запросов в поисковой системе Яндекс» (окончание)

#keywords=(X Y Z)

#abstrakt=(X Y Z)

Будут найдены документы по ключевым словам и аннотациям XYZ

keywords – краткое описание содержания страницы. Эта служебная информация и она не видима на странице

Х < — Y

Будут найдены документы, содержащие слова Х и Y, при этом будут выданы первыми документы, содержащие слово  Y

компьютер < — телефон

первыми будут выданы документы, содержащие слово телефон

Оформление запросов в поисковой системе Апорт[3]

Написано

Результат поиска

Примечания и примеры

идти

Все формы по правилам

русского языка

найдётся идти, идёт, шёл,

шла и т.д.

Регистр(shift)

Если вы набрали слово с большой буквы, будут найдены только слова с большой буквы

красная площадь

слово 1 AND слово 2

слово 1 + слово 2

слово 1 и слово 2

слово 1 & слово 2

Будут найдены документы, в которых есть оба слова

лечебная <span Times New Roman";mso-hansi-font-family: «Times New Roman»;mso-char-type:symbol;mso-symbol-font-family:Symbol">&

физкультура

лечебная и физкультура

лечебная + физкультура

лечебная AND физкультура

слово 1оr слово 2

слово 1│ слово 2

слово 1 или слово 2

Будут найдены документы, содержащие любое из указанных слов или оба слова одновременно

фото | фотография

слово 1 не слово 2

слово 1 not слово 2

слово 1 — слово 2

Будут найдены документы с первым словом, но без второго

рак — гороскоп

рак не гороскоп

рак not гороскоп

””

Будут найдены документы с данными словосочетанием или близкое к нему

”яблоки на снегу”

будут найдены ”яблоки на снегу”, ”яблоки и снег”, ”яблокам под снегом”, ”яблоко снег”

слХ(слова)

сХ(слова)

wX(слова)

[Х, слова]

Будут найдены документы, где между словами стоит не более двух других слов

сл5(папа мама сын)

между словами ”папа”, ”мама” и ”сын” стоит не более двух других слов, т.е. общее число слов во фрагменте не более 5

Таблица «Оформление запросов в поисковой системе Апорт» (продолжение)

url:

url=

Ограничение поиска одним или несколькими серверами, или даже частью сервера

url=www.intel.ru

документы, на сервере www.intel.ru. В случайном порядке

url=www.intel.ru & soft & условия

все документы, сервера www.intel.ru, содержащие слова ”soft” и ”условия”

url=www.intel.ru/soft/*

все документы, на сервере www.intel.ru в каталоге soft и его подкаталогах

url=*.agama.com

все документы, на серверах www.agama.com, russia.agama.com и т.д.

дата:

дата=

date=

date:

Поиск по датам

папа дата=01/01/97-01/02/97

документы, содержащие слово папа, и имеющие дату от 1 января 1997 года до 1 февраля 1997 года

date=<st1:date Year=«1997» Day=«1» Month=«1» w:st=«on»>01/01/97</st1:date> папа

документы, содержащие слово папа, и имеющие дату 1 января 1997 года

дата:<01/02/97 папа

дата:-01/02/97 папа

все документы, содержащие слово папа, и имеющие дату не позже 1 февраля 1997 года

title=

t=

title( )

заг=

з=

Поиск в заголовках

title(папа │мама)

будут найдены документы, содержащие в заголовке слово папа или слово мама, или оба одновременно

перед круглыми скоками знак равенства можно опустить

keywords=

kw=

клсл=

кл=

Поиск в поле МЕТА KEYWORDS

kw(папа мама)

будут найдены документы, для которых автор в ключевых словах указал оба слова: папа и мама

Таблица «Оформление запросов в поисковой системе Апорт» (окончание)

alt=

a=

рис=

р=

Поиск в комментариях к картинкам

alt=(Билл Гейтс)

документы, в которых есть картинка с комментарием, содержащим как минимум два слова: Билл и Гейтс

anchor=

Поиск в тексте ссылок

anchor=(ненавижу Интернет)

документы, в тексте ссылок на которые, встречаются оба слова: ненавидеть и Интернет

description=

Поиск в тексте описаний сайтов и в поле DESRIPTION

description=(”уксусная кислота”)

будут найдены корневые документы сайтов, в тексте описаний которых встречается словосочетание уксусная кислота

text=(оглавление или содержание)

x=(оглавление или содержание)

текст=(оглавление или содержание)

т=(оглавление или содержание)

Поиск в обычном тексте.

Будут найдены документы, в которых любое из указанных слов встречается в пределах основного текста документа

текст=(Последний звонок)

*

Произвольное число любых букв

зелен*

найдутся: зеленка, зелень, зеленый, Зеленоград

! слово

Будут найдены документы, содержащие это слово

! Лужкову

Литература

1. http://www.rambler.ru/doc

2. www.yandex.ru/info/syntax

3.http://www.glossary.ru

<span Arial",«sans-serif»">Содержание

<span Arial",«sans-serif»;mso-ansi-language: EN-US">

<span Arial",«sans-serif»"> TOC o «1-1» h z u

Введение.PAGEREF _Toc104026457 h 2

Языкзапросов в поисковой системе РАМБЛЕР.PAGEREF _Toc104026458 h 3

Оформлениезапросов в поисковой системе Яндекс… PAGEREF _Toc104026459 h 4

Оформлениезапросов в поисковой системе Апорт… PAGEREF _Toc104026460 h 6

Литература……………………………………………………………………………………………………….PAGEREF _Toc104026461 h 8<span Arial",«sans-serif»">

<span Arial",«sans-serif»">
еще рефераты
Еще работы по программному обеспечению