Слайд 2Общий вид поисковой страницы Яндекса

Слайд 3Определения
Стоп-слова – слова, которые встречаются слишком часто, чтобы быть значимыми для поиска

(местоимения, предлоги и частицы)
Нормальная форма слова – именительный падеж единственного числа
Сниппет – часть текста, отрывки веб-страницы, которая содержит слова поискового запроса, выводящегося поисковиком в результатах поиска
Слайд 4Простой поиск
Одно или несколько слов, введённых в поисковую строку. Примеры:
Подкустовный – 3

028 страниц
Выползень – 30 462 страницы
Подкустовный выползень – 3 015 страниц
Выползень подкустовный – 3 015 страниц
Слайд 5Слова вместе
Несколько слов подряд –в кавычках (с учетом грамматики!):
“подкустовный выползень” – 712

страниц
“подкустовного выползня” -- 1 721 страница
Несколько слов в одном предложении:
подкустовный & выползень – 2 994 страницы
Несколько слов в одном документе:
подкустовный && выползень – 3 015 страниц
это не так по-бурятски – 9 543 стр.
“это не так” по-бурятски – 274 стр. (пятая выдача, в сниппетах)
Слайд 6Расстояние между словами
Расстояние между словами a и b - это разница между

номерами слов b и a (кол-во слов между +1).
Слова на расстоянии в несколько слов:
Выползень кролик-зануда – 1 463 стр. Выползень & кролик-зануда – 1 144 стр. Выползень /3 кролик-зануда – 582 стр.
Слова на расстоянии в несколько предложений (указывается расстояние в предложениях):
выползень &&/3 кролик-зануда – 1 255 стр.
Слайд 7Расстояние между словами и порядок слов
Прямой порядок слов (+) или обратный (-):
Васисуалий

Лоханкин – 71 089 стр.
Васисуалий /+2 Лоханкин – 127 стр.
Васисуалий /-1 Лоханкин – 912 стр.
Лоханкин /+1 Васисуалий – 912 стр.
Васисуалий /(-1 +2) Лоханкин – 66 206 стр.
(Васисуалий /+2 Лоханкин)||(Васисуалий /-1 Лоханкин) – 1 018 стр.
Слайд 8Включение/исключение
Хотя бы одно из указанных слов (в пределах документа):
аэроплан | самолет |

планер | дирижабль | аэростат | вертолет | пепелац – 61 662 601 стр.
аэроплан самолет планер дирижабль аэростат вертолет пепелац – 39 стр.
Слайд 9Включение/исключение
Не выдавать страницы, содержащие данное слово:
выползень – 30 462 стр.
выползень подкустовный –

3 015 стр.
выползень ~~подкустовный – 27 440 стр.
выползень --подкустовный – 27 449 стр.
выползень -подкустовный – 27 423 стр.
Слайд 10Включение/исключение
Слово может встречаться в документе, но не может встречаться в том же

предложении:
депутат Кузькина – 41 390 стр.
депутат Кузькина ~мать – 41 272 стр.
депутат Кузькина –мать – 5 126 стр.
Слово должно встречаться в документе (необходимо для стоп-слов):
Не покупай samsung – 100 648 370 стр., нужных нет
+не покупай samsung – 73 797 388 стр., найдено
Слайд 11Сложные запросы
Мумие – 181 599 стр.
мумие && (лечение | лечебный | болезни)

– 114 692 стр.
мумие && (лечение | лечебный | болезни)~~(цена | прайс | рубли | доллар | фирма | магазин) – 38 963 стр.
Слайд 12Морфология
Поиск точной словоформы:
забор – 10 280 990 стр., в основном заборы, заборов

и т.д
!забор – 3 417 586 стр.
Поиск точной словоформы с исключением совпадающих словоформ другого слова
!!день – документы, содержащие слово «день» как существительное, но не содержащие форму «день» как глагол
Слайд 14Операторы
$title (запрос) – поиск в заголовке:
Максвелл << $title (биография)
url=www.url.ru/cat/* --

поиск на сайте:
"кот Бублик" << url=“www.exler.ru*”
mime="тип_файла“ – поиск файлов указанного типа (HTML, PDF, DOC, PPT, XLS, RTF, SWF)
(инструкция && микроволновая печь) << (mime="pdf" | mime="rtf")
lang="язык“ – поиск страниц, написанных на одном из языков (ru, uk, be, en, fr, de)
geschwisterschaft << lang="de"