Слайд 2ФОРМУЛЫ РЕЛЕВАНТНОСТИ
Отдельные функции релевантности:
Москва
Санкт-Петербург + Екатеринбург + 16 городов России релиза «Арзамас+16»:

Новосибирск, Самара, Воронеж и др.
Общероссийская + все остальные города России + Украина + Белоруссия + Казахстан + остальные зарубежные страны + выдача без учета региона (Земля)
Слайд 3ОБЩАЯ ИНФОРМАЦИЯ
Число факторов – 420+ (Ден Расковалов, руководитель отдела качества поиска Яндекса,

апрель 2010, КИБ+РИФ)
В формуле используются комбинированные факторы – мономы (Илья Сегалович, дискуссии на ya.ru и habrahabr.ru: «В данном случае мы нашли ошибку в комбинированном факторе (мономе), сочетающем анализ текста и ссылок, внесли в него исправление…»)
Слайд 4КЛАССИФИКАЦИЯ ФАКТОРОВ
По виду зависимости от запроса
Статические (не зависящие от запроса)
Динамические (зависящие от

запроса)
Запросные (характеристики запроса)
По виду зависимости от документа
Документозависимые
Сайтозависимые
Слайд 5КЛАССИФИКАЦИЯ ФАКТОРОВ
По характеру принимаемых значений
Бинарные
Непрерывные
По источнику
Внутренние
Внешние
Пользовательские (поведенческие)
Запросные

Слайд 6ЗАПРОСНЫЕ ФАКТОРЫ
длина запроса в словах;
язык запроса;
популярность запроса;
коммерциолизированность запроса;
порнографичность запроса
и др.

Слайд 7ВНУТРЕННИЕ ФАКТОРЫ
Текстовые
Свойства документа/сайта
Антиспамовые
Антиспамовые
содержит ли попандеры или кликандеры;
естественность текста;
уникальность контента
и др.

Слайд 8ТЕКСТОВЫЕ ФАКТОРЫ
Зоны документа:
доменное имя;
адрес страницы;
текст документа;
тег title;
элементы оформления текста.
Учет характера вхождений

в текст
точное вхождение;
лемма;
синонимы.
Слайд 9СВОЙСТВА ДОКУМЕНТА/САЙТА
возраст документа (дата первой индексации);
тип документа;
язык документа;
доменная зона;
это важный сайт

(Wikipedia);
это главная страница сайта;
близость тематики документа/сайта и запроса;
совпадение региона выдачи и сайта;
число страниц на сайте;
порнографичность контента
и др.
Слайд 10ССЫЛОЧНЫЕ ФАКТОРЫ
статические (не зависящие от запроса);
динамические (зависящие от запроса).
Ссылочные статические
PageRank;
ТИЦ;
количество ссылок на

документ
и др.
Слайд 11ССЫЛОЧНЫЕ ДИНАМИЧЕСКИЕ ФАКТОРЫ
региональность (совпадение региона выдачи и донора)
тематичность (близость тематик запроса и

донора)
«продажность» ссылок
возраст ссылок
качество ссылок (деление ссылок на «хорошие» и «плохие»)
и др.
Слайд 12ПОЛЬЗОВАТЕЛЬСКИЕ ФАКТОРЫ
посещаемость сайта;
кликабельность документа в выдаче;
поведение пользователя на сайте
и др.
