Содержание
- 2. ТЕКУЩИЙ АЛГОРИТМ. МАШИННОЕ ОБУЧЕНИЕ Обучающие данные Набор запросов q(i) Набор документов dj(i) для каждого запроса q(i)
- 3. ФАКТОРЫ РАНЖИРОВАНИЯ Набор факторов ранжирования F = (f1(q,d) , …, fN(q,d)) Конкурс «Интернет-математика – 2009»: N=245
- 4. ПРИМЕРЫ ФАКТОРОВ РАНЖИРОВАНИЯ Запросные длина документа в словах; язык запроса. Текстовые наличие точного вхождения запроса в
- 5. ПРИМЕРЫ ФАКТОРОВ РАНЖИРОВАНИЯ Ссылочные PageRank; логарифм количества ссылок на документ; процент ссылок на документ, содержащих точное
- 6. ФУНКЦИЯ РЕЛЕВАНТНОСТИ Числовое соответствие документа запросу Fr(q, d) = Fr(F(q,d)) = Fr(f1(q,d), …, fN(q,d)) Построение функции
- 7. СХЕМА ОБУЧАЮЩЕГО АЛГОРИТМА Обучающие данные (q(i), dj(i)), i=1,…,n; j=1,…m(n). Определение значений факторов Асессоры Обучающий алгоритм Ранжирующий
- 8. РЕГИОНАЛЬНЫЕ ФОРМУЛЫ Отдельные функции релевантности: 19 городов России: Москва, Санкт-Петербург, Екатеринбург, Новосибирск и др. Общероссийская Украина
- 9. ИССЛЕДОВАНИЕ ФУНКЦИИ РЕЛЕВАНТНОСТИ Постановка эксперимента Выбор исследуемого фактора Генерация тестовых коллекций Варьирование исследуемого фактора Фиксация остальных
- 10. УКРАИНСКАЯ ФОРМУЛА Фактор: Количество употреблений термина запроса (tf) Характер зависимости: Прямая Фактор: Длина документа в словах
- 12. Скачать презентацию