Слайд 2Основные идеи доклада
Оператор «минус» не применяется к текстам ссылок
Оператор «~~» вычищает НПС-результаты
из выдачи
Можно узнать, как Яндекс расширяет запрос пользователя
Контекстных ограничений не существует
Польза:
Для экспериментов
Для оценки конкуренции по запросу
Для поиска альтернативных вариантов продвижения
Для общей эрудиции
Слайд 3Операторы Яндекса
Присутствие: + (плюс) – слово обязано находиться
Исключение:
~~(тильда) – исключение в пределах
документа (~ предложения)
- (минус) – недокументированный: был исключением в контексте
Возможные контексты поиска:
Документ (текст), Предложение (текст)
Ссылки (анкор-файл)
…расстояние в несколько слов или предложений, указанное явно операторами /(-N +N) или &&/(-N +N)
Слайд 4Запрос [слово -слово]: что найдем?
слово – документы, содержащие слово в текстах или
во входящих ссылках
-слово – исключаются документы, содержащие слово в текстах
Итог: найденные по ссылкам документы (сниппет м.б. из Я.Каталога)
Слайд 5Для чего нужны найденные по ссылке («НПС») результаты с фиксированными словами?
Для проведения
экспериментов:
Выбор множества ссылок на разные документы, которые содержат нужные наборы слов или их последовательности
Анализ «весов» конкретных слов в текстах ссылок («анкор-файле»)
Прикидка весов ссылок
Слайд 6~ и ~~ : форсируем поиск по текстам
и удаляем НПС-результаты
Добавляя в любой
запрос исключение ~~абракадабры, удаляем НПС:
Для длинных запросов доля найденных по ссылке результатов относительно высока:
Слайд 7Расширение пользовательских запросов
Яндекс и раньше мог добавлять в запрос новые слова («что
такое Х»), но делал это редко, индивидуально.
Сейчас – расширение запроса поставлено на поток.
Переходы из одной части речи в другую
(гостиницы в Москве -> московские гостиницы)
Транслитерация («mazda» -> «мазда»)
Аббревиатуры (МГУ -> Московский государственный университет)
Как узнать слова, которыми расширяется запрос?
Используем операторы исключения.
Слайд 8Исключаем точную форму слова:
оставляем переформулировки
При исключении слова из запроса – в выдаче
остаются и подсвечиваются переформулировки (+найденное в URL):
Слайд 9Изменение «колдунщика»:
отмена ограничения расстояний
Колдунщик = расстановка неявных для пользователя ограничений на расстояние
между словами, известен с 2004.
Например, для запроса «новый год» находились документы, содержащие
от «год новый» до «новый [*] [*] год»
Эти ограничения можно было посмотреть. Но это закончилось.
Однако вручную введенные ограничения отрабатывали.
Как узнать реальные ограничения на расстояние между словами?
Попробуем подобрать…
Слайд 10Пытаемся подобрать:
перебор 7 частотных операторов
По статистике запросов Корпорации РБС, наиболее часто
использовались:
Перебор вариантов НЕ ДАЕТ РЕЗУЛЬТАТОВ…
Слайд 11А существуют ли теперь в Яндексе контекстные ограничения?
Из релиза Яндекса, Магадан:
«Мы смягчили
фильтрацию отбора документов для ранжирования, что привело к улучшению ранжирования по запросам, для которых релевантные документы содержат слова запроса далеко друг от друга»
Попробуем поискать эти ограничения.
Берем запрос (+скачать +реферат), оба слова должны находиться
Исключаем результаты поиска, в которых слова находятся «слишком близко» (от 1 слова до 10 тыс. предложений):
~~(+скачать & +реферат)
3. Смотрим, как меняется число найденных документов… Надеемся, что оно станет нулевым тогда, когда расстояние совпадет с расстоянием в заколдованном запросе…
Слайд 12Кажется, ограничений не существует…
находятся документы на любых расстояниях…
(+скачать +реферат) ~~(+скачать [ОПЕРАТОР] +реферат)