Использование особенностей языка запросов поиска Яндекса для исследований

Содержание

Слайд 2

Основные идеи доклада

Оператор «минус» не применяется к текстам ссылок
Оператор «~~» вычищает НПС-результаты

Основные идеи доклада Оператор «минус» не применяется к текстам ссылок Оператор «~~»
из выдачи
Можно узнать, как Яндекс расширяет запрос пользователя
Контекстных ограничений не существует
Польза:
Для экспериментов
Для оценки конкуренции по запросу
Для поиска альтернативных вариантов продвижения
Для общей эрудиции

Слайд 3

Операторы Яндекса

Присутствие: + (плюс) – слово обязано находиться
Исключение:
~~(тильда) – исключение в пределах

Операторы Яндекса Присутствие: + (плюс) – слово обязано находиться Исключение: ~~(тильда) –
документа (~ предложения)
- (минус) – недокументированный: был исключением в контексте
Возможные контексты поиска:
Документ (текст), Предложение (текст)
Ссылки (анкор-файл)
…расстояние в несколько слов или предложений, указанное явно операторами /(-N +N) или &&/(-N +N)

Слайд 4

Запрос [слово -слово]: что найдем?

слово – документы, содержащие слово в текстах или

Запрос [слово -слово]: что найдем? слово – документы, содержащие слово в текстах
во входящих ссылках
-слово – исключаются документы, содержащие слово в текстах
Итог: найденные по ссылкам документы (сниппет м.б. из Я.Каталога)

Слайд 5

Для чего нужны найденные по ссылке («НПС») результаты с фиксированными словами?

Для проведения

Для чего нужны найденные по ссылке («НПС») результаты с фиксированными словами? Для
экспериментов:
Выбор множества ссылок на разные документы, которые содержат нужные наборы слов или их последовательности
Анализ «весов» конкретных слов в текстах ссылок («анкор-файле»)
Прикидка весов ссылок

Слайд 6

~ и ~~ : форсируем поиск по текстам и удаляем НПС-результаты

Добавляя в любой

~ и ~~ : форсируем поиск по текстам и удаляем НПС-результаты Добавляя
запрос исключение ~~абракадабры, удаляем НПС:
Для длинных запросов доля найденных по ссылке результатов относительно высока:

Слайд 7

Расширение пользовательских запросов

Яндекс и раньше мог добавлять в запрос новые слова («что

Расширение пользовательских запросов Яндекс и раньше мог добавлять в запрос новые слова
такое Х»), но делал это редко, индивидуально.
Сейчас – расширение запроса поставлено на поток.
Переходы из одной части речи в другую
(гостиницы в Москве -> московские гостиницы)
Транслитерация («mazda» -> «мазда»)
Аббревиатуры (МГУ -> Московский государственный университет)
Как узнать слова, которыми расширяется запрос?
Используем операторы исключения.

Слайд 8

Исключаем точную форму слова: оставляем переформулировки

При исключении слова из запроса – в выдаче

Исключаем точную форму слова: оставляем переформулировки При исключении слова из запроса –
остаются и подсвечиваются переформулировки (+найденное в URL):

Слайд 9

Изменение «колдунщика»: отмена ограничения расстояний

Колдунщик = расстановка неявных для пользователя ограничений на расстояние

Изменение «колдунщика»: отмена ограничения расстояний Колдунщик = расстановка неявных для пользователя ограничений
между словами, известен с 2004.
Например, для запроса «новый год» находились документы, содержащие
от «год новый» до «новый [*] [*] год»
Эти ограничения можно было посмотреть. Но это закончилось.
Однако вручную введенные ограничения отрабатывали.
Как узнать реальные ограничения на расстояние между словами?
Попробуем подобрать…

Слайд 10

Пытаемся подобрать: перебор 7 частотных операторов

По статистике запросов Корпорации РБС, наиболее часто

Пытаемся подобрать: перебор 7 частотных операторов По статистике запросов Корпорации РБС, наиболее
использовались:
Перебор вариантов НЕ ДАЕТ РЕЗУЛЬТАТОВ…

Слайд 11

А существуют ли теперь в Яндексе контекстные ограничения?

Из релиза Яндекса, Магадан:
«Мы смягчили

А существуют ли теперь в Яндексе контекстные ограничения? Из релиза Яндекса, Магадан:
фильтрацию отбора документов для ранжирования, что привело к улучшению ранжирования по запросам, для которых релевантные документы содержат слова запроса далеко друг от друга»
Попробуем поискать эти ограничения.
Берем запрос (+скачать +реферат), оба слова должны находиться
Исключаем результаты поиска, в которых слова находятся «слишком близко» (от 1 слова до 10 тыс. предложений):
~~(+скачать & +реферат)
3. Смотрим, как меняется число найденных документов… Надеемся, что оно станет нулевым тогда, когда расстояние совпадет с расстоянием в заколдованном запросе…

Слайд 12

Кажется, ограничений не существует… находятся документы на любых расстояниях…

(+скачать +реферат) ~~(+скачать [ОПЕРАТОР] +реферат)

Кажется, ограничений не существует… находятся документы на любых расстояниях… (+скачать +реферат) ~~(+скачать [ОПЕРАТОР] +реферат)

Имя файла: Использование-особенностей-языка-запросов-поиска-Яндекса-для-исследований.pptx
Количество просмотров: 140
Количество скачиваний: 0