Содержание
- 2. Краткое содержание Индексация рунета (и так уже много страниц – пора выкидывать ) Апдейты (текстовые, ссылочные,
- 3. Я: Что интересного за год: Почти ровно год назад, сентябрь 2009 – выстрелил фильтр АГС-17 Осень
- 4. Я: число документов в индексе Число документов (сумма по дням индексации за последние 3 месяца) уменьшилось
- 5. Я: скорость индексации Рунета Скорость переиндексации рунета уменьшилась за год в три раза: Было ~50-60 дней,
- 6. 2. Апдейты Яндекса: русский и западный индексы Выкладывание новых проиндексированных страниц, появление в поиске текстов страниц.
- 7. Апдейты Яндекса: сохраненной копии (метод komdir) Выкладывание новой сохраненной копии происходит чуть раньше. На ~10-15 минут
- 8. Апдейты Яндекса: ссылочные новые ссылки в анкор-файле Обновление анкор-файла, учет новых проиндексированных ссылок. Метод: поиск свежих
- 9. Апдейты Яндекса: гео Изменение числа геопривязанных сайтов Число сайтов и страниц, найденных с ограничением по региону
- 10. Апов нет, а выдача изменилась?
- 11. = обновление формулы? …или многое другое: например, пересчет весов ссылок? Есть запросы, где в результатах много
- 12. 3. НПС и взвешивание ссылок …кстати - суфийская притча о слоне Анализ не полной выдачи, а
- 13. Сначала было слово… …а потом – ошибка кодировки Приведена полная выдача (X) и отмечены НПС-результаты (Y)
- 14. Как применить? 1 вывод: баненные и/или АГСные доноры не работают. …а если и летают, то очень-очень
- 15. 4. Переформулировки поисковых запросов Лето 2008 – введены переформулировки запросов: Теперь поиск Яндекса (версия "Магадан") еще
- 16. Пример переформулировки: продвижение сайтов => становится: (продвижение::19047 ^ ((про::2793-движение::8030)) ^ продвигать::40288 ^ продвигаться::199208) &&/(-32768 32768) сайтов::410
- 17. ограничения расстояний очень «короткие» и очень «длинные» анализ финансового состояния предприятия анализ::8714 &/(-1 1) финансового::6288 &/(-1
- 18. разбиение на фрагменты И склейка фрагментов downloadmanager downloadmanager::27273214 ^ ((download::1501-manager::7788)) z11xrn (модель ноутбука) z11xrn::709103565 ^ (!(z::3403
- 19. «двоеточечные» веса Веса слов разные по трем коллекциям По каждому слову есть двоеточечный вес, и слова
- 20. ФИО – новые зоны и термы Ахтунг!!! Экстракция сущностей в большом поиске! Для запросов, содержащих имена
- 21. мfi – все имена на букву М экстракция объектов из текста…
- 22. 4.5 Какая польза? Раньше мы знали про переформулировки, но теперь очевидно, что переформулировка производится на уровне
- 23. А экстракция сущностей в большом поиске - это мощные изменения… И ведь без микроформатов и разметки…
- 24. 5. Контрастности (веса) слов ::вес – это НЕ IDF (классический) IDF (inverse document frequency — обратная
- 25. ::веса -не документные? А от словоформ? Не IDF, а ICF?
- 26. 6. Тестовый ХML Лето 2010: http://xml.yandex.ru/test_query.xml 106678464 106678464 http://www.detskaya-poliklinika.ru/ www.detskaya-poliklinika.ru rus 0.047059 dmoz www. detskaya -
- 27. Что показывалось: 106678464 -числовые значения релевантности группы в целом и элемента Релевантность группы и первого эл-та
- 28. Что удалось взять: топ-1000 по 42К запросов (seorate+частотные) В сумме: 2.5М разных хостов (отдельно 2М из
- 29. Аффилировалка - автомат? http://tools.promosite.ru/use/clones.php Что наводит на мысль об автоматическом определении клонов: Очень много хостов с
- 30. Цифры релевантности 400111552 Очень похожи на моделирование оценок асессоров (0-4)*100М 4xx М – витальные результаты 3хх
- 31. 4xx М – витальные результаты Есть по 4.5К запросам из 42К (11%) Много действительно витальных: Но
- 32. 3xx М – поиск домена Некоторым очень везет…
- 33. 2xx М –странные запросы 1.2К запросов вся выдача из 2хх глисты трихомонада язва диатез погрузчик инвестиционный
- 34. 1xx М – все остальное
- 35. 1xx М - поиграемся Степенной закон, чо…
- 36. [1-9]x М - поражены в правах? Дублирование контента? Как правило, заспамленные тематики, но могут быть приличные
- 38. Скачать презентацию