Содержание
- 2. Актуальность: Высокие темпы роста объема текстовой информации Накопление неклассифицированных данных в распределенной структуре Отсутствие возможности оптимального
- 3. Цель: Целью работы является разработка метода эффективного поиска текстовой информации в распределенной файловой системе с высокой
- 4. Общая архитектура 04 / 24
- 5. Выборка: Иерархическая структурированная библиотека открытая для скачивания объемом 21гб 05 / 24
- 6. Сбор и очистка данных: Данные Полученные очищенные слова данные отравляются На формирование входного вектора 06 /
- 7. Формирование входного вектора для кластеризатора 07 / 24
- 8. Существующие подходы к кластеризации: 08 / 24
- 9. Существующие подходы к индексации 09 / 24
- 10. Обоснование выбранного решение: Устойчивость к шумам Скорость Точность Адаптивность Отсутствие необходимости в эвристиках SOINN 10 /
- 11. Формирование структуры кластеров 11 / 24
- 12. Индексация Каждому кластеру присваивается уникальный индекс в порядке вложенности Пределом кластеризации является сведение к один кластер
- 13. Пример иерархической индексированной кластерной структуры файлов По окончанию иерархической кластеризации каждый файл отделяется в отдельный персональный
- 14. Пример вида метаинформации в документе 14 / 24
- 15. Пример сохраненной метаинформации в текстовом файле 15 / 24
- 16. Поиск 16 / 24
- 17. Имплементация: 17 / 24
- 18. Визуальный интерфейс 18/ 24
- 19. Поисковый запрос 19 / 24
- 20. Расширение поискового запроса 20 / 24
- 21. Экран настроек 21 / 24
- 22. Анализ эффективности: 400мб 1,5гб 7 мс 18 мс 21гб 19 мс 23 мс 22 / 24
- 23. Сравнительная характеристика алгоритмов поиска 23 / 24
- 25. Скачать презентацию