Содержание
- 2. Актуальность: Высокие темпы роста объема текстовой информации Накопление неклассифицированных данных в распределенной структуре Отсутствие возможности оптимального
- 3. Цель: Целью работы является разработка метода эффективного поиска текстовой информации в распределенной файловой системе с высокой
- 4. Общая архитектура 04 / 24
- 5. Выборка: Иерархическая структурированная библиотека открытая для скачивания объемом 21гб 05 / 24
- 6. Сбор и очистка данных: Данные Полученные очищенные слова данные отравляются На формирование входного вектора 06 /
- 7. Формирование входного вектора для кластеризатора 07 / 24
- 8. Существующие подходы к кластеризации: 08 / 24
- 9. Существующие подходы к индексации 09 / 24
- 10. Обоснование выбранного решение: Устойчивость к шумам Скорость Точность Адаптивность Отсутствие необходимости в эвристиках SOINN 10 /
- 11. Формирование структуры кластеров 11 / 24
- 12. Индексация Каждому кластеру присваивается уникальный индекс в порядке вложенности Пределом кластеризации является сведение к один кластер
- 13. Пример иерархической индексированной кластерной структуры файлов По окончанию иерархической кластеризации каждый файл отделяется в отдельный персональный
- 14. Пример вида метаинформации в документе 14 / 24
- 15. Пример сохраненной метаинформации в текстовом файле 15 / 24
- 16. Поиск 16 / 24
- 17. Имплементация: 17 / 24
- 18. Визуальный интерфейс 18/ 24
- 19. Поисковый запрос 19 / 24
- 20. Расширение поискового запроса 20 / 24
- 21. Экран настроек 21 / 24
- 22. Анализ эффективности: 400мб 1,5гб 7 мс 18 мс 21гб 19 мс 23 мс 22 / 24
- 23. Сравнительная характеристика алгоритмов поиска 23 / 24
- 25. Скачать презентацию






















Информационная безопасность в компьютерных сетях Криптографическая система шифрования
9-1-2 знаковые модели_1
Текстовые редакторы и процессоры
Этические и правовые нормы информационной деятельности людей. Виды программного обеспечения
5-5-2-nositeli-informacii (1)
Сводные таблицы. ВСР №12
Добавление устройства по коду авторизации
Системы счисления. Двоичная система счисления
Тестирование. Тесты как спецификация
Подборка полезных материалов для новичков
Знакомство с графическим оператором DRAW. Информатика 5 класс
Современные информационные технологии в процессе подготовки специалистов
Организация профессиональной диспетчерской службы в 2 клика
Основные термины модели в системе трёхмерного моделирования. Компас – 3D
Разработка сайта-музея военного аэродрома Арктика
Relative Strength Index
Информация и ее свойства. Информационные процессы
Создаем игру ZigZag
Классы в C#
Презентация "Надстройка для PowerPoint" - скачать презентации по Информатике
МГЕР-TEAM. База данных на основе интересов участников Молодой Гвардии
Безопасный регион
Информатика и я
Job Hunter
Основные понятия теории автоматического управления. Лекция 1
SQL Fundamentals
Управление качеством информационно-библиографической продукции и услуг
Информация. Измерение информации