Содержание
- 2. Эволюция технологий хранения и обработки данных … — 1960-е: Файлы и файловые архивы 1960-е: Первые СУБД,
- 3. Актуальность и необходимость интеллектуального анализа данных Проблема больших объемов («Data explosion»): Средства автоматического сбора данных, повсеместное
- 4. Интеллектуальный анализ данных (Data Mining) Системы интеллектуального анализа данных (ИАД) – класс программных систем поддержки принятия
- 5. Процесс ИАД (1) Анализ предметной области: выявление и формулировка необходимых априорных знаний о предметной области, целей
- 6. Процесс ИАД (2) Выбор (или разработка) алгоритма анализа: определение ограничений и требований к алгоритму по точности,
- 7. Программные системы ИАД Типовая архитектура: Классификация систем ИАД: По типу анализируемых данных По типу решаемых задач
- 8. Типы исходных данных (1) Транзакционные базы данных и репозитории «событий» Объекты анализа – «события» различной структуры
- 9. Типы исходных данных (2) Географические и пространственные данные Привязка к пространственным координатам, учет географии объектов при
- 10. Задачи ИАД = типы выявляемых закономерностей Классификация («Обучение с учителем») Отнесение объектов к заранее определенным категориям
- 11. Методы анализа Data Mining Технологии БД Статистика и теор. вер. Другие дисциплины Теория информации Машинное обучение
- 12. Область применения систем ИАД Системы ИАД «общего назначения» По сути включают framework, библиотеку алгоритмов анализа и
- 13. Отличия ИАД систем (1) Наличие «обучения» база знаний формируются на основе анализируемых данных, а не экспертных
- 14. Отличия ИАД систем (2) Наличие большого объема данных сложной структуры зачастую скорость работы алгоритмов в ИАД
- 15. Отличия ИАД систем (3) Наличие человека - аналитика как оконечного потребителя результатов работы ИАД системы в
- 16. ИАД в проектах лаборатории «Технологий Программирования» Компьютерная безопасность Обнаружение внешних и внутренних вторжений Моделирование и анализ
- 17. ИАД в компьютерной безопасности Цели компьютерной безопасности: обеспечение конфиденциальности, целостности и доступности данных Вторжение – действия
- 18. Традиционные средства выявления вторжений Основные концепции: Используют базах сигнатур известных атак Источники информации: системные журналы и
- 19. Методы ИАД в задачах выявления вторжений Основное предположение: активность пользователей и программ можно полностью отследить и
- 20. Обнаружение нарушений Особенности: Строится обобщенная модель атаки Основано на методах классификации Атакой считаются события или последовательности
- 21. Обнаружение аномалий Особенности : Строится обобщенная модель нормальной активности пользователей или программ (профайл) Основано на методах
- 22. Разработанные и реализованные алгоритмы Обнаружение аномалий: Оценка степени «типичности» событий и их последовательностей - нечеткая кластеризация
- 23. Система мониторинга и анализа поведения пользователей Функциональность: Сбор и консолидация данных о работе пользователей Статистический и
- 24. Архитектура системы мониторинга
- 25. Особенности реализации и результаты Подсистема консолидации исходных данных: Мульти-агентный подход Нет ограничений на источники собираемых данных
- 26. Электронный документооборот Интеллектуальная система анализа и фильтрации электронной почты масштаба предприятия Система анализа и много-темной классификации
- 27. Алгоритм классификации (на SVM): векторная форма представления письма высокая точность эффективность по скорости персональная модель классификации
- 28. Архитектура системы фильтрации Особенности реализации: Учет ресурсоемкости алгоритмов на этапе обучения Распределение и баланс нагрузки Классификация
- 29. Результаты экспериментальной реализации и апробации Почтовый сервер лаборатории «Технологий программирования» эксплуатация с весны 2004 около 1
- 30. Цели создания систем анализа и фильтрации Интернет-трафика Блокирование доступа к нелегальной (экстремистской, антисоциальной, террористической и т.п.)
- 31. Существующие системы фильтрации Традиционный подход («сигнатурные» методы): Использование при анализе Интернет-трафика специализированных, формируемых экспертами, баз знаний,
- 32. Анализ и фильтрация Интернет- трафика на основе методов ИАД Основная идея: Классификация потока гипертекстовой информации в
- 33. Преимущества Классификация в реальном времени статических и динамических интернет ресурсов; Точность выше, чем у «сигнатурных» методов;
- 34. Архитектура системы
- 35. Основные результаты Реализация системы: Формализованы требования и сценарии взаимодействия Спроектированы и реализованы базовые компоненты, их функционал,
- 36. Интеллектуальная система анализа и мониторинга электронного документооборота организации Драйвер ФС: определяет с какими файлами работал пользователь;
- 37. Модель аннотирования Кластер документов – набор «схожих» документов; Каждый документ кластера разбивается на фрагменты текста; Каждый
- 38. Алгоритмы поиска ключевых характеристик Латентно-семантический анализ (LSA - Latent Semantic Analysis): основан на использовании разложения исходной
- 39. Аннотирование новых документов Для каждого документа определяется ближайший кластер и соответствующая ему модель аннотирования; Документ разбивается
- 40. Архитектура ИАД системы анализа поведения технологических процессов Особенности реализации: выявление аномалий в характеристик ТП функционирование в
- 41. Выявление нештатных ситуаций построение модели поведения ТП (на этапе обучения) оценка отклонения текущего состояния ТП от
- 42. Анализ и прогнозирование качества ТП Какие параметры производственного процесса влияют на качество продукции? Quality = F(X1,
- 43. Результат Разработаны алгоритмы: на основе нечетких деревьев решений с поддержкой эволюционных методов оптимизации нечетких переменных и
- 44. Ситуационный центр Основная задача СЦ — строить наглядные образы ситуаций, возникающих в предметной области, на основе
- 45. Место ИАД в процессе поддержки принятия решений в СЦ ЛПР Аналитик Оператор Принятие решениий Представление результатов
- 46. Расчет и хранение индикаторов Проведение статистического анализа и вычисление индикаторов, описывающих ситуацию
- 47. Выявление аномалий в значениях индикаторов
- 48. Определение тенденций и прогнозирование значений индикаторов
- 49. Текущие результаты Проектирование и создание рабочего места аналитика ситуационного центра мониторинга и анализа ситуаций: Просмотр ситуации
- 51. Скачать презентацию