Интеллектуальный анализ данных (Data Mining)

Содержание

Слайд 2

Определение Data Mining (короткое)

Data Mining это –
процесс «обнаружения знаний
в базах

Определение Data Mining (короткое) Data Mining это – процесс «обнаружения знаний в
данных».

Российский государственный университет нефти и газа (НИУ) имени И.М.Губкина
ФАКУЛЬТЕТ КОМПЛЕКСНОЙ БЕЗОПАСНОСТИ ТЭК

Слайд 3

Определение Data Mining (полное)

Data Mining это
процесс обнаружения в сырых данных ранее неизвестных,

Определение Data Mining (полное) Data Mining это процесс обнаружения в сырых данных
нетривиальных, практически полезных и доступных для интерпретации знаний, необходимых для принятия решений в различных сферах человеческой деятельности.

Российский государственный университет нефти и газа (НИУ) имени И.М.Губкина
ФАКУЛЬТЕТ КОМПЛЕКСНОЙ БЕЗОПАСНОСТИ ТЭК

Слайд 4

Процесс анализа данных

OLAP

Data Mining

Российский государственный университет нефти и газа (НИУ) имени И.М.Губкина
ФАКУЛЬТЕТ

Процесс анализа данных OLAP Data Mining Российский государственный университет нефти и газа
КОМПЛЕКСНОЙ БЕЗОПАСНОСТИ ТЭК

Слайд 5

Междисциплинарность интеллектуального анализа данных

Data Mining

Теория баз данных

Машинное обучение

Алгоритми-зация

Искусственный интеллект

Распознавание образов

Визуализация

Другие дисциплины

Статистика

Российский государственный

Междисциплинарность интеллектуального анализа данных Data Mining Теория баз данных Машинное обучение Алгоритми-зация
университет нефти и газа (НИУ) имени И.М.Губкина
ФАКУЛЬТЕТ КОМПЛЕКСНОЙ БЕЗОПАСНОСТИ ТЭК

Слайд 6

Что позволяет сделать Data Mining:

Найти закономерности в накопленных данных;
Построить модели и правила,

Что позволяет сделать Data Mining: Найти закономерности в накопленных данных; Построить модели
описывающих выявленные закономерности ;
Построить модели и правила, прогнозирующих дальнейшее развитие некоторых процессов.

Российский государственный университет нефти и газа (НИУ) имени И.М.Губкина
ФАКУЛЬТЕТ КОМПЛЕКСНОЙ БЕЗОПАСНОСТИ ТЭК

Слайд 7

Основные ограничения при использовании Data Mining

Качество данных
Около 75% работы над Data Mining

Основные ограничения при использовании Data Mining Качество данных Около 75% работы над
состоит в сборе данных, который совершается еще до того, как запускаются сами инструменты интеллектуального анализа.
Data Mining не может заменить аналитика
Необходим тщательный выбор модели и интерпретация зависимостей или шаблонов, которые обнаружены. Построенные модели должны быть грамотно интегрированы в бизнес-процессы для возможности их оценки и обновления.

Российский государственный университет нефти и газа (НИУ) имени И.М.Губкина
ФАКУЛЬТЕТ КОМПЛЕКСНОЙ БЕЗОПАСНОСТИ ТЭК

Слайд 8

Основные стадии Data Mining

Российский государственный университет нефти и газа (НИУ) имени И.М.Губкина
ФАКУЛЬТЕТ

Основные стадии Data Mining Российский государственный университет нефти и газа (НИУ) имени
КОМПЛЕКСНОЙ БЕЗОПАСНОСТИ ТЭК

Слайд 9

Свободный поиск (выявление закономерностей)


На стадии свободного поиска осуществляется исследование набора

Свободный поиск (выявление закономерностей) На стадии свободного поиска осуществляется исследование набора данных
данных с целью поиска скрытых закономерностей.
Закономерность (law) - существенная и постоянно повторяющаяся взаимосвязь, определяющая этапы и формы процесса становления, развития различных явлений или процессов.

Российский государственный университет нефти и газа (НИУ) имени И.М.Губкина
ФАКУЛЬТЕТ КОМПЛЕКСНОЙ БЕЗОПАСНОСТИ ТЭК

Слайд 10

Основные действия на этапе свободного поиска


выявление закономерностей условной логики (conditional

Основные действия на этапе свободного поиска выявление закономерностей условной логики (conditional logic);
logic);
выявление закономерностей ассоциативной логики (associations and affinities);
выявление трендов и колебаний (trends and variations);
а также валидация (тестирование, проверка) выявленных закономерностей.

Российский государственный университет нефти и газа (НИУ) имени И.М.Губкина
ФАКУЛЬТЕТ КОМПЛЕКСНОЙ БЕЗОПАСНОСТИ ТЭК

Слайд 11

«Прозрачность» выявленных закономерностей

Полученные закономерности, а точнее, их конструкции, могут быть:
прозрачными,

«Прозрачность» выявленных закономерностей Полученные закономерности, а точнее, их конструкции, могут быть: прозрачными,
т.е. допускающими толкование аналитика;
непрозрачными, так называемыми "черными ящиками".

Российский государственный университет нефти и газа (НИУ) имени И.М.Губкина
ФАКУЛЬТЕТ КОМПЛЕКСНОЙ БЕЗОПАСНОСТИ ТЭК

Слайд 12

Прогностическое моделирование (Predictive Modeling)


Выявленные закономерности используются для предсказания неизвестных значений.
Прогностическое

Прогностическое моделирование (Predictive Modeling) Выявленные закономерности используются для предсказания неизвестных значений. Прогностическое
моделирование включает такие действия:
предсказание неизвестных значений (outcome prediction);
прогнозирование развития процессов (forecasting).

Российский государственный университет нефти и газа (НИУ) имени И.М.Губкина
ФАКУЛЬТЕТ КОМПЛЕКСНОЙ БЕЗОПАСНОСТИ ТЭК

Слайд 13

Прогностическое моделирование (Predictive Modeling)


Выявленные закономерности используются для предсказания неизвестных значений.
Прогностическое

Прогностическое моделирование (Predictive Modeling) Выявленные закономерности используются для предсказания неизвестных значений. Прогностическое
моделирование включает такие действия:
предсказание неизвестных значений (outcome prediction);
прогнозирование развития процессов (forecasting).

Российский государственный университет нефти и газа (НИУ) имени И.М.Губкина
ФАКУЛЬТЕТ КОМПЛЕКСНОЙ БЕЗОПАСНОСТИ ТЭК

Слайд 14

Этапы подготовка к проведению Data mining

Российский государственный университет нефти и газа (НИУ)

Этапы подготовка к проведению Data mining Российский государственный университет нефти и газа
имени И.М.Губкина
ФАКУЛЬТЕТ КОМПЛЕКСНОЙ БЕЗОПАСНОСТИ ТЭК

Слайд 15

Понятие предметной области
Предметная область - это мысленно ограниченная область реальной действительности, подлежащая

Понятие предметной области Предметная область - это мысленно ограниченная область реальной действительности,
описанию или моделированию и исследованию.
Предметная область состоит из объектов, различаемых по свойствам и находящихся в определенных отношениях между собой или взаимодействующих каким-либо образом.

Российский государственный университет нефти и газа (НИУ) имени И.М.Губкина
ФАКУЛЬТЕТ КОМПЛЕКСНОЙ БЕЗОПАСНОСТИ ТЭК

Слайд 16

Анализ предметной области

В процессе изучения предметной области должна быть создана ее модель.

Анализ предметной области В процессе изучения предметной области должна быть создана ее

Модель предметной области описывает процессы, происходящие в предметной области, и данные, которые в этих процессах используются.

Российский государственный университет нефти и газа (НИУ) имени И.М.Губкина
ФАКУЛЬТЕТ КОМПЛЕКСНОЙ БЕЗОПАСНОСТИ ТЭК

Слайд 17

Постановка задачи Data Mining

Включает следующие шаги:
формулировка задачи;
формализация задачи.
Постановка задачи включает также

Постановка задачи Data Mining Включает следующие шаги: формулировка задачи; формализация задачи. Постановка
описание статического и динамического поведения исследуемых объектов.

Российский государственный университет нефти и газа (НИУ) имени И.М.Губкина
ФАКУЛЬТЕТ КОМПЛЕКСНОЙ БЕЗОПАСНОСТИ ТЭК

Слайд 18

Постановка задачи Data Mining

Описание статики:
описание объектов и их свойств.
Описании динамики:

Постановка задачи Data Mining Описание статики: описание объектов и их свойств. Описании

описывается поведение объектов и те причины, которые влияют на их поведение.

Российский государственный университет нефти и газа (НИУ) имени И.М.Губкина
ФАКУЛЬТЕТ КОМПЛЕКСНОЙ БЕЗОПАСНОСТИ ТЭК

Слайд 19

Постановка задачи Data Mining

Технология Data Mining не может заменить аналитика и

Постановка задачи Data Mining Технология Data Mining не может заменить аналитика и
ответить на те вопросы, которые не были заданы.

!

Российский государственный университет нефти и газа (НИУ) имени И.М.Губкина
ФАКУЛЬТЕТ КОМПЛЕКСНОЙ БЕЗОПАСНОСТИ ТЭК

Слайд 20

Подготовка данных

Российский государственный университет нефти и газа (НИУ) имени И.М.Губкина
ФАКУЛЬТЕТ КОМПЛЕКСНОЙ БЕЗОПАСНОСТИ

Подготовка данных Российский государственный университет нефти и газа (НИУ) имени И.М.Губкина ФАКУЛЬТЕТ КОМПЛЕКСНОЙ БЕЗОПАСНОСТИ ТЭК
ТЭК

Слайд 21

Определение и анализ требований к данным

Определение и анализ требований к данным,

Определение и анализ требований к данным Определение и анализ требований к данным,
которые необходимы для осуществления Data Mining.
Включая вопросы:
распределения пользователей;
вопросы доступа к данным, которые необходимы для анализа;
аналитические характеристики системы.

Российский государственный университет нефти и газа (НИУ) имени И.М.Губкина
ФАКУЛЬТЕТ КОМПЛЕКСНОЙ БЕЗОПАСНОСТИ ТЭК

Слайд 22

Сбор данных

Российский государственный университет нефти и газа (НИУ) имени И.М.Губкина
ФАКУЛЬТЕТ КОМПЛЕКСНОЙ БЕЗОПАСНОСТИ

Сбор данных Российский государственный университет нефти и газа (НИУ) имени И.М.Губкина ФАКУЛЬТЕТ КОМПЛЕКСНОЙ БЕЗОПАСНОСТИ ТЭК
ТЭК

Слайд 23

Определение необходимого количества данных

Для определения оптимального объема данных необходимо ответить на

Определение необходимого количества данных Для определения оптимального объема данных необходимо ответить на
следующие вопросы:
Упорядочены ли данные?
Включает ли набор данных сезонную/цикличную компоненту?
Есть ли в наборе устаревшие данные или описывающие какую-то нетипичную ситуацию?
Каково соотношение количества записей в наборе и количества входных переменных?
Репрезентативен ли используемый набор данных?

Российский государственный университет нефти и газа (НИУ) имени И.М.Губкина
ФАКУЛЬТЕТ КОМПЛЕКСНОЙ БЕЗОПАСНОСТИ ТЭК

Слайд 24

Предварительная обработка данных

Российский государственный университет нефти и газа (НИУ) имени И.М.Губкина
ФАКУЛЬТЕТ КОМПЛЕКСНОЙ

Предварительная обработка данных Российский государственный университет нефти и газа (НИУ) имени И.М.Губкина ФАКУЛЬТЕТ КОМПЛЕКСНОЙ БЕЗОПАСНОСТИ ТЭК
БЕЗОПАСНОСТИ ТЭК

Слайд 25

Предварительная обработка данных
Качество данных (Data quality) в данном случае является параметром, который

Предварительная обработка данных Качество данных (Data quality) в данном случае является параметром,
характеризует прежде всего возможность их интерпретации.

Российский государственный университет нефти и газа (НИУ) имени И.М.Губкина
ФАКУЛЬТЕТ КОМПЛЕКСНОЙ БЕЗОПАСНОСТИ ТЭК

Слайд 26

Задачи Data-Mining:

Классификация;
Кластеризация;
Поиск ассоциативных правил;
Прогнозирование;
Анализ отклонений.

Российский государственный университет нефти и газа (НИУ) имени

Задачи Data-Mining: Классификация; Кластеризация; Поиск ассоциативных правил; Прогнозирование; Анализ отклонений. Российский государственный
И.М.Губкина
ФАКУЛЬТЕТ КОМПЛЕКСНОЙ БЕЗОПАСНОСТИ ТЭК
Имя файла: Интеллектуальный-анализ-данных-(Data-Mining).pptx
Количество просмотров: 45
Количество скачиваний: 0