Технология Data Mining

Содержание

Слайд 2

Data Mining

Это собирательное название, используемое для обозначения совокупности методов обнаружения в

Data Mining Это собирательное название, используемое для обозначения совокупности методов обнаружения в
данных ранее неизвестных, нетривиальных, практически полезных и доступных интерпретации знаний, необходимых для принятия решений в различных сферах человеческой деятельности.
Определение. Data Mining - это процесс поддержки принятия решений, основанный на поиске в данных скрытых закономерностей (шаблонов информации).

Слайд 3

Классификация задач Data Mining

классификация,
кластеризация,
прогнозирование,
ассоциация,
визуализация,
анализ и обнаружение отклонений,
оценивание,

Классификация задач Data Mining классификация, кластеризация, прогнозирование, ассоциация, визуализация, анализ и обнаружение отклонений, оценивание, анализ связей.

анализ связей.

Слайд 4

Основные методы Data mining

методы классификации, моделирования и прогнозирования, основанные на применении деревьев

Основные методы Data mining методы классификации, моделирования и прогнозирования, основанные на применении
решений, искусственных нейронных сетей, генетических алгоритмов, эволюционного программирования, ассоциативной памяти, нечёткой логики;
статистические методы - дескриптивный анализ, корреляционный и регрессионный анализ, факторный анализ, дисперсионный анализ, компонентный анализ, дискриминантный анализ, анализ временных рядов.

Слайд 5

Нечеткая логика

Математическая теория нечетких множеств (fuzzy sets) и нечеткая логика (fuzzy

Нечеткая логика Математическая теория нечетких множеств (fuzzy sets) и нечеткая логика (fuzzy
logic) являются обобщениями классической теории множеств и классической формальной логики.
Данные понятия были впервые предложены американским ученым Лотфи Заде (Lotfi Zadeh) в 1965 г.
Основной причиной появления новой теории стало наличие нечетких и приближенных рассуждений при описании человеком процессов, систем, объектов.

Слайд 6

Периоды развития

Первый период (конец 60-х–начало 70 гг.) характеризуется развитием теоретического аппарата нечетких

Периоды развития Первый период (конец 60-х–начало 70 гг.) характеризуется развитием теоретического аппарата
множеств (Л. Заде, Э. Мамдани, Беллман).
Во втором периоде (70–80-е годы) появляются первые практические результаты в области нечеткого управления сложными техническими системами (парогенератор с нечетким управлением).
Наконец, в третьем периоде, который длится с конца 80-х годов и продолжается в настоящее время, появляются пакеты программ для построения нечетких экспертных систем, а области применения нечеткой логики заметно расширяются.

Слайд 7

Математический аппарат

Характеристикой нечеткого множества выступает функция принадлежности (Membership Function). Обозначим через MF(x)

Математический аппарат Характеристикой нечеткого множества выступает функция принадлежности (Membership Function). Обозначим через
– степень принадлежности к нечеткому множеству C
Тогда нечетким множеством С называется множество упорядоченных пар вида C={MFc(x)/x}, MFc(x) [0,1]. Значение MFc(x)=0 означает отсутствие принадлежности к множеству, 1 – полную принадлежность.
Для нечетких множеств, как и для обычных, определены основные логические операции. Самыми основными, необходимыми для расчетов, являются пересечение и объединение.
Пересечение двух нечетких множеств (нечеткое "И"): A B: MFAB(x)=min(MFA(x), MFB(x)).
Объединение двух нечетких множеств (нечеткое "ИЛИ"): A B: MFAB(x)=max(MFA(x), MFB(x)).

Слайд 8

Нечеткая и лингвистическая переменные

Нечеткая переменная описывается набором (N,X,A), где N – это

Нечеткая и лингвистическая переменные Нечеткая переменная описывается набором (N,X,A), где N –
название переменной, X – универсальное множество (область рассуждений), A – нечеткое множество на X.
Значениями лингвистической переменной (N,T,X,G,P) могут быть нечеткие переменные, т.е. лингвистическая переменная находится на более высоком уровне, чем нечеткая переменная.
Каждая лингвистическая переменная состоит из:
названия;
множества своих значений, которое также называется базовым терм-множеством T. Элементы базового терм-множества представляют собой названия нечетких переменных;
универсального множества X;
синтаксического правила G, по которому генерируются новые термы с применением слов естественного или формального языка;
семантического правила P, которое каждому значению лингвистической переменной ставит в соответствие нечеткое подмножество множества X.

Слайд 9

Типовые формы кривых для задания функций принадлежности

Существует свыше десятка типовых форм

Типовые формы кривых для задания функций принадлежности Существует свыше десятка типовых форм
кривых для задания функций принадлежности. Наибольшее распространение получили:
треугольная,
трапецеидальная,
гауссова функции принадлежности.

Слайд 10

Треугольная функция принадлежности

Определяется тройкой чисел (a,b,c), и ее значение в точке

Треугольная функция принадлежности Определяется тройкой чисел (a,b,c), и ее значение в точке x вычисляется согласно выражению:
x вычисляется согласно выражению:

Слайд 11

Трапецеидальная функция принадлежности

Для задания трапецеидальной функции принадлежности необходима четверка чисел (a,b,c,d):

Трапецеидальная функция принадлежности Для задания трапецеидальной функции принадлежности необходима четверка чисел (a,b,c,d):

Слайд 12

Гауссова функция принадлежности

Функция принадлежности гауссова типа описывается формулой:
где с – центра

Гауссова функция принадлежности Функция принадлежности гауссова типа описывается формулой: где с – центра нечеткого множества
нечеткого множества

Слайд 13

Графическое изображение

Графическое изображение

Слайд 14

Формализация неточного понятия «возраст человека»
Так, для человека 48 лет степень принадлежности к

Формализация неточного понятия «возраст человека» Так, для человека 48 лет степень принадлежности
множеству "Молодой" равна 0, "Средний" – 0,47, "Выше среднего" – 0,20.
!!! Количество термов в лингвистической переменной редко превышает 7.

Слайд 15

Механизм логического вывода

В общем случае механизм логического вывода включает четыре этапа:

Механизм логического вывода В общем случае механизм логического вывода включает четыре этапа:
введение нечеткости (фазификация), нечеткий вывод, композиция и приведение к четкости, или дефазификация:

Слайд 16

Интеграция с интеллектуальными парадигмами

Гибридизация методов интеллектуальной обработки информации – девиз, под

Интеграция с интеллектуальными парадигмами Гибридизация методов интеллектуальной обработки информации – девиз, под
которым прошли 90-е годы у западных и американских исследователей. В результате объединения нескольких технологий искусственного интеллекта появился специальный термин – "мягкие вычисления" (soft computing), который ввел Л. Заде в 1994 году.

Слайд 17

Примеры объединения нескольких технологий

Нечеткие нейронные сети,
Адаптивные нечеткие системы,
Нечеткие запросы,
Нечеткие ассоциативные правила,
Нечеткие когнитивные

Примеры объединения нескольких технологий Нечеткие нейронные сети, Адаптивные нечеткие системы, Нечеткие запросы,
карты,
Нечеткая кластеризация и т. п.

Слайд 18

Применение методов нечеткой логики при оценке информационных ресурсов предприятий

Информационные ресурсы организации (ИР)

Применение методов нечеткой логики при оценке информационных ресурсов предприятий Информационные ресурсы организации
– ресурсы нового типа, характеризующие интеллектуальный потенциал организации – до сих пор не рассматриваются руководителями и бухгалтерами как объекты финансового учѐта.
Большинство российских организаций на сегодняшний день не решают задач инвентаризации, оценки и коммерциализации информационных ресурсов, что противоречит современным методам управления.
Идентификация, анализ и оценка информационных ресурсов становится экономической необходимостью для любой организации независимо от еѐ размера и вида деятельности.

Слайд 19

Оценка информационных ресурсов

Оценка информационных ресурсов

Слайд 20

Предположим, что стоимости, полученные тремя основными методами, представляют собой Т –

Предположим, что стоимости, полученные тремя основными методами, представляют собой Т – числа
числа и имеют следующие значения (в тыс. руб.):
Sзат=[100; 250; 450; 650];
Sрын=[400; 525; 650; 800];
Sдох=[450; 650; 725; 1000]. Схематическое представление данной оценки ИР в форме лингвистической переменной, включающей в себя три метода оценивания (затратный, рыночный и доходный), представлена на рисунке.

Слайд 21

Нечеткая оценка стоимости ИР

Нечеткая оценка стоимости ИР

Слайд 22

Таблица 1

Таблица 1

Слайд 23

Таблица 2

Таблица 2

Слайд 24

Таблица 3

Таблица 3

Слайд 25

Нечѐткая оценка стоимости ИР тремя методами при ЦФО_ИР=«Определение ущерба при порче ИР»

Нечѐткая оценка стоимости ИР тремя методами при ЦФО_ИР=«Определение ущерба при порче ИР»

Слайд 26

Нечѐткая оценка стоимости ИР тремя методами при ЖЦ_ИР=«Разработка ИР»

Нечѐткая оценка стоимости ИР тремя методами при ЖЦ_ИР=«Разработка ИР»

Слайд 27

Нечѐткая оценка стоимости ИР тремя методами при ЦФО_ИР=«Определение ущерба при порче ИР»

Нечѐткая оценка стоимости ИР тремя методами при ЦФО_ИР=«Определение ущерба при порче ИР» и ЖЦ_ИР= «Разработка ИР»
и ЖЦ_ИР= «Разработка ИР»

Слайд 28

Результат

На основе полученной нечѐткой оценки стоимости ИР путѐм дефаззификации определяется чѐткая

Результат На основе полученной нечѐткой оценки стоимости ИР путѐм дефаззификации определяется чѐткая
оценка ИР, равная абсциссе центра тяжести заштрихованной фигуры
Имя файла: Технология-Data-Mining.pptx
Количество просмотров: 267
Количество скачиваний: 1