Data Mining классификация и регрессия

Содержание

Слайд 2

Классификация

Классификация

Слайд 3

Постановка задачи

Если входные и выходные переменные модели непрерывные — перед нами задача

Постановка задачи Если входные и выходные переменные модели непрерывные — перед нами
регрессии.
Если выходная переменная одна и она является дискретной (метка класса), то речь идет о задаче классификации.

Слайд 4

Этап первый

Поскольку метка класса каждого примера предварительно задана, построение классификационной модели часто

Этап первый Поскольку метка класса каждого примера предварительно задана, построение классификационной модели
называют обучением с учителем.
В процессе обучения формируются правила, по которым производится отнесение объекта к одному из классов

Слайд 5

Этап второй

модель применяется для классификации новых, ранее неизвестных объектов и наблюдений

Этап второй модель применяется для классификации новых, ранее неизвестных объектов и наблюдений

Слайд 6

Линейная регрессия

Задача линейной регрессии заключается в нахождении коэффициентов уравнения линейной регрессии, которое

Линейная регрессия Задача линейной регрессии заключается в нахождении коэффициентов уравнения линейной регрессии,
имеет вид: y = b0 + b1 x1 + b2 x2 + ...+ bn xn ,
где y — выходная (зависимая) переменная модели;
x1, x2,…, xn — входные (независимые) переменные;
bi — коэффициенты линейной регрессии (b0 — свободный член).

Слайд 7

Задача линейной регрессии заключается в подборе коэффициентов bi уравнения таким образом, чтобы

Задача линейной регрессии заключается в подборе коэффициентов bi уравнения таким образом, чтобы
на заданный входной вектор X = (x1, x2,…, xn)T регрессионная модель формировала желаемое выходное значение y

Слайд 9

Линия регрессии — это прямая наилучшего приближения для набора пар значений входной

Линия регрессии — это прямая наилучшего приближения для набора пар значений входной и выходной переменной
и выходной переменной

Слайд 10

Логистическая регрессия

задачи предсказания вероятности некоторого события в зависимости от значений набора независимых

Логистическая регрессия задачи предсказания вероятности некоторого события в зависимости от значений набора
переменных
логистическая регрессия служит не для предсказания значений зависимой переменной, а для оценки вероятности того, что зависимая переменная примет заданное значение.

Слайд 13

Деревья решений

Методы, основанные на обучении

Деревья решений Методы, основанные на обучении

Слайд 14

Дерево решений — это древовидная иерархическая модель, где в каждом узле

Дерево решений — это древовидная иерархическая модель, где в каждом узле производится
производится проверка определенного атрибута (признака) с помощью правила
Деревья решений — иерархические древовидные структуры, состоящие из решающих правил вида «если… то…» и позволяющие выполнять классификацию объектов. В дереве каждому объекту соответствует единственный узел, дающий решение.

Слайд 15

Деревья решений — это модели, основанные на обучении. Процесс обучения сравнительно прост

Деревья решений — это модели, основанные на обучении. Процесс обучения сравнительно прост
в настройке и управлении.
Процесс обучения деревьев решений быстр и эффективен.
Деревья решений универсальны — способны решать задачи как классификации, так и регрессии.
Деревья решений обладают высокой объясняющей способностью и интерпретируемостью.

Слайд 16

Построение дерева

Описание атрибутов
Предварительное определение классов
Различимость классов
Полнота данных

Построение дерева Описание атрибутов Предварительное определение классов Различимость классов Полнота данных

Слайд 17

Структура дерева решений

Структура дерева решений

Слайд 18

Принцип «разделяй и властвуй»

2 3

Принцип «разделяй и властвуй» 2 3

Слайд 19

Искусственные нейронные сети

Методы, основанные на обучении

Искусственные нейронные сети Методы, основанные на обучении

Слайд 20

Искусственная нейронная сеть представляет собой параллельно-распределенную систему процессорных элементов (нейронов), способных выполнять

Искусственная нейронная сеть представляет собой параллельно-распределенную систему процессорных элементов (нейронов), способных выполнять
простейшую обработку данных, которая может настраивать свои параметры в ходе обучения на эмпирических данных. Накопленные знания нейронной сети сосредоточены в весах межэлементных связей.

Слайд 21

свойства нейронных сетей

Нелинейность.
Обучение на примерах
Параллельная обработка данных.
Адаптивность.
Отказоустойчивость.

свойства нейронных сетей Нелинейность. Обучение на примерах Параллельная обработка данных. Адаптивность. Отказоустойчивость.

Слайд 22

Входные данные хорошо интерпретируются
Желаемые результаты также хорошо интерпретируются
Доступный опыт

Входные данные хорошо интерпретируются Желаемые результаты также хорошо интерпретируются Доступный опыт

Слайд 23

Выбор числа нейронов в многослойном персептроне

Число нейронов во входном и выходном слоях

Выбор числа нейронов в многослойном персептроне Число нейронов во входном и выходном
жестко определяется числом входных и выходных переменных модели соответственно.
Число нейронов в скрытых слоях и число скрытых слоев выбираются таким образом, чтобы количество образованных ими связей было как минимум в два-три раза меньше числа обучающих примеров.
Имя файла: Data-Mining-классификация-и-регрессия.pptx
Количество просмотров: 311
Количество скачиваний: 2