Лаб1_ІАД_Коренга

Содержание

Слайд 2

ЗМІСТ

Що таке Data Mining
4 задачі Data Mining
Класифікація
Методи класифікації
Метод найближчого сусіда

ЗМІСТ Що таке Data Mining 4 задачі Data Mining Класифікація Методи класифікації Метод найближчого сусіда

Слайд 3

ЩО ТАКЕ DATA MINING

Data Mining – набір методів, алгоритмів та засобів необхідних

ЩО ТАКЕ DATA MINING Data Mining – набір методів, алгоритмів та засобів
для знаходження в даних корисної і доступної інформації, необхідних для прийняття рішень в різноманітних сферах людської діяльності.

Слайд 4

4 ЗАДАЧІ DATA MINING

Побудова асоціативних правил

Класифікація

Кластеризація

Регресія

4 ЗАДАЧІ DATA MINING Побудова асоціативних правил Класифікація Кластеризація Регресія

Слайд 5

КЛАСИФІКАЦІЯ

Класифікація – віднесення об’єктів, процесів чи явищ до наперед визначених класів на

КЛАСИФІКАЦІЯ Класифікація – віднесення об’єктів, процесів чи явищ до наперед визначених класів
основі значень їх характеристик (властивостей)

Задача класифікації

Знайти значення залежної змінної від значень характеристик об’єкта

Слайд 6

МЕТОДИ КЛАСИФІКАЦІЇ

Класифікація за допомогою дерев рішень;
Байєсова (“наївна”) класифікація;
Класифікація за допомогою штучних нейронних

МЕТОДИ КЛАСИФІКАЦІЇ Класифікація за допомогою дерев рішень; Байєсова (“наївна”) класифікація; Класифікація за
мереж;
Класифікація методом опорних векторів;
Статистичні методи, зокрема, лінійна регресія;
Класифікація за допомогою методу найближчого сусіда;
Класифікація CBR-методом;
Класифікація за допомогою генетичних алгоритмів.
Класифікація за допомогою дерев рішень

Слайд 7

МЕТОД НАЙБЛИЖЧОГО СУСІДА

Метод побудований на знаходженні найкоротшої відстані між об’єктами. Для цього

МЕТОД НАЙБЛИЖЧОГО СУСІДА Метод побудований на знаходженні найкоротшої відстані між об’єктами. Для
використовують формулу Евклідової відстані:

 

Відповідно до методу потрібно знайти відстань від усіх вже класифікованих об’єктів до об’єкту, який потрібно класифікувати. Хто найближче – тому присвоюється той самий клас

Слайд 8

МЕТОД НАЙБЛИЖЧОГО СУСІДА

Сформуємо наступну вибірку даних

МЕТОД НАЙБЛИЖЧОГО СУСІДА Сформуємо наступну вибірку даних

Слайд 9

МЕТОД НАЙБЛИЖЧОГО СУСІДА

Переведемо стовбець «Кредитна історія» у чисельний формат

МЕТОД НАЙБЛИЖЧОГО СУСІДА Переведемо стовбець «Кредитна історія» у чисельний формат

Слайд 10

МЕТОД НАЙБЛИЖЧОГО СУСІДА

Використаємо формулу Евклідової відстані для визначення відстані від шуканого об’єкта

МЕТОД НАЙБЛИЖЧОГО СУСІДА Використаємо формулу Евклідової відстані для визначення відстані від шуканого
до всіх інших. Для класифікації нам потрібні 2 дві властивості – кредитна історія та місячний дохід

 

1

2

 

3

 

9

 

. . .

Слайд 11

МЕТОД НАЙБЛИЖЧОГО СУСІДА

Запишемо відстані між даними і визначимо найближчих сусідів

МЕТОД НАЙБЛИЖЧОГО СУСІДА Запишемо відстані між даними і визначимо найближчих сусідів

Слайд 12

МЕТОД НАЙБЛИЖЧОГО СУСІДА

Отже можемо видати кредит даному клієнту (віднести його до класу

МЕТОД НАЙБЛИЖЧОГО СУСІДА Отже можемо видати кредит даному клієнту (віднести його до
клієнтів з одобреними кредитами)

Маємо два найближчих сусіда

Слайд 13

МЕТОД НАЙБЛИЖЧОГО СУСІДА

Намалюємо графічне представлення вибірки з відстаннями

МЕТОД НАЙБЛИЖЧОГО СУСІДА Намалюємо графічне представлення вибірки з відстаннями