Практическое задание по анализу данных

Слайд 2

1)Подготовка данных

1)Подготовка данных

Слайд 3

2)Установка RapidMiner.  Установка компонентов textMining 

https://rapidminer.com/get-started/

2)Установка RapidMiner. Установка компонентов textMining https://rapidminer.com/get-started/

Слайд 4

3) Использование компоненты- Process Dociment from files и различных фильтров (минимум-3).   

3) Использование компоненты- Process Dociment from files и различных фильтров (минимум-3).

Слайд 6

4) Проведение кластеризации документов

4) Проведение кластеризации документов

Слайд 8

5) Численная оценка качества алгоритма

(точность, полнота, F-мера)

5) Численная оценка качества алгоритма (точность, полнота, F-мера)

Слайд 9

Точность и полнота

TP— истино-положительное решение;
TN — истино-отрицательное решение;
FP — ложно-положительное решение;
FN — ложно-отрицательное решение.

Точность и полнота TP— истино-положительное решение; TN — истино-отрицательное решение; FP —

Слайд 10

Пример (наглядность)

TP

FP

FN

Результат метода

Пример (наглядность) TP FP FN Результат метода

Слайд 11

Точность и полнота

Точность и полнота

Слайд 12

F-мера

Где β принимает значения в диапазоне 0 <β <1, если Вы хотите

F-мера Где β принимает значения в диапазоне 0 а при β> 1
отдать приоритет точности,
а при β> 1 приоритет отдается полноте.
При β=1 формула сводится к предыдущей и вы получаете сбалансированную F-меру (также ее называют F1)
Имя файла: Практическое-задание-по-анализу-данных.pptx
Количество просмотров: 29
Количество скачиваний: 0