Слайд 32)Установка RapidMiner. Установка компонентов textMining
https://rapidminer.com/get-started/
![2)Установка RapidMiner. Установка компонентов textMining https://rapidminer.com/get-started/](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/1135016/slide-2.jpg)
Слайд 43) Использование компоненты- Process Dociment from files и различных фильтров (минимум-3).
![3) Использование компоненты- Process Dociment from files и различных фильтров (минимум-3).](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/1135016/slide-3.jpg)
Слайд 64) Проведение кластеризации документов
![4) Проведение кластеризации документов](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/1135016/slide-5.jpg)
Слайд 85) Численная оценка качества алгоритма
(точность, полнота, F-мера)
![5) Численная оценка качества алгоритма (точность, полнота, F-мера)](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/1135016/slide-7.jpg)
Слайд 9Точность и полнота
TP— истино-положительное решение;
TN — истино-отрицательное решение;
FP — ложно-положительное решение;
FN — ложно-отрицательное решение.
![Точность и полнота TP— истино-положительное решение; TN — истино-отрицательное решение; FP —](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/1135016/slide-8.jpg)
Слайд 10Пример (наглядность)
TP
FP
FN
Результат метода
![Пример (наглядность) TP FP FN Результат метода](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/1135016/slide-9.jpg)
Слайд 12F-мера
Где β принимает значения в диапазоне 0 <β <1, если Вы хотите
![F-мера Где β принимает значения в диапазоне 0 а при β> 1](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/1135016/slide-11.jpg)
отдать приоритет точности,
а при β> 1 приоритет отдается полноте.
При β=1 формула сводится к предыдущей и вы получаете сбалансированную F-меру (также ее называют F1)