Содержание
- 2. Бинарный линейный классификатор XN={(x1,y1),…, (xN,yN)}, xi∈ RP, yi ∈{-1,+1} Цель: каждый новый входной вектор x отнести
- 3. Примеры задач Data mining классификация – отнесение объекта к одной из категорий (классов) на основании его
- 4. Линейная модель классификации
- 5. Пример нелинейного разделения классов
- 6. Confusion matrix (матрица ошибок классификации)
- 7. Метрики качества классификации Доля правильных ответов: Малоинформативна в задачах с неравными классами. Пример. Допустим, мы хотим
- 8. Метрики качества классификации precision (точность) и recall (полнота). Precision показывает долю объектов, названных классификатором положительными и
- 9. AUC-ROC –площадь под кривой ошибок TPR - это полнота, а FPR показывает, какую долю из объектов
- 10. AUC-ROC –площадь под кривой ошибок В идеальном случае, когда классификатор не делает ошибок (FPR = 0,
- 11. Чувствительность и специфичность Наряду с FPR и TPR при оценке качества классификации используют также понятия чувствительности
- 12. Дерево решений Деревья решений - это метод, позволяющий предсказывать значения зависимой переменной в зависимости от соответствующих
- 13. Графическая иллюстрация нелинейного разделения классов На рисунки приведен пример классификации объектов по двум непрерывным признакам. Объекты,
- 14. Использование деревьев решений в задачах регрессии
- 15. Этапы построения дерева решений 1. Выбор критерия точности прогноза 2. Выбор типа ветвления 3. Определение момента
- 16. Выбор типа ветвления (criterion) Есть различные способы выбирать очередной признак для текущего ветвления: Алгоритм ID3, где
- 17. Энтропия Энтропия Шеннона для системы с s возможными состояниями:
- 18. Прирост информации (ID3)
- 19. Прогноз игры в футбол Первый вариант дерева Второй вариант дерева
- 20. Вычисление энтропии и прироста информации
- 21. Нормализованный прирост информации (C4.5)
- 22. Индекс Gini (CART)
- 23. Правила разбиения (CART)
- 24. Правила остановки Минимальное число объектов, при котором выполняется расщепление (min_samples_split). В этом варианте ветвление прекращается, когда
- 25. Механизм отсечения дерева (CART)
- 26. Иллюстрация переобучения
- 27. Случайный лес (Random forest) Случайный лес — алгоритм машинного обучения, заключающийся в использовании комитета (ансамбля) деревьев
- 28. Обучение случайного леса
- 30. Скачать презентацию