Содержание
- 2. Проблема несбалансированности Данные несбалансированы когда представители классов представлены не в приблизительном равном количестве (далее все рассматриваем
- 3. В чем проблема? Многие стандартные классификаторы пытаются увеличить точность и не изменить распределение обучающей выборки, поэтому
- 4. Цель классификации - детектирование Стоимость ошибки неправильно классифицировать ненормальный образец данных как нормальный много выше чем
- 5. Примеры несбалансированных данных: 1) из 100 000 тысяч подавших заявку, только 2% проходят в гарвард на
- 6. Техники работы с несбалансированными данными I. Работа с данными : SMOTE Random Undersampling Random Oversampling II.Чувствительность
- 7. Метрики качества Пусть есть два класса — отрицательный и положительный (меньший)
- 8. 1) Accuracy – для сбалансированных данных Процент правильно классифицированных образцов от всего числа образцов
- 9. 2) ROC кривая – для несбалансированных представляет границы лучших решений для относительных TP (по оси У)
- 11. AUC - площадь под ROC кривой . Она эквивалентна вероятности того что классификатор ценит произвольно выбранный
- 12. Для одной точки
- 13. Преимущества ROC Когда алгоритм изучает больше образцов одного (-) класса он будет ошибочно классифицировать больше образцов
- 14. Алгоритм SMOTE Считываем число образцов меньшего класса Т Процент генерируемых образцов N Число ближайших соседей k
- 15. SMOTE
- 17. Преимущества SMOTE Этот способ увеличения меньшего класса не приводит к переобучению (в отличие от random oversampling),
- 18. Модификации SMOTE для дискретных атрибутов образцов При вычислении атрибутов генерируемого образца для номинальных атрибутов значением будут
- 20. Скачать презентацию

















Случаи сложения вида +7
Презентация на тему Построение точек по заданным координатам
Признаки параллельности прямых
Решение логарифмических уравнений
Степень с натуральным показателем
Неполные квадратные уравнения
Многоугольники в нашей жизни
Метод координат
Тренажер. Единицы площади
Дом дружбы народов. II региональный турнир по ментальной арифметике. Ижевск 2018
Построение сечений тетраэдра
Условия неопределенности выбора. Ограниченная рациональность
Переміщення та його властивості
Решение транспортных задач линейного программирования
Проверка статистических гипотез
Модуль действительного числа. Решение уравнений с модулем
Геометрические фигуры
Сложение однозначных чисел с переходом через десяток вида + 8, +9
Решение неравенств с одной переменной
Прикладная математика. Лекция 1. Геометрический метод решения задачи линейного программирования
Обратные тригонометрические функции, их графики и формулы
Иррациональные неравенства
Векторы на плоскости и в пространстве
Решение функции
Презентация на тему Подобные треугольники
Белочка в стране Веселая математика (подготовительная группа)
Колесо истории математики
Задачи на клетке