Содержание
- 2. Проблема несбалансированности Данные несбалансированы когда представители классов представлены не в приблизительном равном количестве (далее все рассматриваем
- 3. В чем проблема? Многие стандартные классификаторы пытаются увеличить точность и не изменить распределение обучающей выборки, поэтому
- 4. Цель классификации - детектирование Стоимость ошибки неправильно классифицировать ненормальный образец данных как нормальный много выше чем
- 5. Примеры несбалансированных данных: 1) из 100 000 тысяч подавших заявку, только 2% проходят в гарвард на
- 6. Техники работы с несбалансированными данными I. Работа с данными : SMOTE Random Undersampling Random Oversampling II.Чувствительность
- 7. Метрики качества Пусть есть два класса — отрицательный и положительный (меньший)
- 8. 1) Accuracy – для сбалансированных данных Процент правильно классифицированных образцов от всего числа образцов
- 9. 2) ROC кривая – для несбалансированных представляет границы лучших решений для относительных TP (по оси У)
- 11. AUC - площадь под ROC кривой . Она эквивалентна вероятности того что классификатор ценит произвольно выбранный
- 12. Для одной точки
- 13. Преимущества ROC Когда алгоритм изучает больше образцов одного (-) класса он будет ошибочно классифицировать больше образцов
- 14. Алгоритм SMOTE Считываем число образцов меньшего класса Т Процент генерируемых образцов N Число ближайших соседей k
- 15. SMOTE
- 17. Преимущества SMOTE Этот способ увеличения меньшего класса не приводит к переобучению (в отличие от random oversampling),
- 18. Модификации SMOTE для дискретных атрибутов образцов При вычислении атрибутов генерируемого образца для номинальных атрибутов значением будут
- 20. Скачать презентацию

















Окружность. Методическая разработка урока
Задания по математике (2 класс)
Линейные пространства и линейные операторы. Лекция 3
Мир занимательных наук. Математический клуб
Случаи сложения вида +7
Центральные углы и углы, вписанные в окружность
Перпендикулярные прямые
Корень n - ой степени
Презентация на тему Тетраэдр и параллелепипед
Среднее арифметическое. Среднее значение величины
Математический тренажер. Двузначное число
Решение задач по теме Треугольники. 7 класс
Презентация на тему Решение неравенств. Найди ошибку
Решение задач с помощью квадратных уравнений
Производная произведения двух функций
Презентация на тему Первое знакомство с вероятностью
Интерактивный тренажёр Реши уравнения
Решение тригонометрических уравнений
Понятие функции
Сложение чисел с разными знаками
Решение задач на нахождение слагаемого
Статистический анализ случайных погрешностей
Средние величины
Бастапқы математикалық көріністерді қалыптастыру
Задачи на расстояние
Треугольник. Высота в треугольнике
Пирамида
Векторный анализ