Содержание
- 2. Проблема несбалансированности Данные несбалансированы когда представители классов представлены не в приблизительном равном количестве (далее все рассматриваем
- 3. В чем проблема? Многие стандартные классификаторы пытаются увеличить точность и не изменить распределение обучающей выборки, поэтому
- 4. Цель классификации - детектирование Стоимость ошибки неправильно классифицировать ненормальный образец данных как нормальный много выше чем
- 5. Примеры несбалансированных данных: 1) из 100 000 тысяч подавших заявку, только 2% проходят в гарвард на
- 6. Техники работы с несбалансированными данными I. Работа с данными : SMOTE Random Undersampling Random Oversampling II.Чувствительность
- 7. Метрики качества Пусть есть два класса — отрицательный и положительный (меньший)
- 8. 1) Accuracy – для сбалансированных данных Процент правильно классифицированных образцов от всего числа образцов
- 9. 2) ROC кривая – для несбалансированных представляет границы лучших решений для относительных TP (по оси У)
- 11. AUC - площадь под ROC кривой . Она эквивалентна вероятности того что классификатор ценит произвольно выбранный
- 12. Для одной точки
- 13. Преимущества ROC Когда алгоритм изучает больше образцов одного (-) класса он будет ошибочно классифицировать больше образцов
- 14. Алгоритм SMOTE Считываем число образцов меньшего класса Т Процент генерируемых образцов N Число ближайших соседей k
- 15. SMOTE
- 17. Преимущества SMOTE Этот способ увеличения меньшего класса не приводит к переобучению (в отличие от random oversampling),
- 18. Модификации SMOTE для дискретных атрибутов образцов При вычислении атрибутов генерируемого образца для номинальных атрибутов значением будут
- 20. Скачать презентацию

















Подготовка к зачёту на тему Дроби
Презентация на тему АЛГЕБРАИЧЕСКИЕ УРАВНЕНИЯ ПРОИЗВОЛЬНЫХ СТЕПЕНЕЙ
Интегрирование тригонометрических функций
Построение диаграмм и графиков
Веселое путешествие
Признаки параллельности прямых
Презентация на тему Вневписанная окружность
Переместительное свойство умножения
Математический кроссворд
Сравнение многозначных чисел. 4 класс
Круг, окружность, длина и площадь окружности
Различия между разными вариантами технологического процесса. Последовательный анализ
Цветочное настроение (порядковый счет)
ЦАРСКОЙ ДОРОГИ В МАТЕМАТИКЕ НЕТ.
Таблицы и диаграммы. Чтение и составление таблиц
Планиметрия. От углов до многоугольников. Повторение материала
Тригонометрия. Меры углов. Определения синуса, косинуса, тангенса, котангенса
Вычисление неопределенных интегралов методом интегрирования по частям
Рисуем параллелепипед
Таблица умножения числа 2 и на 2
Функция нескольких переменных. Общие свойства. Непрерывность функции. Линии уровня, поверхности уровня. (Семинар 21)
Путешествие в страну Эколандию
Лабораторная работа №2. Вычисление геодезических координат по прямоугольным координатам Гаусса-Крюгера
Несобственные интегралы второго рода
Сложение и вычитание многозначных чисел
Метод контрольных вопросов
Усный счёт Заселяем домики
Принцип Дирихле