Содержание
- 2. Проблема несбалансированности Данные несбалансированы когда представители классов представлены не в приблизительном равном количестве (далее все рассматриваем
- 3. В чем проблема? Многие стандартные классификаторы пытаются увеличить точность и не изменить распределение обучающей выборки, поэтому
- 4. Цель классификации - детектирование Стоимость ошибки неправильно классифицировать ненормальный образец данных как нормальный много выше чем
- 5. Примеры несбалансированных данных: 1) из 100 000 тысяч подавших заявку, только 2% проходят в гарвард на
- 6. Техники работы с несбалансированными данными I. Работа с данными : SMOTE Random Undersampling Random Oversampling II.Чувствительность
- 7. Метрики качества Пусть есть два класса — отрицательный и положительный (меньший)
- 8. 1) Accuracy – для сбалансированных данных Процент правильно классифицированных образцов от всего числа образцов
- 9. 2) ROC кривая – для несбалансированных представляет границы лучших решений для относительных TP (по оси У)
- 11. AUC - площадь под ROC кривой . Она эквивалентна вероятности того что классификатор ценит произвольно выбранный
- 12. Для одной точки
- 13. Преимущества ROC Когда алгоритм изучает больше образцов одного (-) класса он будет ошибочно классифицировать больше образцов
- 14. Алгоритм SMOTE Считываем число образцов меньшего класса Т Процент генерируемых образцов N Число ближайших соседей k
- 15. SMOTE
- 17. Преимущества SMOTE Этот способ увеличения меньшего класса не приводит к переобучению (в отличие от random oversampling),
- 18. Модификации SMOTE для дискретных атрибутов образцов При вычислении атрибутов генерируемого образца для номинальных атрибутов значением будут
- 20. Скачать презентацию

















1_2_opredeliteli (1)
Тригонометрически уравнения
Презентация на тему ВТОРОЙ И ТРЕТИЙ ПРИЗНАКИ ПОДОБИЯ ТРЕУГОЛЬНИКОВ
Формулы для решения С2 координатно-векторным способом
Естественно-математическое ралли!!!!
Решение задач на проценты. Концентрация
Презентация по математике "Устные приемы вычисления и нумерация многозначных чисел" -
Случайные события. Вероятность случайного события
Skreschivayuschiesya_pr
Турнир имени Лоповка
Интегральное исчисление. Первообразная функция. Неопределённый интеграл
Предпосылки МНК для парной линейной регрессии. Тема 4
Теорема Пифагора
Тригонометрия. Контрольная работа
Производная сложной функции
Общее уравнение прямой и плоскости. Лекция1 (1)
Новогодняя викторина Я люблю математику. 3 тур Неразгаданные тайны
Сложение и вычитание чисел
Умножение одночленов. 7 класс
Задача дискретного логарифмирования и криптосистемы на ее основе
Подобные треугольники. 8 класс
Алгоритм решения квадратных неравенств
Наглядная геометрия
Преглед историје рачунарства
Приём вычислений вида 35 - 7. 2 класс
Прямая. Луч. Отрезок
Основные постулаты
Презентация на тему Равнобедренный треугольник