Содержание
- 2. НАБОР ДАННЫХ Набор данных в большинстве задач представляет собой таблицу, в которой строки являются объектами наблюдения,
- 3. ЗАДАЧА КЛАССИФИКАЦИИ Всё множество объектов наблюдения Ω разделено на L классов {Ωl}, так что классы не
- 4. ОТБОР ПРИЗНАКОВ Векторы U(i, :) (строки таблицы) представляют собой точки в m-мерном признаковом пространстве. Отбор признаков
- 5. ИРИСЫ ФИШЕРА
- 6. ПОСТАНОВКА ЗАДАЧИ ОТБОРА ПРИЗНАКОВ Решить задачу отбора признаков – значит выбрать множество признаков так чтобы некоторый
- 7. КЛАССИФИКАЦИЯ АЛГОРИТМОВ ОТБОРА ПРИЗНАКОВ По характеру показателя качества признакового пространства J: Обёртки (wrappers) – методы отбора
- 8. ПОКАЗАТЕЛИ КАЧЕСТВА КЛАССИФИКАЦИИ Матрица ошибок (Confusion Matrix) Достоверность классификации (accuracy): – контрольная выборка Чувствительность (sensitivity, recall):
- 9. ПОКАЗАТЕЛИ КАЧЕСТВА ПРИЗНАКОВОГО ПРОСТРАНСТВА Матрица рассеяния внутри класса l: где – часть обучающей выборки из класса
- 10. ПОКАЗАТЕЛИ КАЧЕСТВА ПРИЗНАКОВОГО ПРОСТРАНСТВА Критерии дискриминантного анализа: Другие способы выбора внутриклассовой матрицы рассеяния: Другие способы выбора
- 11. ПОКАЗАТЕЛИ КАЧЕСТВА ПРИЗНАКОВОГО ПРОСТРАНСТВА Взаимная информация (mutual information): X – признаки случайного объекта, Y – класс
- 12. КЛАССИФИКАЦИЯ АЛГОРИТМОВ ОТБОРА ПРИЗНАКОВ По способу перебора подмножеств признаков: Жадные алгоритмы отбора признаков Упорядочение и отбор
- 13. УПОРЯДОЧЕНИЕ И ОТБОР ПРИЗНАКОВ Входные данные: количество признаков k, обучающая выборка U, показатель качества J Выходные
- 14. ЖАДНЫЕ АЛГОРИТМЫ ОТБОРА ПРИЗНАКОВ Входные данные: количество признаков k, обучающая выборка U, показатель качества J Выходные
- 15. ЖАДНЫЕ АЛГОРИТМЫ ОТБОРА ПРИЗНАКОВ Модификации жадных алгоритмов могут быть основаны на их комбинировании. – шаг вперёд
- 16. КЛАСТЕРИЗАЦИЯ Кластеризация (clustering) – это процедура разбиения множества векторов признаков в метрическом признаковом пространстве на непересекающиеся
- 17. КЛАСТЕРИЗАЦИЯ ПРИЗНАКОВ Входные данные: количество признаков k, обучающая выборка U, расстояние между признаками ρ Выходные данные:
- 18. ГЕНЕТИЧЕСКИЙ АЛГОРИТМ Генетический алгоритм (genetic algorithm) – это эвристический алгоритм оптимизации, основанный на использовании таких механизмов
- 19. ГЕНЕТИЧЕСКИЙ АЛГОРИТМ ОТБОРА ПРИЗНАКОВ Входные данные: количество признаков k, обучающая выборка U, показатель качества J Выходные
- 20. ОТБОР ПРИЗНАКОВ И ТЕОРИЯ ГРАФОВ Рассмотрим граф: вершины – подмножества признаков, рёбра – близкие между собой
- 21. СПИСОК ЛИТЕРАТУРЫ Guyon, I. An Introduction to Variable and Feature Selection / I. Guyon, A. Elisseeff
- 22. ЗАКЛЮЧЕНИЕ Когда подбор параметров классификатора уже не помогает повысить эффективность классификации, отбор признаков в некоторых случаях
- 24. Скачать презентацию