Содержание
- 2. Алгоритм C4.5 Усовершенствование простого алгоритма индуцирования знаний. Основнoе отличие: следующий условный атрибут, по которому проводится разбиение,
- 3. Общее описание алгоритма C4.5 Алгоритм работает для таких таблиц данных, в которых атрибут класса (целевой атрибут)
- 4. Общее описание алгоритма C4.5 (продолжение) Обозначения (продолжение) |T | — мощность множества примеров (количество строк в
- 5. Общее описание алгоритма C4.5 (окончание) Обозначения (окончание) A1 , A2 , …, AN — значения, принима-емые
- 6. Выбор условного атрибута для разбиения Пусть рассматриваем условный атрибут X, принимающий n значений A1, A2 ...
- 7. Выбор условного атрибута для разбиения (продолжение) Тогда вероятность того, что случайно выбранная строка из таблицы T
- 8. Выбор условного атрибута для разбиения (продолжение) Согласно теории информации, количество содержащейся в сообщении информации зависит от
- 9. Выбор условного атрибута для разбиения (продолжение) Энтропия таблицы T, то есть среднее количество информации, необходимое для
- 10. Выбор условного атрибута для разбиения (продолжение) Энтропия таблицы T после её разбиения по атрибуту X на
- 11. Выбор условного атрибута для разбиения (окончание) Критерий для выбора атрибута X – следующего атрибута для разбиения:
- 13. Скачать презентацию