Методы «раскопки данных» — Data Mining

Февраль 11, 2021

Главная
Разное
Методы «раскопки данных» — Data Mining

Содержание

2. Медицинские данные Результаты медико-биологических исследований – большое количество данных различного характера Результаты лабораторных исследований; Социально-паспортные и
3. Анализ медицинских данных Статистические методы Методы, основанные на знаниях «Раскопка данных» (Data Mining) Экспертные системы Data
4. Статистические методы
5. Согласованность с нормальным законом распределения
6. Корреляционный анализ R-коэффициент корреляции Spearman Pearson Kendall
7. Гармонизированный анализ
8. Нестатистические методы: «раскопка данных» Обучающая выборка
9. Кластеризация Кластеризация предназначена для разбиения совокупности объектов на однородные группы (кластеры или классы). Цель кластеризации -
10. Разделить образцы на k групп (классов) автоматически, без информации о настоящем классе образца Выбрать начальное положение
11. Классификация
12. Задача классификации Цель классификации: необходимо отнести имеющиеся статические образцы (данные медосмотра) к определенному классу. Методы: Классификатор
13. Классификация 25 пациентов, перенесших ишемический инсульт; 44 показателя Факторы риска ишемическая болезнь сердца артериальная гипертензия сахарный
14. Классификатор Байеса Классификатор Байеса—вероятностный классификатор, основанный на применении Теоремы Байеса со строгими (наивными) предположениями о независимости.
15. Нейронные сети При обучении сети предлагаются различные образцы образов с указанием того, к какому классу они
16. Дерево решений Деревья принятия решений- это дерево, на ребрах которого записаны атрибуты, от которых зависит целевая
17. Метод k ближайших соседей Метод k ближайших соседей (англ. k-nearest neighbor algorithm, kNN) - метод автоматической
18. Сравнение классификации и кластеризации
19. Бесплатный Data Miner: RapidMiner
20. Результат запуска: построенный классификатор
21. Экспертные системы База знаний (правил) Механизм вывода База данных (фактов)
22. Интеллектуальная медицинская информационная система
23. Изображение, полученное с микровизора Показатель степени МКБ Число кристаллов в пограничной зоне Диагностика мочекаменной болезни
25. Скачать презентацию

Медицинские данные
Результаты медико-биологических исследований – большое количество данных различного характера
Результаты лабораторных исследований;
Социально-паспортные

и антропометрические данные;
Факторы риска;
Данные медицинских приборно-компьютерных систем.

Анализ медицинских данных
Статистические методы
Методы, основанные на знаниях
«Раскопка данных» (Data Mining)
Экспертные системы
Data Mining

«Раскопка данных»
поиск (неочевидных) закономерностей в данных
обнаружение скрытых знаний

Статистические методы

Согласованность с нормальным законом распределения

Корреляционный анализ
R-коэффициент корреляции
Spearman
Pearson
Kendall

Гармонизированный анализ

Нестатистические методы: «раскопка данных»
Обучающая выборка

Кластеризация
Кластеризация предназначена для разбиения совокупности объектов на однородные группы (кластеры или классы).
Цель кластеризации - поиск

существующих структур.

Характеристиками кластера можно назвать два признака:
внутренняя однородность;
внешняя изолированность.

Непересекающиеся и пересекающиеся кластеры

Разделить образцы на k групп (классов) автоматически, без информации о настоящем классе

образца

Выбрать начальное положение центров классов

Сгруппировать образцы по принципу близости к центрам

Вычислить новые положения центров

Повторить шаги 2 и 3 до схождения алгоритма

Кластеризация. K-means

Классификация

Задача классификации
Цель классификации:
необходимо отнести имеющиеся статические образцы (данные медосмотра) к определенному

классу.

Методы:
Классификатор Байеса
Дерево решений
Нейронная сеть
Метод k ближайших соседей

Классификация
25 пациентов, перенесших ишемический инсульт; 44 показателя
Факторы риска
ишемическая болезнь сердца
артериальная гипертензия
сахарный диабет
курение
…
Классифицирующий

признак: патогенетический тип инсульта
кардиоэмболический
некардиоэмболический (атеротромботический, лакунарный, криптогенный, гемореонологический)
Другие признаки
применяемые препараты
шкала NIHSSI

Классификатор Байеса
Классификатор Байеса—вероятностный классификатор, основанный на применении Теоремы Байеса со строгими (наивными)

предположениями о независимости.
Достоинством данного классификатора является малое количество данных для обучения, необходимых для оценки параметров, требуемых для классификации.

Нейронные сети
При обучении сети предлагаются различные образцы образов с указанием того, к

какому классу они относятся. Образец, как правило, представляется как вектор значений признаков. При этом совокупность всех признаков должна однозначно определять класс, к которому относится образец

Дерево решений
Деревья принятия решений- это дерево, на ребрах которого записаны атрибуты, от

которых зависит целевая функция, в листьях записаны значения целевой функции, а в остальных узлах — атрибуты, по которым различаются случаи.

Метод k ближайших соседей
Метод k ближайших соседей (англ. k-nearest neighbor algorithm, kNN) -

метод автоматической классификации объектов.
Основным принципом метода ближайших соседей является то, что объект присваивается тому классу, который является наиболее распространённым среди соседей данного элемента.
Соседи берутся исходя из множества объектов, классы которых уже известны, и, исходя из ключевого для данного метода значения k высчитывается, какой класс наиболее многочислен среди них.

Методы «раскопки данных» — Data Mining

Содержание

Анализ медицинских данныхСтатистические методыМетоды, основанные на знаниях«Раскопка данных» (Data Mining)Экспертные системыData Mining

Статистические методы

Согласованность с нормальным законом распределения

Корреляционный анализR-коэффициент корреляцииSpearmanPearsonKendall

Гармонизированный анализ

Нестатистические методы: «раскопка данных»Обучающая выборка

КластеризацияКластеризация предназначена для разбиения совокупности объектов на однородные группы (кластеры или классы). Цель кластеризации - поиск

Разделить образцы на k групп (классов) автоматически, без информации о настоящем классе

Классификация

Задача классификацииЦель классификации: необходимо отнести имеющиеся статические образцы (данные медосмотра) к определенному

Классификатор БайесаКлассификатор Байеса—вероятностный классификатор, основанный на применении Теоремы Байеса со строгими (наивными)

Нейронные сетиПри обучении сети предлагаются различные образцы образов с указанием того, к

Дерево решенийДеревья принятия решений- это дерево, на ребрах которого записаны атрибуты, от

Метод k ближайших соседей Метод k ближайших соседей (англ. k-nearest neighbor algorithm, kNN) -

Сравнение классификации и кластеризации

Бесплатный Data Miner: RapidMiner

Результат запуска: построенный классификатор

Экспертные системыБаза знаний(правил)Механизм выводаБаза данных(фактов)

Интеллектуальная медицинская информационная система

Изображение, полученноес микровизораПоказательстепени МКБЧисло кристалловв пограничной зонеДиагностика мочекаменной болезни

Похожие презентации