Содержание

Слайд 2

Медицинские данные

Результаты медико-биологических исследований – большое количество данных различного характера
Результаты лабораторных исследований;
Социально-паспортные

Медицинские данные Результаты медико-биологических исследований – большое количество данных различного характера Результаты
и антропометрические данные;
Факторы риска;
Данные медицинских приборно-компьютерных систем.

Слайд 3

Анализ медицинских данных

Статистические методы
Методы, основанные на знаниях
«Раскопка данных» (Data Mining)
Экспертные системы

Data Mining

Анализ медицинских данных Статистические методы Методы, основанные на знаниях «Раскопка данных» (Data
«Раскопка данных»
поиск (неочевидных) закономерностей в данных
обнаружение скрытых знаний

Слайд 4

Статистические методы

Статистические методы

Слайд 5

Согласованность с нормальным законом распределения

Согласованность с нормальным законом распределения

Слайд 6

Корреляционный анализ

r-коэффициент корреляции

Pearson
ранговые:
ρ Spearman
τ Kendall

Корреляционный анализ r-коэффициент корреляции Pearson ранговые: ρ Spearman τ Kendall

Слайд 7

Гармонизированный анализ

Гармонизированный анализ

Слайд 8

Нестатистические методы: «раскопка данных»

Обучающая выборка

Нестатистические методы: «раскопка данных» Обучающая выборка

Слайд 9

Кластеризация (обучение без учителя)

Кластеризация предназначена для разбиения совокупности объектов на однородные группы —кластеры.

Кластеризация (обучение без учителя) Кластеризация предназначена для разбиения совокупности объектов на однородные

Цель кластеризации  — построить оптимальное разбиение объектов на группы: разбить N объектов на k кластеров.

Характеристиками кластера можно назвать два признака:
внутренняя однородность;
внешняя изолированность.

Непересекающиеся и пересекающиеся кластеры

Слайд 10

Разделить образцы на k групп (классов) автоматически, без информации о настоящем классе

Разделить образцы на k групп (классов) автоматически, без информации о настоящем классе
образца

Выбрать начальное положение центров классов

Сгруппировать образцы по принципу близости к центрам

Вычислить новые положения центров

Повторить шаги 2 и 3 до схождения алгоритма

Кластеризация. K-means

Слайд 11

Классификация (обучение с учителем)

Цель классификации:
отнести имеющиеся статические образцы (например, данные медосмотра)

Классификация (обучение с учителем) Цель классификации: отнести имеющиеся статические образцы (например, данные
к определенному классу (например, диагнозу).

Методы:
Классификатор Байеса
Дерево решений
Нейронная сеть
Метод k ближайших соседей

Слайд 12

Классификация

25 пациентов, перенесших ишемический инсульт; 44 показателя
Факторы риска
ишемическая болезнь сердца
артериальная гипертензия
сахарный диабет
курение

Классифицирующий

Классификация 25 пациентов, перенесших ишемический инсульт; 44 показателя Факторы риска ишемическая болезнь
признак: патогенетический тип инсульта
кардиоэмболический
некардиоэмболический (атеротромботический, лакунарный, криптогенный, гемореонологический)
Другие признаки
применяемые препараты
шкала NIHSS (National Institutes of Health Stroke Scale)

Слайд 13

Наивный классификатор Байеса

Классификатор Байеса—вероятностный классификатор, основанный на применении Теоремы Байеса со строгими

Наивный классификатор Байеса Классификатор Байеса—вероятностный классификатор, основанный на применении Теоремы Байеса со
(наивными) предположениями о независимости.
Достоинством данного классификатора является малое количество данных для обучения, необходимых для оценки параметров, требуемых для классификации.

Слайд 14

Наивный классификатор Байеса

Формула Байеса для совместной вероятности

И тогда

Наивный классификатор Байеса Формула Байеса для совместной вероятности И тогда

Слайд 15

Нейронные сети

При обучении сети предлагаются различные образцы образов с указанием того, к

Нейронные сети При обучении сети предлагаются различные образцы образов с указанием того,
какому классу они относятся. Образец, как правило, представляется как вектор значений признаков. При этом совокупность всех признаков должна однозначно определять класс, к которому относится образец

Слайд 16

Нейронные сети

Чем сильнее связь между нейронами тем более четкой линией она отображается,

Нейронные сети Чем сильнее связь между нейронами тем более четкой линией она
чем слабее — тем линия прозрачнее

Слайд 17

Нейронные сети, изучение космических снимков

Нейронные сети, изучение космических снимков

Слайд 18

Дерево решений

Деревья принятия решений- это дерево, на ребрах которого записаны атрибуты, от

Дерево решений Деревья принятия решений- это дерево, на ребрах которого записаны атрибуты,
которых зависит целевая функция, в листьях записаны значения целевой функции, а в остальных узлах — атрибуты, по которым различаются случаи.

Слайд 19

Метод k ближайших соседей

Метод k ближайших соседей (англ. k-nearest neighbor algorithm, kNN) -

Метод k ближайших соседей Метод k ближайших соседей (англ. k-nearest neighbor algorithm,
метод автоматической классификации объектов.
Основным принципом метода ближайших соседей является то, что объект присваивается тому классу, который является наиболее распространённым среди соседей данного элемента.
Соседи берутся исходя из множества объектов, классы которых уже известны, и, исходя из ключевого для данного метода значения k высчитывается, какой класс наиболее многочислен среди них.

Слайд 20

Сравнение классификации и кластеризации

Сравнение классификации и кластеризации

Слайд 21

Бесплатный Data Miner: RapidMiner

Бесплатный Data Miner: RapidMiner

Слайд 22

Репозиторий и загрузка данных

Репозиторий и загрузка данных

Слайд 23

Определение видов и типов данных

Определение видов и типов данных

Слайд 24

Создание алгоритма анализа данных из блоков

Создание алгоритма анализа данных из блоков

Слайд 25

Построение и X-валидация

Построение и X-валидация

Слайд 26

Результат – точность классификации

Результат – точность классификации

Слайд 27

Результат запуска: построенный классификатор

Результат запуска: построенный классификатор

Слайд 28

Экспертные системы

База знаний
(правил)

Механизм вывода

База данных
(фактов)

Экспертные системы База знаний (правил) Механизм вывода База данных (фактов)

Слайд 29

Интеллектуальная медицинская информационная система

Интеллектуальная медицинская информационная система

Слайд 30

Изображение,
полученное
с микровизора

Показатель
степени МКБ

Число кристаллов
в пограничной зоне

Диагностика мочекаменной болезни

Изображение, полученное с микровизора Показатель степени МКБ Число кристаллов в пограничной зоне Диагностика мочекаменной болезни
Имя файла: Data-Mining.pptx
Количество просмотров: 164
Количество скачиваний: 0