Введение в биостатистику

Содержание

Слайд 2

В медицине и здравоохранении часто используются, сознательно или неосознанно, различные статистические концепции

В медицине и здравоохранении часто используются, сознательно или неосознанно, различные статистические концепции
при принятии решений по таким вопросам как:
- оценка состояния здоровья и его прогноз;
- выбор стратегии и тактики профилактики и лечения;
- оценка отдаленных результатов и выживаемости.

Слайд 3

Статистика!!!

…..НУ И ЧТО?

Статистика!!! …..НУ И ЧТО?

Слайд 4

СТАТИСТИКА
- это инструмент для анализа экспериментальных данных и результатов популяционных исследований;
- это

СТАТИСТИКА - это инструмент для анализа экспериментальных данных и результатов популяционных исследований;
язык с помощью которого исследователь сообщает полученные им результаты и благодаря которому он понимает медико-статистическую информацию;
- это элемент доказательной медицины;
- это база обоснования принятия управленческих решений.

Слайд 5

СТАТИСТИКА
Наука, изучающая количественные закономерности материальных явлений в неразрывной связи с их качественной

СТАТИСТИКА Наука, изучающая количественные закономерности материальных явлений в неразрывной связи с их
стороной.
Точная наука, изучающая методы сбора, обработки, систематизации, анализа и интерпретации данных, которые описывают массовые действия, явления и процессы.
(от лат. status — состояние дел) наука, сочетающая учет и анализ, фиксирующая, систематизирующая и изучающая показатели наиболее типичных, массовых экономических процессов и их изменение во времени.

Слайд 6

БИОСТАТИСТИКА
приложение общей теории статистики для решения научно-практических проблем в области биологии, медицины

БИОСТАТИСТИКА приложение общей теории статистики для решения научно-практических проблем в области биологии, медицины и здравоохранения.
и здравоохранения.

Слайд 7

СТАТИСТИКА (Statistics)- наука о сборе, представлении и анализе данных.
БИОСТАТИСТИКА - статистическая наука

СТАТИСТИКА (Statistics)- наука о сборе, представлении и анализе данных. БИОСТАТИСТИКА - статистическая
(statistics) в приложении к живому миру. Включает в себя демографию, эпидемиологию и организацию клинических испытаний. Синоним - биометрия.
Oxford Dictionary of Statistics, 2002

Слайд 8

ВЕРОЯТНОСТЬ
количественная мера объективной возможности появления события при реализации определенного комплекса условий.
Вероятность события

ВЕРОЯТНОСТЬ количественная мера объективной возможности появления события при реализации определенного комплекса условий.
А обозначается как р(А) и выражается в долях единицы или в процентах.
Мера вероятности – диапазон ее числовых значений: от 0 до 1 или от 0 до 100%.

Слайд 9

ДИЛЕММА НЕРЕШИТЕЛЬНОГО ВЛЮБЛЕННОГО

МИСС А

МИСС B

МИСТЕР Z

ДИЛЕММА НЕРЕШИТЕЛЬНОГО ВЛЮБЛЕННОГО МИСС А МИСС B МИСТЕР Z

Слайд 10

ГЛАВНАЯ СТАНЦИЯ

ОФИС МИСТЕРА Z

Станция мисс В

Станция мисс А

ГЛАВНАЯ СТАНЦИЯ ОФИС МИСТЕРА Z Станция мисс В Станция мисс А

Слайд 11

ГЛАВНАЯ СТАНЦИЯ

ОФИС МИСТЕРА Z

Станция мисс В

Станция мисс А

ГЛАВНАЯ СТАНЦИЯ ОФИС МИСТЕРА Z Станция мисс В Станция мисс А

Слайд 12

ГЛАВНАЯ СТАНЦИЯ

ОФИС МИСТЕРА Z

Станция мисс В

Станция мисс А

Другие станции

Другие станции

ГЛАВНАЯ СТАНЦИЯ ОФИС МИСТЕРА Z Станция мисс В Станция мисс А Другие станции Другие станции

Слайд 13

СЛУЧАЙНОЕ СОБЫТИЕ
событие, которое при реализации определенного комплекса условий может произойти или не

СЛУЧАЙНОЕ СОБЫТИЕ событие, которое при реализации определенного комплекса условий может произойти или
произойти.
Его вероятность будет находиться в пределах 0<р(А)<1 или 0<р(А)<100%.

Слайд 14

ДОСТОВЕРНОЕ СОБЫТИЕ
событие, которое при реализации определенного комплекса условий произойдет непременно.
Его вероятность будет

ДОСТОВЕРНОЕ СОБЫТИЕ событие, которое при реализации определенного комплекса условий произойдет непременно. Его
равна 1 или 100%.

Слайд 15

НЕВОЗМОЖНОЕ СОБЫТИЕ
событие, которое при реализации определенного комплекса условий не произойдет никогда.
Его вероятность

НЕВОЗМОЖНОЕ СОБЫТИЕ событие, которое при реализации определенного комплекса условий не произойдет никогда.
будет равна 0.

Слайд 16

ЧАСТОТА ПОЯВЛЕНИЯ СОБЫТИЯ
(СТАТИСТИЧЕСКАЯ ВЕРОЯТНОСТЬ)
это отношение числа случаев, в которых реализовался определенный

ЧАСТОТА ПОЯВЛЕНИЯ СОБЫТИЯ (СТАТИСТИЧЕСКАЯ ВЕРОЯТНОСТЬ) это отношение числа случаев, в которых реализовался
комплекс условий (m), к общему числу случаев (n):
p(A)=m/n
Вероятность события: q=1-p.

Слайд 17

ШАНС
это отношение вероятности того, что событие произойдет к вероятности того, что

ШАНС это отношение вероятности того, что событие произойдет к вероятности того, что
событие не произойдет.

ОТНОШЕНИЕ ШАНСОВ
(ODDS RATIO)
это отношение шансов для первой группы объектов к отношению шансов для второй группы объектов.

Слайд 18

ПРАВИЛО СЛОЖЕНИЯ ВЕРОЯТНОСТЕЙ
Если два события, А и В, взаимоисключающие, несовместимые, то вероятность

ПРАВИЛО СЛОЖЕНИЯ ВЕРОЯТНОСТЕЙ Если два события, А и В, взаимоисключающие, несовместимые, то
события А или В равна сумме их вероятностей:
Р(А или В)= р(А)+р(В)

Слайд 19

ПРАВИЛО УМНОЖЕНИЯ ВЕРОЯТНОСТЕЙ:
Если два события, А и В, независимы (т.е. возникновение одного

ПРАВИЛО УМНОЖЕНИЯ ВЕРОЯТНОСТЕЙ: Если два события, А и В, независимы (т.е. возникновение
события не влияет на возможность появления другого), то вероятность того, что оба события произойдут, равна произведению вероятности каждого:
P(A и B)=p(A)*p(B)

Слайд 20

СЛУЧАЙНАЯ ВЕЛИЧИНА
величина, которая при реализации определенного комплекса условий может принимать различные значения.
Закон

СЛУЧАЙНАЯ ВЕЛИЧИНА величина, которая при реализации определенного комплекса условий может принимать различные
больших чисел:
при достаточно большом числе наблюдений случайные отклонения взаимно погашаются и проявляется основная тенденция (закономерность).

Слайд 21

Приступая к изучению основ статистического анализа необходимо выделить два основных этапа:
- описание

Приступая к изучению основ статистического анализа необходимо выделить два основных этапа: -
полученного в ходе исследования массива данных
- анализ данных и проверка различных статистических гипотез

Слайд 22

Основные направления применения математико-статистических методов в медицине и здравоохранении:
Наиболее эффективный сбор данных

Основные направления применения математико-статистических методов в медицине и здравоохранении: Наиболее эффективный сбор
и обобщение полученных результатов;
Сравнение и определение статистически значимых различий (достоверных) между двумя и более группами результатов;
Изучение взаимосвязи между факторами и явлениями;
Анализ динамики процессов;
Анализ прогностических факторов.

Слайд 23

Прежде чем приступить к анализу данных и проверке различных гипотез:
Сформулируйте вопрос, на

Прежде чем приступить к анализу данных и проверке различных гипотез: Сформулируйте вопрос,
который Вы хотите ответить с помощью статистического анализа.
Выберите наиболее адекватный для ответа на данный вопрос статистический критерий или метод.
Правильно интерпретируйте его результаты.

Слайд 24

Анализ организации конкретного исследования и его результатов:
- оценить адекватность дизайна научного исследования

Анализ организации конкретного исследования и его результатов: - оценить адекватность дизайна научного
решению той или иной проблемы эпидемиологии и общественного здоровья.
- Анализ технологии приведенного исследования.
- Оценка полученных результатов.
- практическое применение полученных результатов.

Слайд 25

ЗНАНИЕ ВОЗМОЖНОСТЕЙ СТАТИСТИЧЕСКИХ МЕТОДОВ НЕОБХОДИМО КАЖДОМУ РАБОТАЮЩЕМУ В МЕДИЦИНЕ И ЗДРАВООХРАНЕНИИ.

ЗНАНИЕ ВОЗМОЖНОСТЕЙ СТАТИСТИЧЕСКИХ МЕТОДОВ НЕОБХОДИМО КАЖДОМУ РАБОТАЮЩЕМУ В МЕДИЦИНЕ И ЗДРАВООХРАНЕНИИ.

Слайд 26

Изучение статистики может пригодиться:

При прочтении научных публикаций

Важно понимать статистические исследования, проводимые в

Изучение статистики может пригодиться: При прочтении научных публикаций Важно понимать статистические исследования,
интересуемой области.
Для этого необходимо знать и владеть
статистической терминологией,
статистической символикой,
знать концепцию статистических процедур, используемых в исследовании.
В собственной научной работе и клинической практике
Для проведения исследований необходимо уметь:
планировать эксперимент
собирать данные
анализировать данные
делать статистические выводы и прогнозы
Для понимании основ доказательной медицины

Слайд 27

ПАКЕТЫ ПРИКЛАДНЫХ ПРОГРАММ:
SPSS (Statistical Package for Social Science)
SAS
STATA
STATISTICA
BIOSTATISTICA
Epilnfo
программа «R»

ПАКЕТЫ ПРИКЛАДНЫХ ПРОГРАММ: SPSS (Statistical Package for Social Science) SAS STATA STATISTICA BIOSTATISTICA Epilnfo программа «R»

Слайд 28

ПРИМЕРЫ КЛИНИЧЕСКИХ ИССЛЕДОВАНИЙ
Изучение эффективности нового лекарства
Оценка нового диагностического теста
Сравнительный анализ схем ведения

ПРИМЕРЫ КЛИНИЧЕСКИХ ИССЛЕДОВАНИЙ Изучение эффективности нового лекарства Оценка нового диагностического теста Сравнительный
больного
Изучение причин и факторов риска болезни
Прогноз развития заболевания

Слайд 29

ЭТАПЫ НАУЧНО-ПРАКТИЧЕСКОГО ИССЛЕДОВАНИЯ:
Формулирование цели и задач исследования.
Организация исследования.
Сбор информации.
Обработка информации.
Анализ результатов исследования.
Внедрение

ЭТАПЫ НАУЧНО-ПРАКТИЧЕСКОГО ИССЛЕДОВАНИЯ: Формулирование цели и задач исследования. Организация исследования. Сбор информации.
результатов исследования в практику и оценка эффективности.

Слайд 30

Краткая и четкая цель

I ЭТАП: ЦЕЛИ И ЗАДАЧИ ИССЛЕДОВАНИЯ
Этот этап включает в

Краткая и четкая цель I ЭТАП: ЦЕЛИ И ЗАДАЧИ ИССЛЕДОВАНИЯ Этот этап
себя обоснование актуальности проблемы и цели исследования.
Цель – это конечный результат или желаемое состояние. Цель должна быть сформулирована четко и недвусмысленно.

Слайд 31

I ЭТАП: ЦЕЛИ И ЗАДАЧИ ИССЛЕДОВАНИЯ
Название темы должно соответствовать цели исследования.
Для раскрытия

I ЭТАП: ЦЕЛИ И ЗАДАЧИ ИССЛЕДОВАНИЯ Название темы должно соответствовать цели исследования.
поставленной цели необходимо определить задачи исследования, т.е. те конкретные действия, которые последовательно ведут к достижению цели исследования. Для небольших исследований намечают 4-6 задач.

Слайд 32

I ЭТАП: ЦЕЛИ И ЗАДАЧИ ИССЛЕДОВАНИЯ
Большую помощь при формировании цели и задач

I ЭТАП: ЦЕЛИ И ЗАДАЧИ ИССЛЕДОВАНИЯ Большую помощь при формировании цели и
исследования оказывает рабочая гипотеза, т.е. тот основной специфический вопрос исследования, на который необходимо ответить в ходе эксперимента, основная идея исследования, предвидение ожидаемых результатов.

Слайд 33

I ЭТАП: ЦЕЛИ И ЗАДАЧИ ИССЛЕДОВАНИЯ
Анализ литературы помогает:
Оценить степень разработки темы;
Определить дизайн

I ЭТАП: ЦЕЛИ И ЗАДАЧИ ИССЛЕДОВАНИЯ Анализ литературы помогает: Оценить степень разработки
исследования и методы исследования;
Оценить полученные ранее результаты;
Изучить исторические аспекты проблемы, ее возникновение и подходы к решению.

Слайд 34

II ЭТАП: ОРГАНИЗАЦИЯ ИССЛЕДОВАНИЯ
(DESIGN STUDY)

II ЭТАП: ОРГАНИЗАЦИЯ ИССЛЕДОВАНИЯ (DESIGN STUDY)

Слайд 35

II ЭТАП: ОРГАНИЗАЦИЯ ИССЛЕДОВАНИЯ
Выбор объекта наблюдения:
Под объектом наблюдения понимают статистическую совокупность, состоящую

II ЭТАП: ОРГАНИЗАЦИЯ ИССЛЕДОВАНИЯ Выбор объекта наблюдения: Под объектом наблюдения понимают статистическую
из отдельных предметов или явлений – единиц наблюдений, взятых в определенных границах времени и пространства.
Формирование критериев включения и исключения.

Слайд 36

II ЭТАП: ОРГАНИЗАЦИЯ ИССЛЕДОВАНИЯ
Единица наблюдения – первичный элемент статистической совокупности, являющийся носителем

II ЭТАП: ОРГАНИЗАЦИЯ ИССЛЕДОВАНИЯ Единица наблюдения – первичный элемент статистической совокупности, являющийся
признаков (variables), подлежащих регистрации, изучению в ходе исследования.
Признаки или переменные (variables), могут принимать различные конкретные значения (values).

Слайд 37

II ЭТАП: ОРГАНИЗАЦИЯ ИССЛЕДОВАНИЯ
Типы признаков (виды шкал):

Переменные
Категориальные
(качественные)
Номинальные
Порядковые
(ординальные)
Числовые
(количественные)
Дискретные
Непрерывные

II ЭТАП: ОРГАНИЗАЦИЯ ИССЛЕДОВАНИЯ Типы признаков (виды шкал): Переменные Категориальные (качественные) Номинальные

Слайд 38


II ЭТАП: ОРГАНИЗАЦИЯ ИССЛЕДОВАНИЯ

Перечень признаков, подлежащих изучению в ходе исследования, оформляется в

II ЭТАП: ОРГАНИЗАЦИЯ ИССЛЕДОВАНИЯ Перечень признаков, подлежащих изучению в ходе исследования, оформляется
виде регистрационного документа (анкета, бланк, карта и т.п.), включающего вопросы, которые исследователь хочет изучить в ходе эксперимента и в дальнейшем заполняется на каждую единицу наблюдения.

Слайд 39


II ЭТАП: ОРГАНИЗАЦИЯ ИССЛЕДОВАНИЯ

В зависимости от степени охвата объекта исследования принято различать:

II ЭТАП: ОРГАНИЗАЦИЯ ИССЛЕДОВАНИЯ В зависимости от степени охвата объекта исследования принято
сплошное исследование (генеральная совокупность - population);
выборочное исследование (выборочная совокупность - sample).

Слайд 40


ГЕНЕРАЛЬНАЯ СОВОКУПНОСТЬ

Это совокупность всех мыслимо возможных объектов данного вида, над которыми проводятся

ГЕНЕРАЛЬНАЯ СОВОКУПНОСТЬ Это совокупность всех мыслимо возможных объектов данного вида, над которыми
наблюдения с целью получения конкретных значений определенной случайной величины.

Слайд 41


РЕПРЕЗЕНТАТИВНОСТЬ

Репрезентативность означает, что все пропорции генеральной совокупности должны быть представлены в

РЕПРЕЗЕНТАТИВНОСТЬ Репрезентативность означает, что все пропорции генеральной совокупности должны быть представлены в
выборке.
Репрезентативность выборки обеспечивается случайностью отбора. Это означает, что любой объект выборки отобран случайно, при этом все объекты имеют одинаковую вероятность попасть в выборку.

Слайд 42


II ЭТАП: ОРГАНИЗАЦИЯ ИССЛЕДОВАНИЯ

репрезентативность – это представительность выборочной совокупности по отношению

II ЭТАП: ОРГАНИЗАЦИЯ ИССЛЕДОВАНИЯ репрезентативность – это представительность выборочной совокупности по отношению
ко всей (генеральной) совокупности;
репрезентативность должна быть количественной и качественной.

Слайд 43


II ЭТАП: ОРГАНИЗАЦИЯ ИССЛЕДОВАНИЯ

Репрезентативность выборки зависит от …
Главное требование, предъявляемое

II ЭТАП: ОРГАНИЗАЦИЯ ИССЛЕДОВАНИЯ Репрезентативность выборки зависит от … Главное требование, предъявляемое
к отбору - …
Случайность отбора достигается путем …

Слайд 44


РАНДОМИЗАЦИЯ

Процесс создания репрезентативной выборки достигается путем рандомизации (random - случайный (англ.)), т.е.

РАНДОМИЗАЦИЯ Процесс создания репрезентативной выборки достигается путем рандомизации (random - случайный (англ.)),
процессом случайного отбора элементов генеральной совокупности в выборку.
В процессе отбора следует избегать участия человека.
Следует использовать объективные (механические или электронные) средства рандомизации.
Существуют различные методы отбора объектов генеральной совокупности в выборку.
Чаще всего, элементы генеральной совокупности нумеруют, затем прибегают к одному из нижеперечисленных способов.

Слайд 45


МЕТОДЫ СЛУЧАЙНОГО ОТБОРА ОБЪЕКТОВ
Механический отбор с повтором и без повтора. Отбор с

МЕТОДЫ СЛУЧАЙНОГО ОТБОРА ОБЪЕКТОВ Механический отбор с повтором и без повтора. Отбор
помощью таблиц или генератора случайных чисел.
Многоступенчатая выборка.
Например, опрос студентов: сначала случайным образом выбираем вуз, затем случайно выбираем факультет, затем студента. В этом случае результат менее точный, чем при случайном выборе студентов сразу, без разделения по вузам и факультетам.

Слайд 46


МЕТОДЫ СЛУЧАЙНОГО ОТБОРА ОБЪЕКТОВ

Кластерная выборка – похожа на многоступенчатую, отличие состоит в

МЕТОДЫ СЛУЧАЙНОГО ОТБОРА ОБЪЕКТОВ Кластерная выборка – похожа на многоступенчатую, отличие состоит
том, что исследуются все объекты последней ступени (в нашем случае, все студены данного факультета. Факультет и есть кластер).
Стратифицированная выборка – случайная выборка применяется отдельно для каждой группы (страты).
Систематическая выборка – например из списка объектов выбирается каждый 10-тый. Такая выборка наименее случайна.

Слайд 47


II ЭТАП: ОРГАНИЗАЦИЯ ИССЛЕДОВАНИЯ

Важное место при решении организационных вопросов исследования принадлежит так

II ЭТАП: ОРГАНИЗАЦИЯ ИССЛЕДОВАНИЯ Важное место при решении организационных вопросов исследования принадлежит
называемому пробному, предварительному (пилотному) исследованию.
Пилотное исследование позволяет решить следующие основные задачи:
отработать программу исследования;
проверить варианты сбора данных;
оценить вариабельность (разнообразие признаков);
оценить затраты (время, деньги, штаты), необходимые для проведения исследования.

Слайд 48


III ЭТАП: СБОР ИНФОРМАЦИИ

На этом этапе основное внимание должно быть уделено

III ЭТАП: СБОР ИНФОРМАЦИИ На этом этапе основное внимание должно быть уделено
соблюдению правил регистрации, охвату всех включенных в исследование единиц наблюдения, достоверности собранных данных.
Выбор способа сбора данных определяется целью и задачами исследования и зависит от программы наблюдения, численности обследуемых единиц, уровня подготовки как организатора исследования, так и изучаемых лиц.

Слайд 49


III ЭТАП: СБОР ИНФОРМАЦИИ

Способы сбора данных:
отчетный (с помощью системы учетно-отчетной документации);

III ЭТАП: СБОР ИНФОРМАЦИИ Способы сбора данных: отчетный (с помощью системы учетно-отчетной
экспедиционный (при обследовании деятельности отдельных учреждений, служб здравоохранения и т.п.);
саморегистрация (предполагает самостоятельное заполнение обследуемым регистрационного документа);
анкетный (сведения получают при помощи специальных вопросников, анкет рассылаемых или публикуемых в печати);
корреспондентский (динамическое наблюдение за определенной группой лиц).

Слайд 50


IV ЭТАП: ОБРАБОТКА ДАННЫХ
СОЗДАНИЕ И ПОДГОТОВКА БАЗЫ ДАННЫХ

IV ЭТАП: ОБРАБОТКА ДАННЫХ СОЗДАНИЕ И ПОДГОТОВКА БАЗЫ ДАННЫХ

Слайд 51


V ЭТАП: АНАЛИЗ РЕЗУЛЬТАТОВ ИССЛЕДОВАНИЯ

V ЭТАП: АНАЛИЗ РЕЗУЛЬТАТОВ ИССЛЕДОВАНИЯ

Слайд 52

ТИПЫ ПРИЗНАКОВ (ВИДЫ ШКАЛ):

Переменные
Категориальные
(качественные)
Номинальные
Порядковые
(ординальные)
Числовые
(количественные)
Дискретные
Непрерывные

ТИПЫ ПРИЗНАКОВ (ВИДЫ ШКАЛ): Переменные Категориальные (качественные) Номинальные Порядковые (ординальные) Числовые (количественные) Дискретные Непрерывные

Слайд 53

Типы признаков (виды шкал):
Качественные категориальные (qualititative, categorical)
Номинальные (Nominal);
Дихотомические (Binary - dichotomous);
Порядковые, ординальные,

Типы признаков (виды шкал): Качественные категориальные (qualititative, categorical) Номинальные (Nominal); Дихотомические (Binary
ранжируемые (Ordinal).
Количественные, интервальные (quantitative, numerical, interval)
Дискретные (Discrete)
Непрерывные (Continuous)

Слайд 54


РАЗЛИЧИЕ МЕЖДУ ТИПАМИ ДАННЫХ

В зависимости от того, оказываются ли данные категориальными или

РАЗЛИЧИЕ МЕЖДУ ТИПАМИ ДАННЫХ В зависимости от того, оказываются ли данные категориальными
числовыми, используют различные статистические методы.

Слайд 55


ПРОИЗВОДНЫЕ (ВТОРИЧНЫЕ) ДАННЫЕ

Проценты. Могут возникать при рассмотрении вопроса относительно улучшения состояния больного

ПРОИЗВОДНЫЕ (ВТОРИЧНЫЕ) ДАННЫЕ Проценты. Могут возникать при рассмотрении вопроса относительно улучшения состояния
во время лечения.
Пропорции или отношения. Иногда встречается два варианта пропорций или отношений. Например, индекс массы тела (индекс Кетле).
Интенсивность. Относительная частота заболеваний, где количество заболеваний делят на общее число лет, в течение которых вели наблюдения за пациентами в этом исследовании, общепринята при эпидемиологическом исследовании.
Метки и оценки. Произвольные значения, или метки, используют в том случае, когда невозможно изменить количество.

Слайд 56


ЦЕНЗУРИРОВАННЫЕ ДАННЫЕ

Мы можем рассмотреть цензурированные данные на следующих примерах.
- Если мы проводим

ЦЕНЗУРИРОВАННЫЕ ДАННЫЕ Мы можем рассмотреть цензурированные данные на следующих примерах. - Если
лабораторные измерения, используя прибор, который может обнаружить значения только выше некоторого предельного уровня, тогда любая величина ниже этого уровня не будет обнаружена. Например, вирус, уровень обнаружения которого ниже предела, часто рассматривается как «необнаруженный», при этом на самом деле он может находиться в образце.
- Мы можем столкнуться с цензурированными данными, например, когда некоторые больные из группы исследуемых отстраняются от испытания до окончания исследований.

Слайд 57


ФОРМАТЫ ВВОДА ДАННЫХ

Существует несколько способов ввода данных и сохранения их в компьютере.

ФОРМАТЫ ВВОДА ДАННЫХ Существует несколько способов ввода данных и сохранения их в
Большинство статистических пакетов позволяют сразу же вводить данные. Однако существуют ограничения, а именно: вы не сможете переносить данные из одного пакета в другой. Простейшая альтернатива – сохранять данные либо в электронной таблице, либо в пакете баз данных. К сожалению, их статистические процедуры часто ограничены, и обычно возникает необходимость вводить данные в статистический пакет, чтобы провести исследования.

Слайд 58


КАТЕГОРИАЛЬНЫЕ ДАННЫЕ

С нечисловыми данными могут возникнуть проблемы при занесении их в некоторые

КАТЕГОРИАЛЬНЫЕ ДАННЫЕ С нечисловыми данными могут возникнуть проблемы при занесении их в
статистические пакеты, поэтому вам необходимо назначить числовые коды категориальным данным, прежде чем вводить данные в компьютер.

Слайд 59


ЧИСЛОВЫЕ ДАННЫЕ

Должны быть введены с той же самой точностью, с которой были

ЧИСЛОВЫЕ ДАННЫЕ Должны быть введены с той же самой точностью, с которой
проведены измерения, и единица измерения должна быть едина для всех наблюдений данной переменной. Например, масса должна быть записана в килограммах или в граммах, но не попеременно то в кг, то в г.

Слайд 60


МНОЖЕСТВЕННЫЕ ФОРМЫ
НА ОДНОГО БОЛЬНОГО

Иногда информацию собирают на одного и того же

МНОЖЕСТВЕННЫЕ ФОРМЫ НА ОДНОГО БОЛЬНОГО Иногда информацию собирают на одного и того
больного более чем в одном случае (наблюдении). Важно отметить, что должен существовать уникальный идентификатор (например, порядковый номер), принадлежащий только одному человеку в данном наблюдении, который предоставит вам возможность соединить все данные, собранные на одного человека при исследовании.

Слайд 61


КОДИРОВАНИЕ ОТСУТСТВУЮЩИХ (ПРОПУЩЕННЫХ) ДАННЫХ

Вам следует определить, что вы будете делать с отсутствующими

КОДИРОВАНИЕ ОТСУТСТВУЮЩИХ (ПРОПУЩЕННЫХ) ДАННЫХ Вам следует определить, что вы будете делать с
данными, прежде чем вводить информацию. В большинстве случаев вы будете вынуждены использовать какой-нибудь символ для недостающих данных. Статистические пакеты предлагают для этого различные способы. Некоторые пакеты используют специальные символы.

Слайд 62


ПРОВЕРКА ОШИБОК И ВЫБРОСОВ

При любом исследовании всегда есть опасность допустить ошибки при

ПРОВЕРКА ОШИБОК И ВЫБРОСОВ При любом исследовании всегда есть опасность допустить ошибки
наборе данных либо вначале, при измерениях, либо при сборе, переписывании и вводе данных в компьютер. Довольно трудно избежать этих ошибок. Однако можно сократить количество опечаток и описок путем тщательной проверки данных, как только они будут введены. Даже бегло просмотрев таблицу, можно обнаружить очевидные ошибки.

Слайд 63


ВЫБРОСЫ (АНОМАЛЬНЫЕ ЗНАЧЕНИЯ)

Наблюдения, которые отличаются от главной группы данных и несовместимы с

ВЫБРОСЫ (АНОМАЛЬНЫЕ ЗНАЧЕНИЯ) Наблюдения, которые отличаются от главной группы данных и несовместимы
остальными. Эти данные могут быть подлинными наблюдениями с очень экстремальными величинами переменной. Однако они могут появиться также в результате опечаток и в этом случае любые данные, вызывающие подозрение, должны быть проверены. Важно выяснить, имеются ли выбросы в наборе данных, так как они могут в значительной степени повлиять на результаты некоторых исследований.

Слайд 64


ГРАФИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ ДАННЫХ

ГРАФИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ ДАННЫХ

Слайд 65


СТОЛБЧАТАЯ И КОЛОНЧАТАЯ ДИАГРАММА

СТОЛБЧАТАЯ И КОЛОНЧАТАЯ ДИАГРАММА

Слайд 66


КРУГОВАЯ ДИАГРАММА

КРУГОВАЯ ДИАГРАММА

Слайд 67


ГИСТОГРАММА

ГИСТОГРАММА

Слайд 68


ТОЧЕЧНЫЙ ГРАФИК

ГРАФИК
«СТЕБЕЛЬ И ЛИСТЬЯ»

ТОЧЕЧНЫЙ ГРАФИК ГРАФИК «СТЕБЕЛЬ И ЛИСТЬЯ»

Слайд 69


ГРАФИК BOX-PLOT

ГРАФИК BOX-PLOT

Слайд 70


ГРАФИК BOX-PLOT

ГРАФИК BOX-PLOT

Слайд 71


ФОРМЫ ЧАСТОТНОГО РАСПРЕДЕЛЕНИЯ

Выбор наиболее подходящего статистического метода часто зависит от формы распределения.

ФОРМЫ ЧАСТОТНОГО РАСПРЕДЕЛЕНИЯ Выбор наиболее подходящего статистического метода часто зависит от формы
Распределение данных чаще всего унимодальное, т.е. имеющее одну «вершину».
Иногда распределение бимодальное (две «вершины») или равномерное (каждая величина одинаково вероятна и нет «вершин»).

Слайд 72


БИМОДАЛЬНОЕ

УНИМОДАЛЬНОЕ

БИМОДАЛЬНОЕ УНИМОДАЛЬНОЕ

Слайд 73


ФОРМЫ ЧАСТОТНОГО РАСПРЕДЕЛЕНИЯ

ФОРМЫ ЧАСТОТНОГО РАСПРЕДЕЛЕНИЯ

Слайд 74


ПОКАЗАТЕЛИ НОРМАЛЬНОГО РАСПРЕДЕЛЕНИЯ

ПОКАЗАТЕЛИ ЦЕНТРАЛЬНОЙ ТЕНДЕНЦИИ
Среднее (average, mean)
Мода (mode)
Медиана (median)
ПОКАЗАТЕЛИ РАЗБРОСА

ПОКАЗАТЕЛИ НОРМАЛЬНОГО РАСПРЕДЕЛЕНИЯ ПОКАЗАТЕЛИ ЦЕНТРАЛЬНОЙ ТЕНДЕНЦИИ Среднее (average, mean) Мода (mode) Медиана
ДАННЫХ
Дисперсия (variance)
Стандартное отклонение (standard deviation)
Интерквартильное расстояние

Слайд 75


ОПИСАНИЕ ДАННЫХ: «МЕРЫ ПОЛОЖЕНИЯ»

СРЕДНЕЕ АРИФМЕТИЧЕСКОЕ

Одна из мер центральной тенденции. Вычисляется путем

ОПИСАНИЕ ДАННЫХ: «МЕРЫ ПОЛОЖЕНИЯ» СРЕДНЕЕ АРИФМЕТИЧЕСКОЕ Одна из мер центральной тенденции. Вычисляется
суммирования всех величин в группе и последующего деления полученной суммы на число слагаемых.

Слайд 76


ОПИСАНИЕ ДАННЫХ: «МЕРЫ ПОЛОЖЕНИЯ»

СРЕДНЕЕ АРИФМЕТИЧЕСКОЕ (Μ - M)

Используя математическую систему обозначения, мы

ОПИСАНИЕ ДАННЫХ: «МЕРЫ ПОЛОЖЕНИЯ» СРЕДНЕЕ АРИФМЕТИЧЕСКОЕ (Μ - M) Используя математическую систему
можем сократить это выражение:

Слайд 77


МЕДИАНА (MEDIAN - ME)

Вид меры центральной тенденции. Простейшее деление набора измерений на

МЕДИАНА (MEDIAN - ME) Вид меры центральной тенденции. Простейшее деление набора измерений
две части: нижнюю и верхнюю половины. Точка на шкале, которая делит группу таким образом, называется медианой.

Слайд 78

МОДА (MODE - MO)

Вид меры центральной тенденции. Наиболее часто встречающееся значение среди

МОДА (MODE - MO) Вид меры центральной тенденции. Наиболее часто встречающееся значение
набора наблюдений.
Мода — значение, которое встречается наиболее часто в наборе данных; если данные непрерывные, то мы обычно группируем их и вычисляем модальную группу. Некоторые наборы данных не имеют моды, потому что каждое значение встречается только один раз.

Слайд 79


СРЕДНЕЕ ГЕОМЕТРИЧЕСКОЕ
(GEOMETRIC MEAN)

Одна из мер центральной тенденции. Вычисляется суммированием логарифмов всех величин

СРЕДНЕЕ ГЕОМЕТРИЧЕСКОЕ (GEOMETRIC MEAN) Одна из мер центральной тенденции. Вычисляется суммированием логарифмов
в группе, вычислением средней арифметической, затем от полученного значения берут антилогарифм. Может быть найдена только в случае, если все величины в группе положительны.

Слайд 80


ОПИСАНИЕ ДАННЫХ: «МЕРЫ РАССЕЯНИЯ»
РАЗМАХ (ИНТЕРВАЛ ИЗМЕНЕНИЯ)

Разность между максимальным и минимальным значениями переменной

ОПИСАНИЕ ДАННЫХ: «МЕРЫ РАССЕЯНИЯ» РАЗМАХ (ИНТЕРВАЛ ИЗМЕНЕНИЯ) Разность между максимальным и минимальным
в наборе данных; вы найдете эти две величины, на которые ссылаются вместо их разности.

Слайд 81


Размах, полученный из процентилей.
Что такое процентили?

Размах, полученный из процентилей. Что такое процентили?

Слайд 82


ПРИМЕНЕНИЕ ПРОЦЕНТИЛЕЙ

Межквартильный размах – разница между первым и третьим квартилем, т.е. между

ПРИМЕНЕНИЕ ПРОЦЕНТИЛЕЙ Межквартильный размах – разница между первым и третьим квартилем, т.е.
25-м и 75-м процентилями. В него входят центральные 50% наблюдений в упорядоченном наборе, где 25% наблюдений находятся ниже центральной точки и 25% - выше.
Интердецильный размах содержит в себе центральные 80% наблюдений, т.е. те наблюдения, которые располагаются между 10-м и 90-м процентилями.
Часто используют размах, который содержит 95% наблюдений, т.е. он исключает 2,5% наблюдений снизу и 2,5% сверху. Можно применить этот интервал, осуществляя диагностику болезни. В этом случае он называется референтный интервал, референтный размах или нормальный размах.

Слайд 83


ДИСПЕРСИЯ
(ОТ ЛАТ. – DISPERSES – РАССЕЯННЫЙ, РАССЫПАННЫЙ)

Один из способов измерения рассеяния данных

ДИСПЕРСИЯ (ОТ ЛАТ. – DISPERSES – РАССЕЯННЫЙ, РАССЫПАННЫЙ) Один из способов измерения
заключается в том, чтобы определить степень отклонения каждого наблюдения от средней арифметической. Очевидно, что чем больше отклонение, тем больше изменчивость, вариабельность наблюдений. Однако мы не можем использовать среднее этих отклонений как меру рассеяния, потому что положительные отклонения компенсируют отрицательные отклонения (их сумма тождественно равна нулю). Для того чтобы решить эту проблему, мы возводим в квадрат каждое отклонение и находим среднее возведенных в квадрат отклонений; эта величина называется вариацией, или дисперсией.

Слайд 84


СТАНДАРТНОЕ ОТКЛОНЕНИЕ

Стандартное (среднее квадратичное) отклонение – положительный квадратный корень из дисперсии. На

СТАНДАРТНОЕ ОТКЛОНЕНИЕ Стандартное (среднее квадратичное) отклонение – положительный квадратный корень из дисперсии.
примере n наблюдений это выглядит так. Мы можем размышлять о стандартном отклонении как о своего рода среднем отклонении наблюдений от среднего. Его вычисляют в тех же самых единицах (размерностях), что и исходные данные.
Если разделить стандартное отклонение на среднее арифметическое и выразить этот показатель в процентах, получится коэффициент вариации. Это мера рассеяния которая не зависит от единиц измерения (безразмерная), но имеет некоторые теоретические неудобства, поэтому статистики её не всегда одобряют.

Слайд 85


ПОНИМАНИЕ ВЕРОЯТНОСТИ

МОЖНО ВЫЧИСЛИТЬ ВЕРОЯТНОСТЬ, ИСПОЛЬЗУЯ РАЗЛИЧНЫЕ ПОДХОДЫ:
- СУБЪЕКТИВНАЯ;
- ЧАСТОТНАЯ;
- АПРИОРНАЯ.

ПОНИМАНИЕ ВЕРОЯТНОСТИ МОЖНО ВЫЧИСЛИТЬ ВЕРОЯТНОСТЬ, ИСПОЛЬЗУЯ РАЗЛИЧНЫЕ ПОДХОДЫ: - СУБЪЕКТИВНАЯ; - ЧАСТОТНАЯ; - АПРИОРНАЯ.

Слайд 86


РАСПРЕДЕЛЕНИЕ ВЕРОЯТНОСТИ: ТЕОРИЯ

Случайная величина – это величина, которая может принимать любое из

РАСПРЕДЕЛЕНИЕ ВЕРОЯТНОСТИ: ТЕОРИЯ Случайная величина – это величина, которая может принимать любое
набора взаимоисключающих значений с определенной вероятностью.
Распределение вероятности показывает вероятности всех возможных значений случайной переменной. Это теоретическое распределение, которое выражено математически и имеет среднее и дисперсию, являющиеся аналогами среднего и дисперсии в эмпирическом распределении.

Слайд 87


НОРМАЛЬНОЕ (ГАУССОВСКОЕ РАСПРЕДЕЛЕНИЕ)

Одно из самых важных распределений в статистике – нормальное распределение.

НОРМАЛЬНОЕ (ГАУССОВСКОЕ РАСПРЕДЕЛЕНИЕ) Одно из самых важных распределений в статистике – нормальное
Его функция плотности распределения вероятности:
полностью определяется двумя параметрами, среднее (µ) и дисперсия (σ 2);
колоколообразна (унимодальна);
симметрична относительно среднего;
сдвигается вправо, если среднее увеличивается, и влево, если среднее уменьшается (при постоянной дисперсии);
сплющивается, если дисперсия увеличивается, но становится более остроконечной, если дисперсия уменьшается (для постоянного среднего).

Слайд 88


НОРМАЛЬНОЕ (ГАУССОВСКОЕ РАСПРЕДЕЛЕНИЕ)
ДОПОЛНИТЕЛЬНЫЕ СВОЙСТВА

Среднее и медиана нормального распределения равны.
Вероятность того, что нормально

НОРМАЛЬНОЕ (ГАУССОВСКОЕ РАСПРЕДЕЛЕНИЕ) ДОПОЛНИТЕЛЬНЫЕ СВОЙСТВА Среднее и медиана нормального распределения равны. Вероятность
распределенная случайная переменная X, со средним µ и стандартным отклонением σ, находящаяся между:
(µ-σ) и (µ+σ), равна 0,68;
(µ-1,96σ) и (µ+1,96σ), равна 0,95;
(µ-2,58σ) и (µ+2,58σ), равна 0,99.

Слайд 89


НОРМАЛЬНОЕ (ГАУССОВСКОЕ РАСПРЕДЕЛЕНИЕ)

НОРМАЛЬНОЕ (ГАУССОВСКОЕ РАСПРЕДЕЛЕНИЕ)

Слайд 90


ТЕОРЕТИЧЕСКИЕ РАСПРЕДЕЛЕНИЯ:
ДРУГИЕ РАСПРЕДЕЛЕНИЯ

t-распределение
- Получено Вильямом Госсетом, который публиковался под псевдонимом Студент

ТЕОРЕТИЧЕСКИЕ РАСПРЕДЕЛЕНИЯ: ДРУГИЕ РАСПРЕДЕЛЕНИЯ t-распределение - Получено Вильямом Госсетом, который публиковался под
(Student), поэтому его часто называют t-распределением Стьюдента.
- Параметры, которые характеризуют t-распределение, - это степени свободы (df), так как мы сможем начертить функцию плотности распределения вероятности только в том случае, если мы будем знать уравнение t-распределения и степени свободы. Степени свободы часто выражаются через объем выборки.
- Форма подобна форме для стандартизованного нормального распределения, но более приплюснута и с более длинными хвостами. Форма приближается к нормальной кривой, по мере того как увеличиваются степени свободы.
- В частности, его применяют для вычисления доверительных интервалов и исследования гипотез с одной или двумя средними.

Слайд 91


t-распределение

t-распределение

Слайд 92


ТЕОРЕТИЧЕСКИЕ РАСПРЕДЕЛЕНИЯ:
ДРУГИЕ РАСПРЕДЕЛЕНИЯ
НЕПРЕРЫВНОЕ РАСПРЕДЕЛЕНИЕ ВЕРОЯТНОСТЕЙ

Хи-квадрат
Хи-квадрат, (χ2) или распределение Пирсона:
- скошено вправо

ТЕОРЕТИЧЕСКИЕ РАСПРЕДЕЛЕНИЯ: ДРУГИЕ РАСПРЕДЕЛЕНИЯ НЕПРЕРЫВНОЕ РАСПРЕДЕЛЕНИЕ ВЕРОЯТНОСТЕЙ Хи-квадрат Хи-квадрат, (χ2) или распределение
и принимает только положительные значения;
- характеризуется степенями свободы;
- его форма зависит от числа степеней свободы – становится более симметричной и приближается к нормальной с их ростом;
- особенно часто используется для анализа категориальных данных.

Слайд 93


Хи-квадрат

Хи-квадрат

Слайд 94


F-распределение
- Скошено вправо.
- Определяется как отношение. Распределения отношения двух оценок дисперсий, вычисленных

F-распределение - Скошено вправо. - Определяется как отношение. Распределения отношения двух оценок
для нормально распределенных данных, аппроксимируется F-распределением.
- Два параметра, которые характеризуют его, - степени свободы числителя и знаменателя отношения.
- F-распределение особенной полезно для сравнения двух дисперсий и более чем двух средних при использовании дисперсионного анализа (ANOVA).

Слайд 95


F-распределение

F-распределение

Слайд 96


Логнормальное распределение
- Распределение вероятности случайной переменной, логарифм которого (по основанию 10 или

Логнормальное распределение - Распределение вероятности случайной переменной, логарифм которого (по основанию 10
более е – основание натурального логарифма) имеет нормальное распределение.
- Сильно скошено вправо.
- Если взять логарифмы исходных данных, которые скошены вправо, мы создадим эмпирическое распределение, которое почти нормальное и тогда данные соответствуют приближенно логнормальному распределению.
- Многие переменные в медицине имеют логнормальное распределение. Можно использовать свойства нормального распределения для того, чтобы сделать выводы относительно этих переменных после логарифмического преобразования данных.
- Если набор данных имеет логнормальное распределение, то используют среднее геометрическое как обобщающий показатель положения.

Слайд 97


Логнормальное распределение

Логнормальное распределение

Слайд 98


ТЕОРЕТИЧЕСКИЕ РАСПРЕДЕЛЕНИЯ:
ДРУГИЕ РАСПРЕДЕЛЕНИЯ
ДИСКРЕТНЫЕ РАСПРЕДЕЛЕНИЯ ВЕРОЯТНОСТЕЙ

ТЕОРЕТИЧЕСКИЕ РАСПРЕДЕЛЕНИЯ: ДРУГИЕ РАСПРЕДЕЛЕНИЯ ДИСКРЕТНЫЕ РАСПРЕДЕЛЕНИЯ ВЕРОЯТНОСТЕЙ

Слайд 99


Биноминальное распределение

Биноминальное распределение

Слайд 100

Распределения Пуассона

- Пуассоновская случайная переменная – число событий, которые происходят независимо и

Распределения Пуассона - Пуассоновская случайная переменная – число событий, которые происходят независимо
случайно во времени или пространстве с постоянной средней интенсивностью µ. Например, количество госпитализаций в день типично отвечает распределению Пуассона. Знание распределения Пуассона используют для того, чтобы вычислить вероятность конкретного количества госпитализаций в любой отдельный день.
- Параметр, которым описывают распределение Пуассона, - среднее, т.е. средняя интенсивность µ.
- Среднее равняется дисперсии в распределении Пуассона.
- Если среднее ближе к минимальному, то распределение будет скошено вправо и становится более симметричным по мере того, как среднее будет увеличиваться, оно приближается, по форме, к нормальному распределению.

Слайд 101


Распределения Пуассона

Распределения Пуассона

Слайд 102


КАК ОПИСАТЬ ДАННЫЕ?

Если значения интересующего нас признака у большинства объектов близки к

КАК ОПИСАТЬ ДАННЫЕ? Если значения интересующего нас признака у большинства объектов близки
их среднему и с равной вероятностью отклоняются от него в большую или меньшую сторону, лучшими характеристиками совокупности будут само среднее значение и стандартное отклонение. Напротив, когда значения признака распределены несимметрично относительно среднего, совокупность лучше описать с помощью медианы и процентилей.

Слайд 103

РАСПРЕДЕЛЕНИЕ МАРСИАН ПО РОСТУ

РАСПРЕДЕЛЕНИЕ МАРСИАН ПО РОСТУ

Слайд 104


РАСПРЕДЕЛЕНИЕ ВЕНЕРИАЦЕВ ПО РОСТУ

РАСПРЕДЕЛЕНИЕ ВЕНЕРИАЦЕВ ПО РОСТУ

Слайд 105


ПАРАМЕТРЫ РАСПРЕДЕЛЕНИЯ
МАРСИАН И ВЕНЕРИАЦЕВ

ПАРАМЕТРЫ РАСПРЕДЕЛЕНИЯ МАРСИАН И ВЕНЕРИАЦЕВ

Слайд 107


Если распределение асимметрично полагаться на среднее и стандартное отклонение нельзя.
А. Распределение юпитериан

Если распределение асимметрично полагаться на среднее и стандартное отклонение нельзя. А. Распределение
по росту.
Б. Нормальное распределение с теми же средним и стандартным отклонением, не смотря на тождественность параметров, оно ничуть не похоже на реальное распределение юпитериан.

Слайд 109


Для описания асимметричного распределения следует использовать медиану и процентили.
Медиана — это значение,

Для описания асимметричного распределения следует использовать медиану и процентили. Медиана — это
которое делит распределение пополам.
А. Медиана роста юпитериан — 36 см.
Б. 25-й и 75-й процентили отсекают четверть самых низких и четверть самых высоких юпитериан 25-й процентиль ближе к медиане, чем 75-й — это говорит об асимметричности распределения.

Слайд 110


НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ, СООТВЕТСТВИЕ МЕЖДУ ЧИСЛОМ СТАНДАРТНЫХ ОТКЛОНЕНИЙ ОТ СРЕДНЕГО И ПРОЦЕНТИЛЯМИ

НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ, СООТВЕТСТВИЕ МЕЖДУ ЧИСЛОМ СТАНДАРТНЫХ ОТКЛОНЕНИЙ ОТ СРЕДНЕГО И ПРОЦЕНТИЛЯМИ

Слайд 111

А в чем проблема?

Вариабельность
Случайная
Систематическая

А в чем проблема? Вариабельность Случайная Систематическая

Слайд 113

Статистика

Описательная
Графические методы
Суммирование данных
Статистические выводы
Статистические модели
Проверка гипотез
Поиск закономерностей (data mining)

Статистика Описательная Графические методы Суммирование данных Статистические выводы Статистические модели Проверка гипотез Поиск закономерностей (data mining)

Слайд 114

Статистические выводы
цель статистики: аппроксимация истины
некоторые определения
различия между статистической и клинической значимостью

Статистические выводы цель статистики: аппроксимация истины некоторые определения различия между статистической и клинической значимостью

Слайд 115

Позиция #1. Статистика как отражение истины

Статистическая значимость не истина, а "аппроксимация" истины

Позиция #1. Статистика как отражение истины Статистическая значимость не истина, а "аппроксимация"

Истина
Что мы можем сделать для людей, что бы они жили дольше или лучше
Исследования позволяют нам приблизиться к истине
Наша цель: выяснить, насколько точно статистика отражает истину

Слайд 116

Позиция #2. Пользователи статистики не должны быть профессиональными статистиками

Вам не надо знать

Позиция #2. Пользователи статистики не должны быть профессиональными статистиками Вам не надо
много о статистике, чтобы эффективно ее использовать
Не концентрируйтесь на том, правильна ли статистика
Попытайтесь понять, что статистика пытается вам сказать

Слайд 117

P< .05
Алтарь
статистики

Священная P-оценка

P Алтарь статистики Священная P-оценка

Слайд 118

 P оценка

"Probability"
Вероятность того, что различия между двумя группами возникли случайно
Искусственно фиксирована

P оценка "Probability" Вероятность того, что различия между двумя группами возникли случайно
на уровне 5% (P = 0.05)

Слайд 119

 P оценка

Зависит от нескольких факторов.
Насколько был большим эффект.
Насколько одинаковым был эффект

P оценка Зависит от нескольких факторов. Насколько был большим эффект. Насколько одинаковым
у обследованных.
Как много пациентов было обследовано.
Если все эти факторы растут, вероятность нахождения значимых различий увеличивается.
После того, как мы решили, что различия не вследствие случайности, нам нужно решить значимы ли они клинически.

Слайд 120

Извлечение информации из р-оценки

"Высоко значимая" — P < 0.001
Если количество пациентов

Извлечение информации из р-оценки "Высоко значимая" — P Если количество пациентов небольшое,
небольшое, р-оценка свидетельствует о том, что эффект был либо очень большим, либо униформным (либо и то и другое)
Если количество пациентов велико эффект может быть и не очень большим

Слайд 121

“Не значимо” P > 0.05 (например, 0.15)
Если количество пациентов мало, их

“Не значимо” P > 0.05 (например, 0.15) Если количество пациентов мало, их
может быть просто недостаточно для обнаружения реально существующих различий
Если количество пациентов достаточно велико, мы можем быть уверены в том, что нет различий между терапевтическими режимами или эффект лечения не стабильный

Извлечение информации из р-оценки

Слайд 122

"Пограничная значимость" — P = 0.08 — ????
Могли бы достичь значимости, если

"Пограничная значимость" — P = 0.08 — ???? Могли бы достичь значимости,
бы в исследовании было больше пациентов
Размер эффекта небольшой или нестабильный
Нельзя сделать никаких выводов кроме того, что нужны дополнительные исследования

Извлечение информации из р-оценки

Слайд 123

Статистика в медицинских исследованиях

Логика научного метода
Дедуктивная логика (выдвигается гипотеза, затем собираются факты)

Статистика в медицинских исследованиях Логика научного метода Дедуктивная логика (выдвигается гипотеза, затем
- от общего к частному
Индуктивная логика (от фактов к формулировке гипотезы
Фальсификация (C.Popper)

Слайд 124

Нулевая гипотеза

Предполагаем, что различий нет
Собираем данные и оцениваем существующие различия
Если нулевая гипотеза

Нулевая гипотеза Предполагаем, что различий нет Собираем данные и оцениваем существующие различия
справедлива, то какова вероятность получения подобных результатов в результате случайного процесса?
Если вероятность достаточно мала, нулевая гипотеза отвергается

Слайд 125

Альтернативная гипотеза

Между группами существуют различия (но мы не можем сказать, какой величины)

Альтернативная гипотеза Между группами существуют различия (но мы не можем сказать, какой величины)

Слайд 126

Ошибки при статистическом выводе

Альфа ошибка (вероятность отвергнуть нулевую гипотезу, если на самом

Ошибки при статистическом выводе Альфа ошибка (вероятность отвергнуть нулевую гипотезу, если на
деле она справедлива) - ошибка потребителя, ошибка первого типа
Бета ошибка (вероятность отвергнуть альтернативную гипотезу, если на самом деле она верна) - ошибка спонсора, ошибка второго типа

Слайд 127

Доверительные интервалы
"Статистика статистики"
статистические показатели - это оценки
Доверительные интервалы показывают нам границы нашей

Доверительные интервалы "Статистика статистики" статистические показатели - это оценки Доверительные интервалы показывают нам границы нашей оценки
оценки

Слайд 128

Доверительный интервал

Интервал, в котором с заданной вероятностью (обычно 95%) находится популяционное среднее

Доверительный интервал Интервал, в котором с заданной вероятностью (обычно 95%) находится популяционное среднее значение
значение
Имя файла: Введение-в-биостатистику.pptx
Количество просмотров: 501
Количество скачиваний: 5