Содержание
- 2. Лекция 2. Гармонизация статистических доказательств и предсказаний
- 3. Эпидемиологи смотрят на мир сквозь решетку таблицы 2×2. При этом надо помнить, что результат обследования является
- 4. Два основных типа Статистических Данных и их моделей Счетные Данные Счетные Данные получают путем подсчета объектов,
- 5. Пример: каковы признаки этой собаки? Качественные: Ее окрас - коричневый с черным У нее длинная шерсть
- 6. Цитокины и диагностика синдрома задержки развития плода (СЗРП) Королева Л.И.
- 7. СЗРП Термин Синдром задержки развития плода (СЗРП) используется для описания плода, масса которого гораздо меньше ожидаемой
- 8. СЗРП Плод с задержкой внутриутробного развития подвержен повышенному риску внутриутробной гибели или неонатальной смерти, асфиксии до
- 9. Содержание цитокина у 16 здоровых матерей и у 20 матерей с СЗРП
- 10. Гистограмма Гистограмма (от др.-греч. ἱστός — столб + γράμμα — черта, буква, написание) — столбиковая диаграмма
- 11. Гистограммы содержания цитокина у матерей здоровых детей и детей с СЗРП Здоровые СЗРП
- 12. Сопоставление гистограмм содержания цитокина у матерей здоровых детей и детей с СЗРП
- 13. ROC-анализ: удобный инструмент для оценки качества диагностических исследований на основе мерных признаков
- 14. Распределения мерного диагностического признака у субъектов с болезнью и без нее Значения мерного диагностического признака Субъекты
- 15. Значения мерного диагностического признака Пороговое отсекающее значение
- 16. Значения мерного диагностического признака Субъекты без болезни Субъекты с болезнью Истинные «позитивы» Истинные «позитивы»
- 17. Значения мерного диагностического признака Субъекты без болезни Субъекты с болезнью Ложные «позитивы» Ложные «позитивы»
- 18. Значения мерного диагностического признака Субъекты без болезни Субъекты с болезнью Истинные «негативы» Истинные «негативы»
- 19. Значения мерного диагностического признака Субъекты без болезни Субъекты с болезнью Ложные «негативы» Ложные «негативы»
- 20. Операционная характеристика приёмника Термин операционная характеристика приёмника (Receiver Operating Characteristic, ROC) пришёл из теории обработки сигналов,
- 21. ROC-кривая – графическая характеристика качества диагностического теста, зависимость доли истинных позитивов среди субъектов с болезнью: Se
- 22. ROC-кривая для данных о содержании цитокина у матерей здоровых детей и детей с СЗРП. Программа AtteStat
- 23. Графическая интерпретация порога отсечения на ROC-кривой для данных о содержании цитокина у матерей здоровых детей и
- 24. Нахождение оптимального порога отсечения, Tr0 = 121
- 25. Решающее правило: Значения признака, превышающие порог Tr0 = 121 или равные ему, принимаются за положительный результат
- 26. Хороший тест: Посредственный тест: Сравнение ROC-кривых
- 27. Наилучший тест: Наихудший тест: Распределения значений мерного признака не пересекаются вовсе Распределения значений мерного признака полностью
- 28. Наилучший тест: распределения значений мерного диагностического признака в двух группах не перекрываются
- 29. Наихудший тест: распределения значений мерного диагностического признака в двух группах полностью перекрываются
- 30. Результаты ROC-анализа Оптимальный порог отсечения: Tr = 121 AUC = 0,750,891,00 Указаны границы 99%-го ДИ для
- 31. «Площадь под кривой» AUC (Area Under Curve) - площадь под ROC-кривой - полезный обобщенный показатель качества
- 32. Идеальный, бесполезный и абсурдный тесты в терминах AUC Если тест идеальный, то AUC = 1. Если
- 33. Словесные интерпретации для градаций AUC
- 34. AUC = 50% AUC = 90% AUC = 65% AUC = 100% AUC для ROC-кривых
- 35. Обсуждение результатов 99%-й ДИ для AUC = 0,750,891,00 не накрывает неинформативное значение AUC = 0,50. Следовательно,
- 36. Результирующая таблица 2×2
- 37. Обсуждение результатов Se = 0,780,950,99 Sp = 0,660,880,93 99%-ые ДИ и для Se и для Sp
- 38. Обсуждение результатов LR[+] = 1,47,642 LR[-] = 0,0050,0570,71 99%-ые ДИ и для LR[+] и для LR[-]
- 39. Предостережение Подобные исследования следует рассматривать как сугубо предварительные (пилотные, разведочные, обучающие). Об этом свидетельствуют в частности
- 40. Одно распределение «вложено» в другое: ROC-анализ неприменим Гистограмма
- 41. Еще пример, когда ROC-анализ неприменим Гистограмма
- 42. Нормальные вероятностные графики Здоровые СЗРП
- 43. Проверка нормальности (гауссовости) распределения у матерей здоровых детей и детей с СЗРП Все Р-значения превышают пороговое
- 44. Графики (диаграммы) «короб с усами», программа Instat+ http://www.rdg.ac.uk/ssc/software/instat/instat.html
- 45. Резко выделяющиеся значения – «выбросы» Выскакивающие значения можно и нужно выявлять. Но отбрасывать их следует на
- 46. Сжатие (свертка, редукция) статистических данных Статистика – любая функция от случайных величин, порождающих получаемые статистические данные.
- 47. Основная логика статистического оценивания: интервальные оценки Понятно, что если мы многократно повторим эксперимент, то вычисленные средние
- 48. Статистические гипотезы В обычном языке слово «гипотеза» означает предположение. В том же смысле оно употребляется и
- 49. Проверяемая гипотеза В подавляющем большинстве реальных ситуаций проверяемая статистическая гипотеза является гипотезой об отсутствии того или
- 50. Использование доверительных интервалов (ДИ) для проверки нулевых гипотез Например, для проверки нулевой гипотезы о равенстве двух
- 51. Визуализация результатов проверки статистических гипотез с помощью доверительных интервалов для размера эффекта
- 52. Графическое представление результатов статистического сравнения групп матерей здоровых детей и детей с СЗРП, 1-α = 0,99.
- 53. Статистики критериев (тестовые статистики) Тестовая статистика – статистика, используемая для проверки конкретной статистической гипотезы. Пример: статистика
- 54. Р-значение Для проверки нулевых гипотез с помощью статистических критериев основным приемом является вычисление значения вероятности, которое
- 55. Р-значение P-значение есть условная вероятность, а именно: Вероятность получить наблюдаемое значение tнабл. статистики некоего критерия T
- 56. Выбор порога для P-значения, и можно ли его обосновать? Когда наблюдаемое P-значение мало, то появляется соблазн
- 57. Андрей Николаевич Колмогоров (урождённый Катаев, 12(25).04.1903 — 20.10.1987) Пророк в своем отечестве
- 58. Колмогоров А. Н. Вероятность. ВиМСЭ (1951). С. 97: http://ru.science.wikia.com/wiki/Вероятность_(в_теории_вероятностей) При практическом употреблении вычисленных значений вероятности мы
- 59. Колмогоров, 1951, 1956 «Норма в 0,05 для серьезных научных исследований явно недостаточна» (1956). «Хотя в статистике
- 60. В модных ныне изысканиях различного рода генетических предрасположенностей, когда проверяются миллионы аллелей различных генов, исследователи ориентируются
- 61. «Фильтруйте базар»: Sterne J.A.C., Davey Smith G. Sifting the evidence – what’s wrong with significance tests?
- 62. Традиционная интерпретация P-значений (шкала Michelin)
- 63. Глотов Н.В., Животовский Л.А., Хованов Н.В., Хромов-Борисов Н.Н. Биометрия, Л.: Изд-во ЛГУ, 1982. – 264 с.
- 64. [0,05; 0,01] – «серая зона»
- 65. Sir Ronald Aylmer Fisher 17.02.1890 – 29.07.1962
- 66. Пожелание: «гибкие» P-значения «В действительности ни один исследователь не пользуется фиксированным уровнем значимости с которым из
- 67. Результаты статистического сравнение групп матерей здоровых детей и детей с СЗРП, 1-α = 0,99. Программа ESCI
- 68. Основная логика использования Р-значений состоит в том, что если оно малó, то считается, что малоправдоподобно получить
- 69. Акт интеллектуальной смелости Когда P-значение очень мало, мы берем на себя смелость отклонить нулевую гипотезу (и
- 70. Распространенный соблазн Квинтэссенцию традиционных (частотнических) заключений при проверке статистических гипотез принято интерпретировать так: чем меньше P-значение,
- 71. Распространенное заблуждение P-значение не есть вероятность нулевой гипотезы ! Поскольку P-значение вычисляется при условии, что справедлива
- 72. P-значение не есть вероятность нулевой гипотезы! К сожалению, даже в известной книге С.Гланца можно встретить утверждение:
- 73. Калибровка P-значения Sellke T., Bayarri M.J., Berger J.O. Calibration of p Values for Testing Precise Null
- 74. Калибровка P-значений Held L. A nomogram for P values. BMC Medical Research Methodology 2010, 10:21 doi:10.1186/1471-2288-10-21
- 78. «Цена» Р-значения Для наглядности значения в таблице округлены до первой значащей цифры. Более точно значения для
- 79. Бейзовская интерпретация Р-значения Обычно принято интерпретировать P-значения как меру доказательства, предоставляемого имеющимися данными, против нулевой гипотезы.
- 80. Привычка свыше нам дана Это прекрасно понимал Р.А. Фишер: «Критерий значимости не позволяет нам делать какие-либо
- 81. Статистическая значимость и размер эффекта Эффект (различие, связь, риск, польза, ассоциация и т. п.) может быть
- 82. Размер эффекта Вопрос о клинической (практической) ценности (важности) наблюдаемого Размера Эффекта является ключевым при интерпретации результатов
- 83. Стандартизированный размер эффекта по Коуэну (Cohen) dC
- 84. Интерпретация стандартизированного размера эффекта dC http://www.sportsci.org/resource/stats/
- 85. Результаты статистического сравнения групп матерей здоровых детей и детей с СЗРП, (1 - α) = 0,99.
- 86. Бейзов фактор, BF Бейзов фактор – это показатель того, насколько хорошо две гипотезы могут предсказать данные.
- 87. Интерпретация убедительности Бейзовых факторов, BF10 и BF01
- 88. Бейзов фактор, программа Bayes Factor Calculators http://pcl.missouri.edu/bayesfactor
- 89. Вывод результатов (output) В 5555 раз (1/0,00018) более правдоподобно получить наблюдаемые различия (ES = 52,1 у.е.)
- 90. Статистические предсказания и воспроизводимость
- 91. Воспроизводимость и предсказания абсолютного размера эффекта для групп матерей здоровых детей и детей с СЗРП. Программа
- 92. Воспроизводимость и предсказания стандартизированного размера эффекта по Коуэну (Cohen) dC
- 93. Воспроизводимость и предсказания размеров эффекта ES и dC для групп матерей здоровых детей и детей с
- 94. Ошибки I и II рода и мощность статистического критерия
- 95. Диагностика Болезнь Тест
- 96. Теория Неймана-Пирсона: Ошибки I и II рода и мощность критерия Действи-тельность Критерий
- 97. Компромисс Например, в случае металлодетектора повышение чувствительности прибора приведёт к увеличению риска ошибки первого рода (ложная
- 98. Мощность статистического критерия Мощность статистического критерия есть вероятность того, что критерий правильно отклонит ложную нулевую гипотезу
- 99. Мощность статистического критерия Мощность статистического критерия измеряет способность критерия выявлять истинные различия (эффекты). Ее можно интерпретировать
- 100. Доверяя, повторяй Часто считается, что если получен «статистически значимый» результат, то это исключает необходимость повторить исследование.
- 101. Воспроизводимость P-значений и ДИ Cumming, G. (2008). Replication and p intervals: p values predict the future
- 102. Анализ мощности a priori или post-hoc Анализ мощности можно проводить либо a priori, т.е. до получения
- 103. Оценка достигнутой мощности (post hoc). Программа G*Power http://www.psycho.uni-duesseldorf.de/aap/projects/gpower/ Достигнутая мощность проведенного исследования составила (1 – β)
- 104. Элементы планирования эксперимента
- 105. Программа G*Power http://www.psycho.uni-duesseldorf.de/abteilungen/aap/gpower3 Оценка a priori минимально необходимого объема выборки N для достижения статистически значимого отличия
- 106. Оценка необходимых объемов выборок (a priori) Для достижения приемлемой статистической мощности (1 – β) = 0,95
- 107. Значение вероятностной P-величины P-значение есть наблюдаемое значение (реализация) соответствующей случайной величины Всякий раз мы наблюдаем одно
- 108. Отсюда следует, что, строго говоря, на основе всего лишь одного изолированного исследования нельзя делать определенные выводы.
- 109. Научный метод Ни один уважающий себя ученый не ограничится в своих исследованиях одним-единственным экспериментом, хотя бы
- 110. Культ одиночного изолированного исследования Чрезмерное «увлечение» анализом одиночных наборов данных пронизывает почти всю статистическую литературу и
- 111. Повторение – мать познания Повторение составляет суть науки: ученый должен всегда задумываться о том, что произойдет,
- 112. Джон Уайлдер Тьюки (John Wilder Tukey, 16.04.1915 — 26.07.2000) Исследования должны быть как минимум двухэтапными. Первый
- 114. Скачать презентацию