Статистический образ мышления. Научная публикация. (Лекция 3)

Содержание

Слайд 2

Основные выводы предыдущих лекций

Научная публикация – основной результат деятельности исследователя.
Максимальную ценность в

Основные выводы предыдущих лекций Научная публикация – основной результат деятельности исследователя. Максимальную
среднем имеет публикация статьи в международном журнале с высоким импакт-фактором.
Для подготовки подобной публикации необходимо понимание методов оценки качества научного продукта.
Первичную оценку качества осуществляют рецензенты; рецензент – бесплатный помощник автора.
Вторичную оценку качества осуществляют пользователи (читатели), которые цитируют либо не цитируют научную публикацию.

Слайд 3

Задачи лекции

Ознакомление со статистическим образом мышления.
Ознакомление с вероятностными суждениями.
Демонстрация критического анализа научной

Задачи лекции Ознакомление со статистическим образом мышления. Ознакомление с вероятностными суждениями. Демонстрация
публикации.
Обучение способам интерпретации статистических выводов.

Слайд 4

Поездка из дома на работу

Запереть дверь квартиры.
Спуститься на 1й этаж.
Дойти до остановки.
Дождаться

Поездка из дома на работу Запереть дверь квартиры. Спуститься на 1й этаж.
транспорта.
Поездка в транспорте.
Дойти до здания университета.
Дойти от дверей до рабочего места.

Слайд 5

Поездка из дома на работу

Запереть дверь квартиры. – 30 с.
Спуститься на 1й

Поездка из дома на работу Запереть дверь квартиры. – 30 с. Спуститься
этаж. – 90 с.
Дойти до остановки. – 120 с.
Дождаться автобуса. – 600 с.
Поездка в автобусе. – 600 с.
Дойти до здания университета. – 120 с.
Дойти от дверей до рабочего места.–120с.
ВСЕГО 1680 с. (=28 мин.)

Слайд 6

Поездка из дома на работу

Что представляет собой, с точки зрения математической статистики,

Поездка из дома на работу Что представляет собой, с точки зрения математической
полученная величина (1680 с.)?

Слайд 7

Поездка из дома на работу

Что представляет собой, с точки зрения математической статистики,

Поездка из дома на работу Что представляет собой, с точки зрения математической
полученная величина (1680 с.)?
Это - среднее значение, одна из важнейших характеристик распределения вероятностей случайной величины.

Слайд 8

Среднее значение нормально распределенной величины

Среднее значение нормально распределенной величины

Слайд 9

Поездка из дома на работу

Что представляет собой, с точки зрения математической статистики,

Поездка из дома на работу Что представляет собой, с точки зрения математической
полученная величина (1680 с.)?
Это - среднее значение, одна из важнейших характеристик распределения вероятностей случайной величины.
Откуда взялась эта величина?

Слайд 10

Поездка из дома на работу

Что представляет собой, с точки зрения математической статистики,

Поездка из дома на работу Что представляет собой, с точки зрения математической
полученная величина (1680 с.)?
Это - среднее значение, одна из важнейших характеристик распределения вероятностей случайной величины.
Откуда взялась эта величина?
В результате неосознанного анализа множественных наблюдений.

Слайд 11

Поездка из дома на работу

Что представляет собой, с точки зрения математической статистики,

Поездка из дома на работу Что представляет собой, с точки зрения математической
полученная величина (1680 с.)?
Это - среднее значение, одна из важнейших характеристик распределения вероятностей случайной величины.
Означает ли это, что я гарантированно приду вовремя, если выйду из дома за 29 мин. до начала рабочего дня?

Слайд 12

Поездка из дома на работу

Дождаться автобуса. – 600 с.
Доверительный интервал (CI95) 100-1100

Поездка из дома на работу Дождаться автобуса. – 600 с. Доверительный интервал
с. (с вероятностью 95% я уложусь в это время).
Опоздание автобуса – дело обычное; но в конце концов он все-таки придет.
При расчете запаса времени это событие необходимо учитывать.
Для расчета запаса времени необходимо знать ответ на вопрос: «Какова цена опоздания на работу?».

Слайд 13

Какова цена опоздания на работу?

Тюремное заключение.
Штраф в размере 5-дневной зарплаты.
Штраф в размере

Какова цена опоздания на работу? Тюремное заключение. Штраф в размере 5-дневной зарплаты.
дневной зарплаты.
Шеф накричит.
Скорее всего, никто не заметит.

Слайд 14

Доверительный интервал для нормально распределенной величины

Доверительным называется интервал, в который
попадает неизвестный

Доверительный интервал для нормально распределенной величины Доверительным называется интервал, в который попадает
параметр
с заданной вероятностью (1-α).

CI95
CI99

Слайд 15

Какова цена опоздания на работу? Какой принимаем доверительный интервал?*

Тюремное заключение. - CI99.99
Штраф в

Какова цена опоздания на работу? Какой принимаем доверительный интервал?* Тюремное заключение. -
размере 5-дневной зарплаты.-CI99
Штраф в размере дневной зарплаты. - CI95
Шеф накричит. - CI90
Скорее всего, никто не заметит. – CI80

*Приведенные примеры доверительных интервалов не стоит
рассматривать как рекомендованные лектором.

Слайд 16

Статистическая оценка вероятности опоздания

Частотное распределение продолжительности поездки из
дома на работу. Стрелками

Статистическая оценка вероятности опоздания Частотное распределение продолжительности поездки из дома на работу.
показаны приближенные зна-
чения времени, которое необходимо запланировать на
поездку для того, чтобы вероятность опоздания на работу
составляла 20, 10 и 5%.

Слайд 17

Статистическая природа «жизненного опыта»

Существенная часть «жизненного опыта» представляет собой результат неосознанной статистической

Статистическая природа «жизненного опыта» Существенная часть «жизненного опыта» представляет собой результат неосознанной
обработки множественных наблюдений.
Мы используем теорию вероятностей гораздо чаще, чем сами об этом догадываемся.
Многие наши суждения носят вероятностный характер.

Слайд 18

Примеры вероятностных высказываний

Команда А сильнее команды Б.
Овощи на колхозном рынке дешевле, чем

Примеры вероятностных высказываний Команда А сильнее команды Б. Овощи на колхозном рынке
в супермаркете.
Питбули агрессивнее пуделей.
Черемуха зацветает раньше рябины.
… … …

Слайд 19

Примеры истинных высказываний

Площадь квадрата равна квадрату длины его стороны (функциональная связь).
Свинец тяжелее

Примеры истинных высказываний Площадь квадрата равна квадрату длины его стороны (функциональная связь).
меди (фундаментальные свойства вещества).
Эйфелева башня выше главного здания Московского Государственного Университета (сравнение конечного количества однозначно определенных объектов).
Вчера в центре Архангельска шел снег (событие уже свершилось).

Слайд 20

Биология / экология

Функциональные связи встречаются крайне редко.
Свойства объектов несводимы к фундаментальным свойствам

Биология / экология Функциональные связи встречаются крайне редко. Свойства объектов несводимы к
вещества.
Ученые предпочитают делать выводы о неопределенном количестве объектов.
Ученые стараются делать выводы, имеющие предсказательную ценность.

Слайд 21

Выводы

Биология – наука, основанная на вероятностных суждениях.
Следовательно, любое утверждение ученого должно сопровождаться

Выводы Биология – наука, основанная на вероятностных суждениях. Следовательно, любое утверждение ученого
оценкой вероятности того, что оно ложно (т.е. что из собранных материалов нужно было сделать иное заключение).

Слайд 22

«Западный» подход к использованию статистики

Пропорция статей, в которых приводятся числовые данные, результаты

«Западный» подход к использованию статистики Пропорция статей, в которых приводятся числовые данные,

их статистической обработки, а также математические модели – по
результатам обзора статей, опубликованных в The American Naturalist
(Sokal & Rohlf 1995). Поскольку The American Naturalist не специализи-
руется на какой-либо узкой области знаний, он часто используется для
выявления общих тенденций в биологических исследованиях.

Нет численных данных

Статья посвящена математи-
ческому моделированию или
статистическому анализу

Есть численные данные, но
нет статистического анализа

Есть численные данные и
их статистический анализ

Слайд 23

Частота встречаемости (%) статистических терминов (1990-1991)

>

>

>

>



>

>

<

Данные из: Будилова и др. (1995) Журн.

Частота встречаемости (%) статистических терминов (1990-1991) > > > > ≈ ≈
Общ. Биол. Т. 56 № 2 с. 179-190

Слайд 24

Частота использования (%) статистических методов (1990-1991)

<

>

>

<

Данные из: Будилова и др. (1995) Журн.

Частота использования (%) статистических методов (1990-1991) > > Данные из: Будилова и
Общ. Биол. Т. 56 № 2 с. 179-190

Слайд 25

Частота использования (%) статистических методов (2000-2001)

Частота использования (%) статистических методов (2000-2001)

Слайд 26

Причины пренебрежения статистическим анализом

Практические:
Непонимание важности;
Неумение пользоваться;
Необязательность для публикации статьи;
Опасение за качество своих

Причины пренебрежения статистическим анализом Практические: Непонимание важности; Неумение пользоваться; Необязательность для публикации
данных.
Теоретические:
Философы времен Т.Д. Лысенко;
Проф. В.С. Ипатов (СПбГУ).

Слайд 27

Анализ статьи Ильина и Смирнова (2000) – Экология № 2, с. 118-124.
Каково

Анализ статьи Ильина и Смирнова (2000) – Экология № 2, с. 118-124.
методическое качество этого исследования?
Пригодны ли данные, приведенные авторами, для проверки выдвинутой ими гипотезы?
Согласуются ли выводы авторов с приведенными ими данными?

Слайд 28

Анализ статьи Ильина и Смирнова (2000) – Экология № 2, с. 118-124.
Было

Анализ статьи Ильина и Смирнова (2000) – Экология № 2, с. 118-124.
ли спланировано это исследование?
Пригодны ли данные, приведенные авторами, для проверки выдвинутой ими гипотезы?
Согласуются ли выводы авторов с приведенными ими данными?

Слайд 29

Анализ статьи Ильина и Смирнова (2000) – Экология № 2, с. 118-124.
Было

Анализ статьи Ильина и Смирнова (2000) – Экология № 2, с. 118-124.
ли спланировано это исследование? – Нет.
Пригодны ли данные, приведенные авторами, для проверки выдвинутой ими гипотезы?
Согласуются ли выводы авторов с приведенными ими данными? – Из статьи не ясно, но можно проверить.

Слайд 30

Анализ статьи Ильина и Смирнова (2000) – Экология № 2, с. 118-124.
Было

Анализ статьи Ильина и Смирнова (2000) – Экология № 2, с. 118-124.
ли спланировано это исследование? – Нет.
Пригодны ли данные, приведенные авторами, для проверки выдвинутой ими гипотезы? – Нет.
Согласуются ли выводы авторов с приведенными ими данными? – Из статьи не ясно, но можно проверить.

Слайд 31

Анализ статьи Ильина и Смирнова (2000) – Экология № 2, с. 118-124.
Было

Анализ статьи Ильина и Смирнова (2000) – Экология № 2, с. 118-124.
ли спланировано это исследование? – Нет.
Пригодны ли данные, приведенные авторами, для проверки выдвинутой ими гипотезы? – Нет.
Согласуются ли выводы авторов с приведенными ими данными? – Из статьи не ясно, но можно проверить.

Слайд 32

Согласуются ли выводы Ильина и Смирнова (2000) с приведенными ими данными?

Гипотеза 1:

Согласуются ли выводы Ильина и Смирнова (2000) с приведенными ими данными? Гипотеза
связи с разными типами рельефа одинаковы в теплое и холодное время года;
Гипотеза 2: распространение видов не связано с рельефом (а – в теплое время года, б – в холодное время года).
В этом случае количество находок должно быть пропорционально площадям различных типов рельефа.
Определяем площади, занятые разными типами рельефа, и считаем количество находок на них.
Применяем простейший метод анализа (критерий Х2).

Слайд 33

Согласуются ли выводы Ильина и Смирнова (2000) с приведенными ими данными?

Расчеты, выполненные

Согласуются ли выводы Ильина и Смирнова (2000) с приведенными ими данными? Расчеты,
лектором, показали: в целом – не согласуются!
15 из 30 утверждений авторов (в красных рамках) противоречат их собственным данным.

Слайд 34

Анализ статьи Ильина и Смирнова (2000) – Экология № 2, с. 118-124.
Данные,

Анализ статьи Ильина и Смирнова (2000) – Экология № 2, с. 118-124.
собранные авторами, непригодны для проверки выдвинутой ими гипотезы. – Работа не была спланирована; основана на материалах, собранных для других целей!
Даже к том случае, если бы эти данные были пригодны для проверки этой гипотезы, половина сделанных авторами выводов противоречит их собственным данным. – Не было проведено статистического анализа данных!

Слайд 35

Анализ статьи Ильина и Смирнова (2000) – Экология № 2, с. 118-124.
Данные,

Анализ статьи Ильина и Смирнова (2000) – Экология № 2, с. 118-124.
собранные авторами, непригодны для проверки выдвинутой ими гипотезы. – Работа не была спланирована; основана на материалах, собранных для других целей!
Даже к том случае, если бы эти данные были пригодны для проверки этой гипотезы, половина сделанных авторами выводов противоречит их собственным данным. – Не было проведено статистического анализа данных!

Слайд 36

Старые НЕдобрые времена…

“…нас, биологов, не интересуют математические выкладки, подтверждающие практически бесполезные статистические

Старые НЕдобрые времена… “…нас, биологов, не интересуют математические выкладки, подтверждающие практически бесполезные
формулы…”
“применение средств математики отводит нас, естествоиспытателей, от познания природы”
Цитировано по критической статье: Гнеденко Б.В.
О роли математических методов в биологических исследованиях // Вопросы философии. 1959.
№ 1. С. 85–97

Слайд 37

Старые НЕдобрые времена…

Дополнительная информация:
Леонов В.П. Долгое прощание с лысенковщиной // Биометрика. 1999.

Старые НЕдобрые времена… Дополнительная информация: Леонов В.П. Долгое прощание с лысенковщиной //
URL: http://www.biometrica.tomsk.ru/lis.htm
Любищев А.А. Об ошибках в применении математики в биологии. I. Ошибки от недостатка осведомленности // Журн. общ. биол. 1969. Т. 30. № 5. С. 572–584.
Любищев А.А. Об ошибках в применении математики в биологии. 2. Ошибки, связанные с избытком энтузиазма // Журн. общ. биол. 1969. Т. 30. № 6, с. 715-723.

Слайд 38

Современные противники статистического анализа

«применение вероятностной оценки оправдано только в тех случаях, когда

Современные противники статистического анализа «применение вероятностной оценки оправдано только в тех случаях,
исследуемые варьирующие признаки в выборке соответствуют нормальному случайному распределению или не слишком от него отличаются» (с. 1495)
Ипатов В.С. Осторожно – биометрика. (Об использовании оценок «достоверности» при исследовании количественных закономерностей // Бот. журн. 2010. Т. 95. № 10. С. 1494–1498.

Слайд 39

Это полезно запомнить:

Существенная часть «жизненного опыта» представляет собой результат неосознанной статистической обработки

Это полезно запомнить: Существенная часть «жизненного опыта» представляет собой результат неосознанной статистической
множественных наблюдений.
В науке необходима бóльшая точность, чем в повседневной жизни.
Следовательно, любое утверждение ученого должно сопровождаться оценкой вероятности того, что оно ложно (т.е., что из собранных материалов нужно было сделать иное заключение).

Слайд 40

Учимся понимать статистические выводы

Пример 1
Газета Guardian, сообщая об участившихся случаях раковых заболеваний

Учимся понимать статистические выводы Пример 1 Газета Guardian, сообщая об участившихся случаях
в городе Aldermaston (где находится производство расщепляющихся веществ): “probability of chance occurrence [вероятность случайного наблюдения] is 1 of 10,000,000”.
Вероятность того, что при случайном распределении раковых заболеваний по территории страны могла возникнуть наблюдаемая картина, составляет 1 : 10,000,000.

Слайд 41

Учимся понимать статистические выводы

Пример 1
Газета Guardian, сообщая об участившихся случаях раковых заболеваний

Учимся понимать статистические выводы Пример 1 Газета Guardian, сообщая об участившихся случаях
в городе Aldermaston (где находится производство расщепляющихся веществ): “probability of chance occurrence [вероятность случайного наблюдения] is 1 of 10,000,000”.
Вероятность того, что при случайном распределении раковых заболеваний по территории страны могла возникнуть наблюдаемая картина, составляет 1 : 10,000,000.

Слайд 42

Учимся понимать статистические выводы

Какую именно гипотезу проверяли авторы?
Вариант 1
Нулевая гипотеза 1: случаи

Учимся понимать статистические выводы Какую именно гипотезу проверяли авторы? Вариант 1 Нулевая
раковых заболеваний распределены по территории страны случайным образом.
Альтернативная гипотеза 1: случаи раковых заболеваний рас- пределены по территории страны НЕслучайным образом.
Вариант 2
Нулевая гипотеза 2: частота раковых заболеваний в городе Aldermaston не отличается от средней по стране.
Альтернативная гипотеза 2: частота раковых заболеваний в городе Aldermaston отличается от средней по стране.
Вариант 3
Нулевая гипотеза 3: частота раковых заболеваний в городе Aldermaston не отличается от средней по стране.
Альтернативная гипотеза 3: частота раковых заболеваний в городе Aldermaston выше, чем в среднем по стране.

Слайд 43

Учимся понимать статистические выводы

Все три варианта имеют право на существование.
Вариант 1 отличается

Учимся понимать статистические выводы Все три варианта имеют право на существование. Вариант
от вариантов 2 и 3 методами как сбора, так и обработки данных.
Вариант 3 отличается от варианта 2 методом обработки данных.
Для решения задачи 3 требуется меньшая выборка, чем для решения задачи 2 с той же точностью.

Слайд 44

Учимся понимать статистические выводы

Из опубликованного вывода не ясно, какую именно гипотезу проверяли

Учимся понимать статистические выводы Из опубликованного вывода не ясно, какую именно гипотезу
авторы исследования.
Эта гипотеза, несомненно, была упомянута в работе (просто газетчики про нее не написали).
От проверяемой гипотезы зависят способ сбора материала и объемы выборок.
Этим определяется необходимость тщательного планирования любого исследования, выводы которого будут носить вероятностный характер.

Слайд 45

Учимся понимать статистические выводы

Величина эффекта из опубликованного вывода не очевидна.
Для определения величины

Учимся понимать статистические выводы Величина эффекта из опубликованного вывода не очевидна. Для
эффекта часто необходимо использовать иные методы, чем для определения его статистической значимости.
Величина эффекта часто важна для принятия решений (сравним, например, возрастание частоты раковых заболеваний на 1% и на 10%).

Слайд 46

Учимся понимать статистические выводы

Пример 2
«Размеры листа березы уменьшаются с широтой места сбора

Учимся понимать статистические выводы Пример 2 «Размеры листа березы уменьшаются с широтой
(r = -0.76, n = 10, P = 0.01).»
Вероятность того, что на самом деле в генеральной совокупности изучаемые признаки не связаны друг с другом (r = 0.00), составляет 1% (один случай из 100).

Слайд 47

Учимся понимать статистические выводы

Пример 2
«Размеры листа березы уменьшаются с широтой места сбора

Учимся понимать статистические выводы Пример 2 «Размеры листа березы уменьшаются с широтой
(r = -0.76, n = 10, P = 0.01).»
Вероятность того, что на самом деле в генеральной совокупности изучаемые признаки не связаны друг с другом (r = 0.00), составляет 1% (один случай из 100).

Слайд 48

Учимся понимать статистические выводы

Пример 2
«Размеры листа березы уменьшаются с широтой места сбора

Учимся понимать статистические выводы Пример 2 «Размеры листа березы уменьшаются с широтой
(r = -0.76, n = 10, P = 0.01).»
Вероятность того, что на самом деле в генеральной совокупности изучаемые признаки не связаны друг с другом (r = 0.00), составляет 1% (один случай из 100).

Достигнутый уровень значимости –
это вероятность получения такого же
(или более экстремального) значения
коэффициента корреляции в выборке из
генеральной совокупности, в которой
отсутствует корреляция между
изучаемыми признаками.

Слайд 49

Учимся понимать статистические выводы

Пример 2
«Размеры листа березы уменьшаются с широтой места сбора

Учимся понимать статистические выводы Пример 2 «Размеры листа березы уменьшаются с широтой
(r = -0.76, n = 10, P = 0.01).»
Вероятность того, что на самом деле в генеральной совокупности изучаемые признаки не скоррелированы друг с другом (r = 0.00), составляет 1% (один случай из 100).

Слайд 50

Учимся понимать статистические выводы

Пример 3
«Размеры листа березы не зависят от широты места

Учимся понимать статистические выводы Пример 3 «Размеры листа березы не зависят от
сбора (r = -0.36, n = 10, P = 0.31).»
Вероятность того, что на самом деле в генеральной совокупности изучаемые признаки не связаны друг с другом (r = 0.00), составляет 1% (один случай из трех).

Слайд 51

Учимся понимать статистические выводы

Пример 3
«Размеры листа березы не зависят от широты места

Учимся понимать статистические выводы Пример 3 «Размеры листа березы не зависят от
сбора (r = -0.36, n = 10, P = 0.31).»
Вероятность того, что на самом деле в генеральной совокупности изучаемые признаки не скоррелированы друг с другом (r = 0.00), составляет 31% (один случай из трех).

Слайд 52

Учимся понимать статистические выводы

В чем разница между примерами 2 и 3?
«Размеры листа

Учимся понимать статистические выводы В чем разница между примерами 2 и 3?
березы уменьшаются с широтой места сбора (r = -0.76, n = 10, P = 0.01).»
«Размеры листа березы не зависят от широты места сбора (r = -0.36, n = 10, P = 0.31).»
Проверяли одну и ту же гипотезу.
Использовали однотипный материал.
Пришли к принципиально разным выводам (по бинарной шкале: да/нет).

Слайд 53

Учимся понимать статистические выводы

В чем разница между примерами 2 и 3?
«Размеры листа

Учимся понимать статистические выводы В чем разница между примерами 2 и 3?
березы уменьшаются с широтой места сбора (r = -0.76, n = 10, P = 0.01).»
«Размеры листа березы не зависят от широты места сбора (r = -0.36, n = 10, P = 0.31).»
Проверяли одну и ту же гипотезу.
Использовали однотипный материал.
Пришли к принципиально разным выводам (по бинарной шкале: да/нет).

Слайд 54

Учимся понимать статистические выводы

Принципиальной разницы между примерами 2 и 3 нет!
Проверяли одну

Учимся понимать статистические выводы Принципиальной разницы между примерами 2 и 3 нет!
и ту же гипотезу.
Использовали однотипный материал.
Получили разную оценку вероятности того, что нулевая гипотеза (отсутствие корреляции) верна – 1% и 31%.
Договорились считать, что отклоняем нулевую гипотезу, если вероятность того, что она верна, не превышает 5%.

Слайд 55

Практическая рекомендация

Не следует абсолютизировать «граничное» значение Р = 0.05 – это лишь

Практическая рекомендация Не следует абсолютизировать «граничное» значение Р = 0.05 – это
условная граница между скорее всего верными и скорее всего ошибочными гипотезами.
Избегайте крайностей типа: «Значимые различия были найдены между популяциями А и В (Р = 0.045), в то время как популяции В и С не различались (Р = 0.055)» (пример реальный, приведен по: Yoccoz 1991).

Слайд 56

Практическая рекомендация

Всегда приводите полученные значения вероятностей! Читатель вправе знать, насколько обоснован Ваш

Практическая рекомендация Всегда приводите полученные значения вероятностей! Читатель вправе знать, насколько обоснован
вывод:
«Значимые различия были найдены между популяциями А и В, в то время как популяции В и С не различались» - плохо!
«Значимые различия были найдены между популяциями А и В (Р = 0.045), в то время как популяции В и С не различались (Р = 0.055)» - хорошо!

Слайд 57

Учимся понимать статистические выводы

В примерах 2 и 3 получены разные оценки силы

Учимся понимать статистические выводы В примерах 2 и 3 получены разные оценки
связи (-0.76 и -0.36) между размерами листа и широтой местности.
Однако с точки зрения проверяемой гипотезы (связь отсутствует / имеется) эти различия не представляют интереса.
С точки зрения здравого смысла эти различия представляют несомненный интерес.
Мы можем проверить гипотезу, что r1 = r2, но для этого потребуется другой метод анализа данных.

Слайд 58

Величина эффекта и его статистическая значимость

Величина эффекта часто гораздо важнее его статистической

Величина эффекта и его статистическая значимость Величина эффекта часто гораздо важнее его
значимости – как для принятий решений, так и для оценки важности полученного результата.
Сравним, например, сообщения о том, что в некоем городе частота раковых заболеваний за последние 10 лет возросла
на 10% при значимости 95.0%
на 0.1% при значимости 99.9%.
Очевидно, что первое сообщение встревожит жителей гораздо больше, хотя вероятность ошибочного вывода ниже во втором случае.

на 10% при значимости 95.0%
на 0.1% при значимости 99.9%.

Слайд 59

Что значит «достоверно»?

Четкость формулировок чрезвычайно важна при описании как методики исследований, так

Что значит «достоверно»? Четкость формулировок чрезвычайно важна при описании как методики исследований,
и полученных результатов. Особенно важно стремиться к максимальному сужению смыслового спектра научных терминов.
В этом отношении описанию результатов статистического анализа явно «не повезло» в русскоязычной биологической и медицинской литературе, где прочно закрепилось слово «достоверность» (Зорин, 2000, 2011).

Слайд 60

http://www.hta-rus.ru/files/s15_1352793575.pdf

http://www.hta-rus.ru/files/s15_1352793575.pdf

Слайд 61

Авторы отечественных медицинских статей достаточно произвольно употребляют статистическую терминологию наравне с обыденными

Авторы отечественных медицинских статей достаточно произвольно употребляют статистическую терминологию наравне с обыденными
значениями тех же слов, их однокоренными аналогами и синонимами.
Слова «достоверность» и «значимость» как употребляли в 1997 – 1998 гг., так и продолжают употреблять в 2018 г. как взаимозаменяемые, нередко в одном и том же тексте, наделяя их функцией термина, и по-прежнему используют наряду с терминами и как обыденные слова.

Слайд 62

Что значит «достоверно»?

Что значит «достоверно»?

Слайд 63

Что значит «достоверно»?

«Вероятность случайности различий соответствует достоверности».
(Пример реальный. Я так

Что значит «достоверно»? «Вероятность случайности различий соответствует достоверности». (Пример реальный. Я так
и не смог понять, оказались анализируемые различия значимыми или не значимыми.)
«Смутно пишут о том, о чем смутно представляют.»
М. В. Ломоносов

Слайд 64

Что значит «достоверно»?

«Вероятность случайности различий соответствует достоверности».
(Пример реальный. Я так

Что значит «достоверно»? «Вероятность случайности различий соответствует достоверности». (Пример реальный. Я так
и не смог понять, оказались анализируемые различия значимыми или не значимыми.)
«Смутно пишут о том, о чем смутно представляют.»
М. В. Ломоносов

Слайд 65

Что значит «достоверно»?

«Вероятность случайности различий соответствует достоверности».
(Пример реальный. Я так

Что значит «достоверно»? «Вероятность случайности различий соответствует достоверности». (Пример реальный. Я так
и не смог понять, оказались анализируемые различия значимыми или не значимыми.)
«Смутно пишут о том, о чем смутно представляют.»
М. В. Ломоносов

Слайд 66

Что значит «достоверно»?

Изначально использование понятия «достоверность» было связано с некорректным переводом термина

Что значит «достоверно»? Изначально использование понятия «достоверность» было связано с некорректным переводом
«significance».
Определенную роль в его широком распространении сыграла ошибочная ассоциация с одним из понятий теории вероятности – достоверным событием (событие, вероятность которого строго равна единице).

Слайд 67

Что значит «достоверно»?

В любом случае, поскольку слово «достоверность» перегружено смыслом, в строго

Что значит «достоверно»? В любом случае, поскольку слово «достоверность» перегружено смыслом, в
статистическом значении его лучше не употреблять, а использовать термин «статистическая значимость».
Прежде всего, это следует делать из-за того, что «достоверность» подсознательно ассоциируется с «абсолютной доказанностью», «надежностью», «несомненностью», «безошибочностью», а «достоверная связь» – с причинно-следственной, что некорректно по отношению к вероятностным выводам.

Слайд 68

Что значит «достоверно»?

Статистика не занимается «определением достоверности» – статистический анализ позволяет лишь

Что значит «достоверно»? Статистика не занимается «определением достоверности» – статистический анализ позволяет
определить вероятность того, что некоторая гипотеза верна.

Слайд 69

Что может статистика?

Выполнить свертку информации: подсчет некоторых характеристик выборки и (на основании

Что может статистика? Выполнить свертку информации: подсчет некоторых характеристик выборки и (на
этого) вынесение вероятностных суждений о характеристиках исследуемой популяции.
Пример: С вероятностью 0.95 средняя длина крыла комнатной мухи, пойманной в г. Мончегорске попадает в интервал от 5.73 до 6.28 мм.
Выполнить проверку гипотезы, то есть вынести вероятностное суждение по поводу истинности либо ложности некоего априорно сформулированного утверждения.
Пример: Вероятность того, что средняя длина крыла комнатной мухи в исследуемой выборке из г. Мончегорска отличается от средней длины крыла комнатной мухи в исследуемой выборке из г. Апатиты исключительно вследствие воздействия на эти выборки случайных факторов равна 0.8% (то есть Р = 0.008).
Провести статистическое моделирование.

Слайд 70

Статистика не может:

Определить генеральную совокупность, которую Вы хотите изучить.
Взять репрезентативную выборку из

Статистика не может: Определить генеральную совокупность, которую Вы хотите изучить. Взять репрезентативную
этой генеральной совокупности.
Случайным образом распределить повторности по отношению к планируемым экспериментальным воздействиям.
Выбрать переменные для измерения / подсчета.
Выбрать способ измерения / учета, не приводящий к получению смещенной оценки.

Эти задачи решаются во время планирования
исследования (эксперимента).

Слайд 71

Это полезно запомнить…

Отказ от использования статистического анализа может привести к ошибочной интерпретации

Это полезно запомнить… Отказ от использования статистического анализа может привести к ошибочной
данных и стать причиной заблуждений.
Отказ от использования статистического анализа (там, где он необходим) приведет к отклонению рукописи практически любым международным журналом.
Достигнутый уровень значимости – это вероятность получения такого же (или более экстремального) значения критерия в длинной серии повторных выборок при условии справедливости нулевой гипотезы.
Имя файла: Статистический-образ-мышления.-Научная-публикация.-(Лекция-3).pptx
Количество просмотров: 40
Количество скачиваний: 0