Содержание
- 2. Особенности выборки, необходимые для проведения параметрических тестов Случайность измерений (randomness) Независимость измерений (independence) Гомогенность дисперсии (homogeneity
- 3. Параметрические тесты: нулевая гипотеза формулируется о конкретных ПАРАМЕТРАХ РАСПРЕДЕЛЕНИЯ и/или эти параметры входят в формулу статистики
- 4. H0: μ ≤ 90 г; H1 : μ > 90 г Пусть σ известна. Распределение статистики
- 5. Основной вывод: пренебрежения условиями использования параметрических тестов может увеличивать ошибку 1-го рода. (Неизвестно, насколько) Примечание: слабые
- 6. Какие бывают распределения: 1. Равномерное (uniform) 2. Случайное (random) Могут быть и дискретными, и непрерывными Трансформация
- 7. Пример: рассмотрим выводки из 6 детёнышей каждый. Возможное соотношение самцов и самок в выводке: 6:0; 5:1;
- 8. Биномиальное распределение Количество самцов в выводке из 6 зверьков Вероятность такого выводка распределение количества «успехов» (самцов)
- 9. Распределение Пуассона Показывает вероятность того или иного количества независимых друг от друга событий (особей, контактов, мутаций
- 10. Экспоненциальное распределение Хорошо описывает распределение промежутков времени (расстояний) между случайными событиями с заданной средней частотой событий.
- 11. Другие распределения Логнормальное, Гамма, геометрическое, отрицательное биномиальное, гипергеометрическое и др. Можно посчитать критические значения для любых
- 12. Если распределение отлично от нормального (выборки не гомогенны, факторы мультипликативны), можно ТРАНСФОРМИРОВАТЬ данные частота частота значение
- 13. Логарифмическая трансформация (logarithmic transformation): Делает симметричным скошенное вправо (positively skewed) распределение. Используется в случае, когда чем
- 14. 2. Извлечение квадратного корня (square root transformation) Используется, когда чем больше среднее в группе, тем больше
- 15. Арксинусная трансформация (arcsine transformation) применяется для процентов и долей (Xi ≤ 1), которые обычно формируют биномиальное
- 16. Принципиально не годятся параметрические методы, если данные РАНГОВЫЕ: мы не знаем, насколько одно значение отличается от
- 17. Если наше распределение не удовлетворяет условиям параметрических тестов и ни одна трансформация не помогает, наш выбор
- 18. Мы исследуем два редких вида сумчатых. Нам важно узнать, различаются ли виды по тому, какую освещённость
- 19. Сравнение 2-х независимых групп: Манн-Уитни тест (Mann-Whitney U-test) Н0: распределение в популяции, из которой мы получили
- 20. Непараметрические критерии Это непараметрический аналог двухвыборочного t-теста. Ранжируем данные от меньшего к большему (игнорируя деление на
- 21. Статистика критерия: n1 и n2 – размер выборок, R1 и R2 – суммы рангов в выборках.
- 22. Непараметрические критерии Если размеры выборок больше 20, распределение статистики U приближается к нормальному со средним Поэтому
- 23. Сравнение 2-х независимых групп: Тест Колмогорова-Смирнова (Kolmogorov-Smirnov two-sample test) Отличается от теста Манн-Уитни тем, что М-У
- 24. Mann-Whitney U-test Kolmogorov-Smirnov two-sample test
- 25. В обоих тестах отвергаем Н0: оба теста показали, что освещённость, в которой обитают звери разных видов
- 26. Сравнение 2-х связанных групп Критерий Вилкоксона (Wilcoxon matched pair test) Изучаем утконосов, и хотим знать –
- 27. Фактор – пол. (1. самцы; 2. самки) Непараметрические методы Н0: распределение контактов в популяции, из которой
- 28. Считают разности между значениями в парах; исключают нулевые разности; присуждают абсолютным значениям (по модулю) разностей ранги;
- 29. Wilcoxon matched pair test Число дружелюбных контактов у самцов и самок в парах было неодинаковым
- 30. Непараметрические критерии Сравнение 2-х связанных групп Знаковый тест (Sign test) Считают разности в парах, но не
- 31. Непараметрические критерии Сравнение ≥3-х независимых групп Тест Крускала-Уоллиса (Kruskal-Wallis test) Мы получили возможность включить в работу
- 32. Непараметрические критерии Критерий Крускал-Уоллиса (Kruskal-Wallis test) Непараметрический аналог One-way ANOVA на 95% настолько же мощный, как
- 33. все значения ранжируются от меньшего к большему (игнорируя деление на группы); Считается сумма рангов в каждой
- 34. Непараметрические критерии При маленьких выборок и 3-5-и групп считается Н-статистика. Для больших выборок (или >5-и групп)
- 35. Непараметрические критерии Сравнение ≥2-х независимых групп Медианный тест (Median test) Считается общая медиана для всех групп
- 36. Kruskal-Wallis test Median test
- 37. Доля растительной пищи отличалась между разными видами
- 38. Непараметрические критерии Критерий Крускал-Уоллиса (Kruskal-Wallis test) Хотелось бы провести после сравнения нескольких групп пост-хок тест (апостериорное
- 39. Непараметрические критерии Сравнение ≥3 связанных групп Критерий Фридмана (Friedman ANOVA) У утконосов родились детёныши, и мы
- 40. Непараметрические критерии Критерий Фридмана (Friedman ANOVA) для двух групп эквивалентен Знаковому тесту (sign test); по сравнению
- 41. Friedman ANOVA
- 42. Отвергаем Н0 – состояние самок изменялось
- 43. Итак, при выборе теста важно, что: Параметрические тесты более мощные, чем непараметрические; Непараметрические безопаснее в плане
- 44. У нас есть выборка. Данные – качественные. Вопрос: соответствует ли распределение в популяции, из которой получена
- 45. 1:3 ?? Родились: 84 розовых мыши и 16 зелёных. H0: выборка получена из популяции, где соотношение
- 46. χ2cv = 3.841 H0 отвергаем – соотношение мышей не соответствует ожидаемому Чем больше значение χ2,тем хуже
- 47. Критерии согласия
- 48. Категорий может быть сколько угодно. Родились: 152 розовых мыши с острым хвостом; 39 розовых с курчавым
- 49. + 1:3:3:9 ?? Критерии согласия
- 50. Важное замечание: В всех критериях согласия H0 гипотеза – о том, что форма распределений ОДИНАКОВА. То
- 51. Zar, 1999: Если мы сравнили распределение с теоретическим, получили отличия (!), а теперь хотим показать, из-за
- 52. у нас одна выборка Переменная качественная мы сравниваем наблюдаемые частоты с ожидаемыми (observed and expected) Критерий
- 53. Сравнение нашего распределения с теоретическим (нужна таблица с посчитанными частотами)
- 54. результаты
- 55. Поправка Йейтса для критерия χ2 (Yates correction for continuity) 1:3 ?? Если у нас только 2
- 56. Например: если ожидаемые частоты – 75 и 25, то значения χ2 будут для 84 и 16
- 57. Биномиальный тест Элементарный тест для сравнения двух частот с теоретическими (для маленьких выборок, легко считать вручную).
- 58. Замечательный тест Колмогорова-Смирнова для ранговых данных (Kolmogorov-Smirnov goodness of fit for discrete ordinal scale data). 35
- 59. Соответствует ли распределение мотыльков на дереве НОРМАЛЬНОМУ РАСПРЕДЕЛЕНИЮ? Переменная – высота от земли в метрах Тест
- 60. Проверка распределения на нормальность
- 61. маленькое p говорит о том, что данные не соответствуют нормальному распределению.
- 62. Сравнение с другими теоретическими распределениями: Тест Колмогорова-Смирнова для непрерывных распределений
- 63. Сравниваем независимые выборки, причём все переменные (≥2) категориальные. ♂ Связаны ли пол и цвет у коз?
- 64. H0: цвет меха не зависит от пола в популяции коз; H1: цвет меха зависит от пола
- 65. Частотный анализ Мы для каждой ячейки рассчитываем ожидаемую частоту (на основе общих частот для столбцов и
- 66. в таблице должны быть сырые данные
- 68. В табличке с частотами вида a × b не должно быть значений меньше 5. Если это
- 69. Zar, 1999: Если вы не отвергли связь переменных (!), а теперь хотите показать, из-за какой именно
- 70. Четырёхпольные таблицы (2 x 2 tables) для независимых выборок. Есть только 2 фактора, у каждого –
- 71. 18 12 29 11 26 38 29 38 67 Четырёхпольные таблицы (2 x 2 table) Модель
- 72. ФИНИШ Пояснение к Модели 3 – красных и зелёных улиток по 6 штук, соревнование продолжалось до
- 73. Критерий χ2 (Chi-square) с поправкой Йейтса. Если в табличке сырые данные, а не готовая четырёхпольная таблица
- 74. Точный критерий Фишера (Fisher exact test) Годится, если одна из частот меньше 5 и вообще, для
- 77. Скунсы из разных районов имеют разную заболеваемость. Замечание: тест в данном случае двусторонний!! Отвергаем Н0
- 78. Односторонний тест Фишера: Для случаев, когда мы заранее знаем, куда может отклониться соотношение частот. Например, мы
- 79. Phi-square – показатель корреляции между качественными переменными. V-square – разновидность χ2 теста. Все эти тесты подразумевали,
- 80. Критерий Мак-Немара (McNemar Chi-square) Анализ 2-х связанных выборок: Требуется специальная организация таблицы Мы провели в сентябре
- 81. Рассчитываем ожидаемые частоты для «зелёных» ячеек и сравниваем их с наблюдаемыми частотами тестом χ2. Нельзя менять
- 82. Частотный анализ Анализ ≥3-х связанных выборок: Cochran’s Q test Сравнивает несколько связанных измерений одной БИНАРНОЙ переменной.
- 84. Частотные критерии для 3-х и более переменных, с оценкой их взаимодействия
- 85. Задания. Хазел Нат продаёт смесь орехов. На упаковке написано, что в пачке содержится 30% кешью, 20%
- 86. 4. Проходят соревнования по фигурному катанию. Мы хотим узнать, влияет ли жанр исполняемой музыкальной композиции во
- 88. Скачать презентацию