Математическая статистика 2

Содержание

Слайд 2

Статистической гипотезой называется любое предположение о виде или параметрах неизвестного закона распределения.

Проверяемую

Статистической гипотезой называется любое предположение о виде или параметрах неизвестного закона распределения.
гипотезу называют нулевой (основной), обозначают её Н0.

Конкурирующей (альтернативной) называют гипо-тезу, которая противоречит нулевой, обозначают её Н1.

Задача: проверить, верна ли нулевая гипотеза Н0 при
альтернативной гипотезе Н1?

Проверка статистических гипотез
§ Основные сведения

Слайд 3

Правильное решение

Ошибка 1-го рода

Ошибка 2-го рода

Правильное решение

Правильное решение Ошибка 1-го рода Ошибка 2-го рода Правильное решение

Слайд 4

1.

2.

Строим случайную величину K, называемую ста-тистическим критерием, для которой выполня- ются следующие

1. 2. Строим случайную величину K, называемую ста-тистическим критерием, для которой выполня-
условия:

она является функцией от выборочных данных:
K=K(x1,x2,…,xn);

2) её значения позволяют судить о «расхождении выборки с гипотезой Н0», то есть о том, надо при-нимать или отвергать гипотезу H0;

3) распределение этой величины известно.

Слайд 5

3.

Вычисляем значения критерия, подставляя в него выборочные данные. Это число называют наблю-даемым

3. Вычисляем значения критерия, подставляя в него выборочные данные. Это число называют
значением критерия и обозначают Kнабл.

4.

Находим критическую область данного критерия, то есть совокупность значений критерия,
при которых нулевую гипотезу отвергают.

Все остальные значения критерия образуют область, называемую областью принятия нулевой гипотезы.

Если наблюдаемое значение критерия попадает в критическую область, то нулевую гипотезу отвергаем, в противном случае нулевую гипотезу принимаем.

5.

Слайд 6

Точки, которые отделяют критическую область от области принятия гипотезы, называют критическими точками.

Чаще

Точки, которые отделяют критическую область от области принятия гипотезы, называют критическими точками.
всего встречаются следующие виды критических областей:

а) левосторонняя

K < kкр

б) правосторонняя

K > kкр

в) двусторонняя

Слайд 7

Критическую область W целесообразно находить
согласно следующим требованиям:

1.

2.

Мощность критерия – максимальная.

Критическую область W целесообразно находить согласно следующим требованиям: 1. 2. Мощность критерия – максимальная.

Слайд 8

При разработке статистического критерия невозможно одновременно минимизировать обе ошибки. Поэтому поступают следующим

При разработке статистического критерия невозможно одновременно минимизировать обе ошибки. Поэтому поступают следующим
образом: при заданном числе испытаний n устанавливается верхняя граница для ошибки первого рода.
Выбирается тот критерий, у которого наименьшая ошибка второго рода.

Слайд 10

Пять шагов проверки гипотезы

1. Сформулировать нулевую H0 и альтернативную H1 гипотезы.
2.

Пять шагов проверки гипотезы 1. Сформулировать нулевую H0 и альтернативную H1 гипотезы.
Выбрать статистику критерия T(X) и уяснить её закон распределения.
3. Задать уровень значимости критерия. По таблицам квантилей распределения статистики найти критические точки и указать критическую область.
4. Подсчитать наблюдаемое значение статистики критерия и проверить условие его попадания в критическую область.
5. Сделать вывод о принятии нулевой или альтернативной гипотезы.

Слайд 11

H0: генеральная совокупность имеет некоторое
определённое распределение

Параметрические критерии тестируют гипотезы
о параметрах

H0: генеральная совокупность имеет некоторое определённое распределение Параметрические критерии тестируют гипотезы о
некоторого распределения :

1. Генеральная совокупность имеет биномиальное распределение с параметрами m = 10 и p = 0.4.

2. Генеральная совокупность распределена нормально с математическим ожиданием, равным 5 и дисперсией, равной 4.

Критерии, с помощью которых проверяется гипотеза о теоретическом законе распределения, называются критериями согласия.

Слайд 12

§ Критерий согласия Колмогорова
Нулевая гипотеза: исследуемая случайная величина
имеет заданный закон распределения.

F(x)

§ Критерий согласия Колмогорова Нулевая гипотеза: исследуемая случайная величина имеет заданный закон
– теоретическая функция распределения

Fn(x) – эмпирическая функция распределения

Обозначим

– статистика критерия Колмогорова

Критерий:

Критическая область W – правосторонняя:

Из требования для критической области:

Слайд 14

Можно доказать, что при

Можно доказать, что при

Слайд 16

§ Критерий согласия Пирсона (хи-квадрат)

Найдём теоретические частоты вариант.

1. Распределение дискретное

p(x).

Теоретическая частота

§ Критерий согласия Пирсона (хи-квадрат) Найдём теоретические частоты вариант. 1. Распределение дискретное
появления варианты xi – это

2. Распределение непрерывное

F(x).

Теоретическая частота попадания в интервал (xi, xi+1) – это

npi.

npi.

p1=p(x1)

p2=p(x2)


pl-1=p(xl-1)

pl=1-p1-p2-…-pl-1

p1=p(X< x2)

=F(x2)

p2=p(x2

=F(x3)- F(x2)


pl-1=p(xl-1

=F(xl)- F(xl-1)

pl=1-p1-p2-

…-pl-1

Слайд 17

Критерий:

ni – эмпирические частоты

npi – теоретические частоты

k = l – r –1,

l

Критерий: ni – эмпирические частоты npi – теоретические частоты k = l
– число вариант (интервалов),

r – число параметров предполагаемого
распределения, оцениваемых по выборке.

Слайд 18

Критическая область W – правосторонняя:

Из требования для критической области:

F(x) – функция распределения

Критическая область W – правосторонняя: Из требования для критической области: F(x) –
Пирсона с k= l – r –1 степенями свободы, l – число вариант (интервалов),
r – число параметров, оцениваемых по выборке.

Слайд 19

Для нахождения критической области необходимо по заданной вероятности ошибки первого рода (уровню

Для нахождения критической области необходимо по заданной вероятности ошибки первого рода (уровню
значимости критерия) α найти квантиль хи-квадрат распределения на уровне 1 - α .

Слайд 20

Алгоритм применения критерия согласия Пирсона
Подсчитываем значение статистики критерия и сравниваем его с

Алгоритм применения критерия согласия Пирсона Подсчитываем значение статистики критерия и сравниваем его
критической точкой. Если статистика критерия попадает в критическую область,

то нулевая гипотеза: исследуемая случайная величина имеет заданный закон распределения отвергается.
В противном случае она принимается на уровне значимости α

Критерий легко приспосабливается и для непрерывных распределений путем их дискретизации.
Проверку гипотезы удобно совмещать с построением гистограмм.

Слайд 21

§ Критерий Фишера

Две генеральные совокупности X и Y распределены нормально.

Проверить гипотезу:

Критерий:

F

§ Критерий Фишера Две генеральные совокупности X и Y распределены нормально. Проверить
имеет распределение Фишера с (nX –1) и (nY –1) степенями свободы

Критическая область строится в зависимости от вида конкурирующей гипотезы.

Обозначим nX – объём выборки из совокупности X, nY – объём выборки из совокупности Y,
s2X и s2Y – исправленные выборочные дисперсии.

Слайд 22

1.

Критическая область W – правосторонняя:

Из требования 1 для критической области:

F(x) – функция

1. Критическая область W – правосторонняя: Из требования 1 для критической области:
распределения Фишера с (nX –1) и (nY –1) степенями свободы

, F(x) – функция распределения F

Так как s2X >0 и s2Y >0, то F >0

положительная часть

Слайд 23

2.

Обозначим

, F’ имеет распределение
Фишера с (nY –1) и (nX –1)

2. Обозначим , F’ имеет распределение Фишера с (nY –1) и (nX
степенями свободы

предыдущий случай:

Слайд 24

, тогда

Таким образом, критическая область для критерия F имеет вид:

, где F(x)

, тогда Таким образом, критическая область для критерия F имеет вид: ,
– функция
распределения Фишера
с (nY –1) и (nX –1)
степенями свободы

Слайд 25

3.

Критическая область W – двусторонняя:

Аналогично пунктам 1 и 2 получаем:

где F1(x) –

3. Критическая область W – двусторонняя: Аналогично пунктам 1 и 2 получаем:
функция распределения Фишера с (nX –1) и (nY –1) степенями свободы

где F2(x) – функция распределения Фишера с (nY –1) и (nX –1) степенями свободы

Слайд 26

§ Критерий Стьюдента (t-критерий)

Генеральная совокупность распределена нормально.

Проверить гипотезу:

a0 – некоторое число

Критерий:

Т имеет

§ Критерий Стьюдента (t-критерий) Генеральная совокупность распределена нормально. Проверить гипотезу: a0 –
распределение Стьюдента с (n-1) степенями свободы

Критическая область строится в зависимости от вида конкурирующей гипотезы.

Слайд 27

1.

Критическая область W – правосторонняя:

Из требования 1 для критической области:

F(x) – функция

1. Критическая область W – правосторонняя: Из требования 1 для критической области:
распределения Стьюдента с (n-1) степенями свободы

, F(x) – функция распределения T

Слайд 28

2.

Критическая область W – левосторонняя:

Из требования 1 для критической области:

, F(x) –

2. Критическая область W – левосторонняя: Из требования 1 для критической области:
функция
распределения T

, F(x) – функция распределения
Стьюдента с (n-1) степенями
свободы

Слайд 29

Плотность распределения Стьюдента – чётная функция

Критическая точка tпр,кр находится из требования:

–tпр,кр является

Плотность распределения Стьюдента – чётная функция Критическая точка tпр,кр находится из требования:
критической точкой для левосторонней области:

Слайд 30

3.

Критическая область W – двусторонняя:

В силу чётности плотности распределения Стьюдента:

Аналогично пунктам 1

3. Критическая область W – двусторонняя: В силу чётности плотности распределения Стьюдента:
и 2 получаем:

или

Слайд 31

2.

Обозначим

, F’ имеет распределение
Фишера с (nY –1) и (nX –1)

2. Обозначим , F’ имеет распределение Фишера с (nY –1) и (nX
степенями свободы

предыдущий случай:

Слайд 32

Однофакторный дисперсионный анализ

Пример: выявить зависимость объёма выполненных на стройке работ за смену

Однофакторный дисперсионный анализ Пример: выявить зависимость объёма выполненных на стройке работ за смену от работающей бригады.
от работающей бригады.

Слайд 33

X – случайная величина

F – фактор, воздействующий на случайную величину X

F1, F2,

X – случайная величина F – фактор, воздействующий на случайную величину X
…, Fp – уровни фактора

a1, a2, …, ap – математические ожидания на уровнях
F1, F2, …, Fp соответственно

H0: a1 = a2 = … = ap

Дисперсионным анализом называется статистический метод, предназначенный для выявления влияния отдельных факторов на результат эксперимента, а также для последующего планирования эксперимента.

Слайд 34

Критерий Бартлетта

H0: D1(X) = D2(X) = … = Dp(X)

гипотеза о равенстве дисперсий

Критерий Бартлетта H0: D1(X) = D2(X) = … = Dp(X) гипотеза о
на каждом уровне

q1, q2, …, qp – количество наблюдений на уровнях
F1, F2, …, Fp соответственно

s12, s22, …, sp2 – исправленные выборочные дисперсии
на уровнях F1, F2, …, Fp соответственно

Слайд 35

Критерий:

Если q1, q2, …, qp > 3, то критерий имеет распределение, близкое

Критерий: Если q1, q2, …, qp > 3, то критерий имеет распределение,
к распределению Пирсона с (p-1) степенями свободы.

Критическая область – правосторонняя.

,

где F(x) – функция распределения Пирсона с (p–1) степенями свободы.

Слайд 36

H0: a1 = a2 = … = ap

Объём выборки: n =

q1+ q2+…+

H0: a1 = a2 = … = ap Объём выборки: n = q1+ q2+…+ qp
qp

Слайд 37

1-ая группа – уровень F1:

x11, x21, … ,

2-ая группа – уровень F2:

x21,

1-ая группа – уровень F1: x11, x21, … , 2-ая группа –
x22, … ,

p-ая группа – уровень Fp:

x1p, x2p, … ,


Dв= Dмежгр+Dвнгр

Слайд 38

1-ая группа – уровень F1:

x11, x21, … ,

2-ая группа – уровень F2:

x21,

1-ая группа – уровень F1: x11, x21, … , 2-ая группа –
x22, … ,

p-ая группа – уровень Fp:

x1p, x2p, … ,


1.

Dмежгр=

Факторная сумма:

2.

Dвнгр=

, где Diгр – дисперсия i–той группы

Слайд 39

i-тая группа:

x1i, x2i, … ,

, групповая средняя: yi

Diгр=

Dвнгр=

Остаточная сумма:

i-тая группа: x1i, x2i, … , , групповая средняя: yi Diгр= Dвнгр= Остаточная сумма:

Слайд 40

Факторная дисперсия:

Остаточная дисперсия:

– всегда

– если несущественно влияние фактора

H0: a1 =

Факторная дисперсия: Остаточная дисперсия: – всегда – если несущественно влияние фактора H0:
a2 = … = ap

Слайд 41

Критерий:

имеет распределение Фишера с (p–1) и (n–p) степенями свободы

Критическая область W –

Критерий: имеет распределение Фишера с (p–1) и (n–p) степенями свободы Критическая область
правосторонняя:

Из требования 1 для критической области:

F(x) – функция распределения Фишера с (p–1) и (n –p) степенями свободы

Слайд 42

Элементы теории корреляции

Зависимость величины Y от X называется функцио-нальной, если каждому значению

Элементы теории корреляции Зависимость величины Y от X называется функцио-нальной, если каждому
величины X соот-ветствует единственное значение величины Y.

Зависимость величины Y от X называется стати-стической (вероятностной, стохастической), если каждому значению величины X соответствует не одно, а множество значений величины Y, причём сказать заранее, какое именно значение примет величина Y невозможно.

Слайд 43

Среднее значение, которое принимает величина Y при X=x, называется математическим ожиданием случай-ной

Среднее значение, которое принимает величина Y при X=x, называется математическим ожиданием случай-ной
величины Y, вычисленным при условии, что X=x, или условным математическим ожиданием:

М(Y|X=x)

Если при изменении x условные математические ожидания М(Y|X=x) изменяются, то говорят, что имеет место корреляционная зависимость величины Y от X.

f (x)=М(Y|X=x) – ?

Слайд 44

f (x)=М(Y|X=x) – ?

это уравнение называется выборочным уравнением регрессии, а функция

f (x)=М(Y|X=x) – ? это уравнение называется выборочным уравнением регрессии, а функция
f*(x) – выборочной функцией регрессии.

Слайд 45

Если функция регрессии – линейная:

f (x) = М(Y|X=x) = ax+b,

то выборочное уравнение

Если функция регрессии – линейная: f (x) = М(Y|X=x) = ax+b, то
регрессии имеет вид:

f (x)=М(Y|X=x) – ?

– выборочные средние

– выборочные средние квадратические отклонения

nxy – частота пары вариант (x, y)

Имя файла: Математическая-статистика-2.pptx
Количество просмотров: 42
Количество скачиваний: 0