dispersionnyy-analiz(1)

Содержание

Слайд 2

Дисперсионный анализ

Дисперсионный анализ (от латинского Dispersio – рассеивание / на английском Analysis

Дисперсионный анализ Дисперсионный анализ (от латинского Dispersio – рассеивание / на английском
Of Variance - ANOVA) применяется для исследования влияния одной или нескольких качественных переменных (факторов-качественные, количественные, случайные) на одну зависимую количественную переменную (отклик).
В дисперсионном анализе используется свойство аддитивности дисперсии независимых факторов.

Р.А.Фишер в 1938 году впервые определил дисперсионный анализ как «отделение дисперсии, приписываемой одной группе причин, от дисперсии, приписываемой другим группам»

Дисперсионный анализ состоит в выделении и оценке отдельных факторов, вызывающих изменчивость изучаемой случайной
величины. Для этого проводят разложение суммарной дисперсии на
составляющие, обусловленные независимыми факторами.

.

Слайд 3

Проверка значимости оценок дисперсий проводиться по
F-критерию Фишера:
применяют для сравнения двух независимых

Проверка значимости оценок дисперсий проводиться по F-критерию Фишера: применяют для сравнения двух
нормально распределенных выборочных совокупностей.
Выборочные дисперсии , различаются значимо, если частное превышает табличный Fкр критерий Фишера для принятой доверительной вероятности p и чисел степеней свободы f1=n1-1, f2=n2-1.

Слайд 4

Допущения в дисперсионном анализе:
1.случайные ошибки наблюдений имеют нормальное распределение;
где и

Допущения в дисперсионном анализе: 1.случайные ошибки наблюдений имеют нормальное распределение; где и
- математическое ожидание и генеральная дисперсия случайной величины Х.
2.факторы влияют только на изменение средних значений, а дисперсия наблюдений остается постоянной; эксперименты равноточны.

Слайд 5

Факторы, рассматриваемые в дисперсионном анализе, бывают двух родов:
1) со случайными уровнями

Факторы, рассматриваемые в дисперсионном анализе, бывают двух родов: 1) со случайными уровнями
(выбор уровней производится из бесконечной совокупности возможных уровней - модель со случайными уровнями факторов);
2) с фиксированными (все уровни фиксированы – модель с фиксированными уровнями факторов);
3) модель смешанного типа (часть факторов рассматривается на фиксированных уровнях, а уровни остальных выбираются случайным образом).

Слайд 6

Однофакторный дисперсионный анализ

Задачей однофакторного дисперсионного анализа является изучение влияния одного фактора А

Однофакторный дисперсионный анализ Задачей однофакторного дисперсионного анализа является изучение влияния одного фактора
(количественного или качественного), который принимает k различных значений (уровней факторов), на рассматриваемый признак (отклик).
На i-м уровне производиться ni наблюдений, результаты которых представлены:

Слайд 7

где μ - суммарный эффект во всех опытах;
di - эффект фактора

где μ - суммарный эффект во всех опытах; di - эффект фактора
А на i-м уровне ( i = 1,2,…,k);
- ошибка измерения на i-м уровне.

Предположим, что наблюдения на фиксированном уровне фактора
нормально распределены относительно среднего значения
с обшей дисперсией

Проверяется нулевая гипотеза равенства средних значений на различных уровнях фактора А :
m1=m2=…=mk=m.

Общее число опытов равно N :
N=n1+n2+…+nk.

Слайд 8

Расчеты при равном числе опытов на каждом уровне фактора А : n1=n2=…=nk=n.

Расчеты при равном числе опытов на каждом уровне фактора А : n1=n2=…=nk=n.

Слайд 9

Обозначим среднее значение наблюдений на i-том уровне:

общее среднее значение для всей выборки

Обозначим среднее значение наблюдений на i-том уровне: общее среднее значение для всей
из N наблюдений:

Общую выборочную дисперсию разложим на составляющие, которые характеризовали бы вклад фактора А и фактора случайности.

Слайд 10

Определим выборочную дисперсию на каждом уровне:

Критерий Кохрана (проверка однородности системы) применяют

Определим выборочную дисперсию на каждом уровне: Критерий Кохрана (проверка однородности системы) применяют
для сравнения k независимых нормально распределенных выборочных совокупностей равных объемов ni=const с дисперсиями . Выборочные дисперсии различаются значимо, если критерий Кохрана G превышает табличный Gкр для принятой доверительной вероятности p и числа степеней свободы f=k-1.

Слайд 11

Если между выборочными дисперсиями нет значимых различий, для оценки генеральной дисперсии σ2

Если между выборочными дисперсиями нет значимых различий, для оценки генеральной дисперсии σ2
, характеризующей фактор случайности, используют выборочную дисперсию Sош2: (f=k(n-1)=N-k).

Приближенную оценку для дисперсии фактора А можно получить следующим образом:
Более точную оценку для можно получить, рассматривая отклонения средних на отдельных уровнях от общего среднего всей выборки .

Слайд 12

Введем следующее обозначение, дисперсия фактора А (проверка нулевой гипотезы по критерию Фишера):

Введем следующее обозначение, дисперсия фактора А (проверка нулевой гипотезы по критерию Фишера):

Влияние фактора является значимым, если:

Слайд 13

Алгоритм:
1) итоги по столбцам
2) сумму квадратов всех наблюдений
3) сумму квадратов итогов

Алгоритм: 1) итоги по столбцам 2) сумму квадратов всех наблюдений 3) сумму
по столбцам , деленную на число наблюдений в столбце

4) квадрат общего итога, деленный на число
всех наблюдений (корректирующий член)
5) сумма квадратов для столбца
6) SSобщ - общая сумма квадратов, равная
разнице между суммой квадратов всех
наблюдений и корректирующим членом

Слайд 14


8) дисперсия
9) дисперсия

7) SSост - остаточная сумма квадратов
для оценки

8) дисперсия 9) дисперсия 7) SSост - остаточная сумма квадратов для оценки ошибки эксперимента
ошибки эксперимента

Слайд 15

Результаты расчета представляются в виде таблицы дисперсионного анализа.

Если неравенство,
справедливо, то

Результаты расчета представляются в виде таблицы дисперсионного анализа. Если неравенство, справедливо, то
различие между и значимо, следовательно значимо влияние фактора А.

Слайд 16

Если выборочные дисперсии различаются в пределах случайного разброса, то следующим шагом

Если выборочные дисперсии различаются в пределах случайного разброса, то следующим шагом является
является сравнение выборочных средних.
Выборочные средние различаются значимо, если t-критерий Стьюдента превышает табличный tp,f для принятой доверительной вероятности p и числа степеней свободы объединенной выборки f=n1+n2-2.

Нулевая гипотеза отвергается и различие между средними считается значимым.
Для выявления различности средних применяют критерии Стьюдента, Фишера или ранговый критерий Дункана.

Слайд 17

Пример: применение однофакторного дисперсионного анализа для выяснения влияния вида галоидного алкила (фактор

Пример: применение однофакторного дисперсионного анализа для выяснения влияния вида галоидного алкила (фактор А) на процесс полимеризации.
А) на процесс полимеризации.

Слайд 18

Двухфакторный дисперсионный анализ

Изучается влияние на процесс одновременно двух факторов А и В.

Двухфакторный дисперсионный анализ Изучается влияние на процесс одновременно двух факторов А и
Фактор А исследуется , на уровнях a1, a2,…, ak .Фактор В – на уровнях b1,b2,…,bm .

Слайд 20

Общее число наблюдений равно N=nkm

Общее среднее;
эффект фактора А на i-м уровне, i=1,2,…,

Общее число наблюдений равно N=nkm Общее среднее; эффект фактора А на i-м
K;
эффект фактора В на j-м уровне, j=1,2,…m;
эффект взаимодействия факторов, представляем собой отклонение
среднего по наблюдениям в (ij)-й серии от суммы первых- трех членов
в модели
учитывает вариацию внутри серии наблюдений (ошибка
воспроизводимости)

Слайд 21

Если предположить, что между факторами нет взаимодействия, то можно
использовать линейную модель:

Если предположить, что между факторами нет взаимодействия, то можно использовать линейную модель:

Слайд 22

Линейная модель:

Через и обозначим соответственно средние значения по строкам и столбцам:
А -

Линейная модель: Через и обозначим соответственно средние значения по строкам и столбцам:
среднее всех результатов
Рассеяние средних по столбцам относительно общего среднего не зависит от фактора В, т.к. все уровни фактора В усреднены.
Это рассеяние связано с влиянием фактора А и случайного фактора. Так как дисперсия среднего в m раз меньше дисперсии единичного измерения, имеем:

Слайд 23

В свою очередь, рассеяние в средних по строкам на зависит от фактора

В свою очередь, рассеяние в средних по строкам на зависит от фактора
А и связано с влиянием фактора В:
Эти равенства позволяют оценить влияние факторов А и В, если известна оценка дисперсии.

Линейная модель:

Для оценки фактора случайности при отсутствии параллельных наблюдений, найдем дисперсию наблюдений по i-му столбцу:

(б)

(а)

Слайд 24


Эта дисперсия обусловлена влиянием фактора В и фактора случайности
Вычитая (б) из

Эта дисперсия обусловлена влиянием фактора В и фактора случайности Вычитая (б) из
(а), получим
Отсюда
Обозначим полученную оценку для дисперсии σ2 через Sош2

Слайд 25

Введем следующие обозначения:

Величины и можно считать выборочными дисперсиями с (к-1) и

Введем следующие обозначения: Величины и можно считать выборочными дисперсиями с (к-1) и
(m-1) степенями свободы соответственно. Проверяют нулевые гипотезы о незначимости влияния факторов А и В по критерию Фишера.
Нулевая гипотеза значима, αi=0.

Слайд 26


Если
нулеваая гипотеза отвергается и влияние фактора А считается значимым. Аналогично,

Если нулеваая гипотеза отвергается и влияние фактора А считается значимым. Аналогично, если
если
Гипотеза принимается, βj =0. При справедливости неравенства:

Влияние фактора В считается значимым.

Слайд 27

При проведении дисперсионного анализа в условиях линейной модели, используют следующий алгоритм расчета:
Находят

При проведении дисперсионного анализа в условиях линейной модели, используют следующий алгоритм расчета:
:
Итоги по столбцам
Итоги по строкам
Сумму квадратов всех наблюдений
Сумму квадратов итогов по столбцам , деленную на число наблюдений в столбце

Слайд 28


5) Сумму квадратов итогов по строкам., деленную на число наблюдений в строке

6)

5) Сумму квадратов итогов по строкам., деленную на число наблюдений в строке
Квадрат общего итога, деленный на число всех наблюдений (корректирующий член)

7) Сумму квадратов для столбца: SSA=SS2-SS4;
8) Сумму квадратов для строки: SSB=SS3-SS4;
9) Общую сумму квадратов, равную разнице между суммой квадратов всех
наблюдений и корректирующим членом: SSобщ=SS1-SS4;
10) Остаточную сумму квадратов:
SSост=SSобщ-SSA-SSB=SS1-SS2-SS3+SS4;

Слайд 29

11) Дисперсию :
12) Дисперсию :
13) Дисперсию :

11) Дисперсию : 12) Дисперсию : 13) Дисперсию :

Слайд 31

Рассмотрим модель со взаимодействием факторов А и В. Пусть при каждом сочетании

Рассмотрим модель со взаимодействием факторов А и В. Пусть при каждом сочетании
уровней факторов А и В проводится n параллельный опытов. Имеется целая серия наблюдений yij1, yij2,…,yijn. Выборочная дисперсия результатов в каждой ячейке, где (n-1)-степень свободы:
Если выборочные дисперсии по всем ячейкам однородны, их можно усреднить и использовать полученную средневзвешенную дисперсию в качестве оценки для дисперсии воспроизводимости σ2 :

Число степеней свободы равно mk(n-1)

Слайд 32

Более удобная формула для вычисления дисперсии воспроизводимости
где yij - сумма наблюдений в

Более удобная формула для вычисления дисперсии воспроизводимости где yij - сумма наблюдений
ij – й ячейке.

Слайд 33

При проведении дисперсионного анализа в условиях модели с учетом взаимодействия факторов А

При проведении дисперсионного анализа в условиях модели с учетом взаимодействия факторов А
и В, удобно использовать следующий алгоритм расчета:

Слайд 34

7) Сумму квадратов итогов по столбцам , деленную на число наблюдений в

7) Сумму квадратов итогов по столбцам , деленную на число наблюдений в
столбце
8) Сумму квадратов итогов по строкам., деленную на число наблюдений в строке

Слайд 35

9) Квадрат общего итога, деленный на число всех наблюдений (корректирующий член)
10) Сумму

9) Квадрат общего итога, деленный на число всех наблюдений (корректирующий член) 10)
квадратов для столбца
11)Сумму квадратов для строки
12) Сумму квадратов для дисперсии
воспроизводимости
13) Общую сумму квадратов, равную разнице между суммой квадратов всех наблюдений и корректирующим членом

Слайд 36

14) Остаточную сумму квадратов отклонений для эффекта взаимодействия АВ

14) Остаточную сумму квадратов отклонений для эффекта взаимодействия АВ

Слайд 38

Для оценки значимости фактора А необходимо составить дисперсионное отношение вида

Для оценки значимости фактора А необходимо составить дисперсионное отношение вида

Слайд 39

Пример:

Пример:

Слайд 40

Многофакторный дисперсионный анализ

Латинские и гипер-греко-латинские квадраты.

Полным факторным экспериментом(ПФЭ) называют эксперимент, в котором

Многофакторный дисперсионный анализ Латинские и гипер-греко-латинские квадраты. Полным факторным экспериментом(ПФЭ) называют эксперимент,
встречаются все возможные сочетания уровни изучаемых факторов. Дробным факторным экспериментом(ДФЭ) – эксперимент, в котором пропущены некоторые сочетания уровней.
Рассмотрим трехфакторный дисперсионный анализ при одинаковом числе уровней n для каждого фактора. Полный перебор сочетаний уровней факторов потребует N опытов N=n3
Число опытов можно значительно сократить,
используя ДФЭ по схеме латинского квадрата,
введенного впервые Фишером. Латинский квадрат –
n:n – это квадратная матрица, составленная из
n элементов(чисел или букв) таким образом, что
каждый элемент повторяется в каждой строке и в каждом столбце только один раз.

Слайд 41

Стандартным или каноническим латиннским квадратами называются такие квадраты, у которых первая строка

Стандартным или каноническим латиннским квадратами называются такие квадраты, у которых первая строка
и первый столбец построены в алфавитном порядке или в порядке натурального ряда.

Слайд 42

Результат наблюдения, полученный при ПФЭ
При применении латинского квадрата предполагают, что результаты взаимодействия

Результат наблюдения, полученный при ПФЭ При применении латинского квадрата предполагают, что результаты
незначимы и применяют линейную модель
Алгоритм расчета: Для этого определяют
1) итоги по строкам Аi, столбцам Вj, и латинским буквам Сq.
Например, для латинского квадрата 3:3 итоги по строкам
Итоги по столбцам

Слайд 43

Итоги по латинским буквам

3) Сумму квадратов итогов по строкам,
деленную на число

Итоги по латинским буквам 3) Сумму квадратов итогов по строкам, деленную на
наблюдений в строке
4) Сумму квадратов итогов по столбцам , деленную на число наблюдений в столбце

Слайд 44

5)Сумму квадратов итогов по латинским буквам , деленную на число наблюдений, соответствующих

5)Сумму квадратов итогов по латинским буквам , деленную на число наблюдений, соответствующих
каждой букве
6) Квадрат общего итога, деленный на число всех наблюдений(корректирующий член)
10) Общую сумму квадратов, равную разнице между суммой квадратов всех наблюдений и корректирующим членом