Обработка экспериментальных данных. Многофакторная регрессия. Лекция 7

Содержание

Слайд 2

Отбор факторных признаков для включения в модель

Пусть , . Следовательно один из

Отбор факторных признаков для включения в модель Пусть , . Следовательно один
признаков -Х2 или Х3 – нужно исключить из модели

Находят коэффициенты парной корреляции

Если их значения меньше 0,8, их включают в модель.

Рассчитать коэффициенты парной корреляции между каждым из факторов (в нашем примере Х2 и Х3)и результативным признаком Y:

Если, получилось, что , то исключают признак Х3

Если , то один из факторов можно исключить.

С помощью t-критерия Стьюдента:

Если tнабл>tкрит, (α ; n-2) то с вероятностью 1-α можно утверждать о значимости межфакторного коэффициента корреляции и, следовательно, о значимости факторного признака Xj. Он включается в модель.

Слайд 3

Двухфакторная регрессионная модель

Двухфакторная регрессионная модель

Слайд 4

Множественной линейной корреляционной связи

Свойства множественного коэффициента корреляции:
0≤R≤1
Если R=0, то линейная корреляционная связь

Множественной линейной корреляционной связи Свойства множественного коэффициента корреляции: 0≤R≤1 Если R=0, то
между Х1 и Х2иY отсутствует, хотя между ними может существовать нелинейная или функциональная зависимость.
Если R=1, то, междуХ1 и Х2и Y существует линейная функциональная зависимость.-
При небольшом объеме выборки величину множественного коэффициента корректируют

Здесь k =2 – число факторных признаков.

Для коэффициента множественной корреляции определяют среднеквадратическую ошибку

Если , то с вероятностью 0,99 можно считать R значимым.

Слайд 5

Проверка адекватности модели множественной линейной корреляции

Вычисляют статистику


Здесь n– объем выборки, k –

Проверка адекватности модели множественной линейной корреляции Вычисляют статистику Здесь n– объем выборки,
число факторных признаков

При заданном уровне значимости α и степенях свободы ν1=k и ν2=n-k-1 по таблице критических точек распределения Фишера находят критическое значение Fкрит. Если Fнабл >Fкрит, то уравнение регрессии согласуется с опытными данными.

Адекватность модели множественной корреляции можно определить по средней ошибке аппроксимации

Коэффициент эластичности:

Слайд 6

Пример

Имеются следующие показатели по предприятиям отрасли:

Пример Имеются следующие показатели по предприятиям отрасли:

Слайд 10

Поскольку для Х1 tнабл >tкрит=2,31, Х1 включается в модель.

Связь между признаками Х2 и Х3 тесная:

Поскольку для Х1 tнабл >tкрит=2,31, Х1 включается в модель. Связь между признаками

Поскольку , то признак X2 исключается из рассмотрения, а признак X3 - остается.

Слайд 11

Множественный коэффициент корреляции

Проверим значимость коэффициента корреляции по критерию Стьюдента

По таблице критических точек

Множественный коэффициент корреляции Проверим значимость коэффициента корреляции по критерию Стьюдента По таблице
распределения Стьюдента при уровне значимости α=0,05 и числе степеней свободы k=n-3=7 находим .
Так как tвыб>tкрит, делаем вывод, что значим.

Слайд 12

Нахождение коэффициентов выбранной зависимости

Общий индекс детерминации равен

Следовательно, факторные признаки, отобранные

Нахождение коэффициентов выбранной зависимости Общий индекс детерминации равен Следовательно, факторные признаки, отобранные
в модель, влияют на результативный в пределах 59,43%. Это не очень сильное влияние. Согласно закону Парето степень влияния должна быть не меньше 80%.