Слайд 2Моделирование
упростить и понять реальную ситуацию
проанализировать
разработать прогноз развития
осуществлять управление
X ↔ Y
Ассоциация ≡ связь
x ↔ y
Корреляция ≡ теснота связи
Регрессия ≡ описание связи
x = расходы на рекламу, y = объем продаж
Слайд 5Линейная регрессия
X ↔ Y, пусть y зависит от x: ŷ = f(x)
ŷ
= a + bx
а – пересечение с осью у ; b – угол наклона линии регрессии (коэффициент регрессии)
Ошибка (отклонение, остаток): e = y - ŷ
Линия регрессии ≡ линия наилучшего подбора методом наименьших квадратов : min Σ ei2
Слайд 6Параметры a, b
Нахождение b
Функция НАКЛОН (y; x)
Нахождение a
Функция ОТРЕЗОК (y; x)
Слайд 7Теснота линейной связи
y = y - е
Остаток, разница между фактическим
значением у и значением у на прямой.
Линейная связь только частично объясняет вариации значений у. Необъясненная часть является остатком, е.
Слайд 8Коэффициент детерминации
Общая вариация у: Σ (у -y )2
C учетом линейной связи: Σ
(ŷ -у )2
Не объясняется линейной связью: Σ (y - ŷ)2
Коэффициент детерминации:
Функция КВПИРСОН (y; x)
Слайд 9Интерпретация
r2 выражается в % и показывает величину дисперсии у, которая объясняется
независимой переменной х
в случае полной линейной связи между х и у r2 =1, или 100%
связь отсутствует ⇒ r2 = 0
r2 не определяет, увеличивается ли или уменьшается у с ростом х
Слайд 10Диаграмма
x1
e
x
y
Общая вариация
необъяснимая
объяснимая
ŷ
y
ŷ =a+bx
линия регрессии
y = ў
среднее значение y
ў
Слайд 11⏐r⏐< 1, знак r совпадает со знаком b
Функция КОРРЕЛ (x; y)
Коэффициент корреляции
Слайд 12 Интерпретация
↑ сила линейной связи ⇒ точки на графике ближе к прямой
линии, r ближе к 1
↓ силы связи ⇒ r ближе к 0, точки более рассеяны
r = 0 ⇒ линейной связи не существует
(не значит, что не существует вообще никакой связи)