Слайд 2План лекции
Понятие корреляции
Прогнозирование на основании уравнения регрессии
Прогнозирование на основе кривой выживаемости
Слайд 3Какова прогнозируемая смертность в 2015 г.
и на чем основан прогноз
Слайд 4Отложим на графике рост и вес каждого обследованного из 200 жителей
x1
Слайд 6Из графика видно, что между ростом и весом есть определенная взаимосвязь –
чем выше рост, тем больше вес. Эта связь линейная.
Слайд 8Степень выраженности связи между вариационными рядами отражает понятие корреляциию
Связь может быть слабой,
средней, сильной. Связь может и отсутствовать.
Количественно взаимосвязь между случайными величинами определяет коэффициент корреляции - r
Слайд 9Коэффициент корреляции лежит в пределах
-1 ≤ r ≤ 1.
Если r
< 0, то это означает, что с увеличением величины Х1 соответствующие им значения X2 второго вариационного ряда в среднем также уменьшаются.
Если r> 0, то с увеличением значений одной величины другая также в среднем возрастает.
Если r =0, то это означает, что случайные величины Х1 и X2 абсолютно независимы.
При r = 1 между параметрами существует прямо пропорциональная функциональная зависимость (в медико-биологических исследованиях крайне редкий случай).
Слайд 12Коэффициент корреляции Пирсона
Для двух случайных величин Х1 и Х2
(n -объем каждой
выборки),
если они нормально распределены, их линейную взаимосвязь можно вычислить
Слайд 13Проверка на статистическую значимость
Н(0): r=0
Проверяется гипотеза по критерию Стъюдента:
tкрит по таблице для
заданного уровня значимости α и числа степеней свободы f=n-2
Если │ tвыч│≥ tкрит то принимается Н(1) и делается вывод, что между величинами существует значимая корреляция.
Если │ tвыч│< tкрит то принимается Н(0) и делается вывод о независимости исследуемых величин (коэффициент корреляции незначим).
Слайд 14Если
выборка мала
Или распределение выборки не соответствует нормальному
Или имеем дело с качественными
ординальными величинами, то используется коэффициент корреляции рангов К. Спирмена
Слайд 15Проверка на статистическую значимость
Для проверки гипотезы о значимости коэффициента корреляции Спирмена можно
воспользоваться таблицей критических значений .
Если вычисленный коэффициент корреляции превышает табличное значение, то связь между величинами признается достоверной.
Слайд 16где di — разность между рангами сопряженных признаков, n — число парных
членов ряда.
При полной связи ранги признаков совпадут и разность между ними будет равна 0, соответственно коэффициент корреляции будет равен 1. Если же признаки варьируются независимо, коэффициент корреляции получится равным 0
Слайд 20Математическая модель сердца
СО=z*Q*DР*S*T*1333/((T-S)*CЭ, где:
z - фактор поправки (отношение длины артериального русла
ко всему сосудистому руслу), который лежит в пределах от 0,48 до 0,607 (для человека г в большинстве случаев около 0,6 и потому обычно берут эту величину);
DР — истинная пульсовая амплитуда,
S - время изгнания;
Т — время полной сердечной инволюции
(Т — S) — время диастолического периода в секундах;
СЭ — скорость распространения пульсовой волны по артериям эластического типа;
Q — площадь поперечного сечения аорты.
Слайд 21Вернемся к нашему графику зависимости веса от роста.
Как мы уже указали есть
определенная взаимосвязь между этими величинами, которая оценивается коэффициентом корреляции.
Слайд 23Из графика видно, что при увеличении роста вес также увеличивается, хотя и
не во всех случаях.
Попытаемся вывести некоторую функцию, связывающую эти величины
- зависимая величина (вес)
- независимая величина (рост)
Слайд 24Наиболее простой является линейная функция, которая имеет вид
и называется уравнением регрессии
b0 и
b1 - постоянные коэффициенты
b1 – коэффициент регрессии
Иногда запись имеет вид
Слайд 26Это функция показывает как в среднем меняется величина у при изменении величины
x
Т.е. по этой функции зная величину х можно вычислить (предсказать) величину у
Слайд 27Через точки на графике можно провести сколь угодно много прямых
Слайд 29Каждая прямая отличается от других значениями коэффициентов b0 и b1
Для выбора
наиболее оптимального служит метод наименьших квадратов, который позволяет выбрать такие коэффициенты b0 и b1 , что прямая регрессии наилучшим образом отражает взаимосвязь между изучаемыми величинами
Слайд 31Из графика видно, что реальные данные и данные, полученные по уравнению отличаются
на некоторую величину (т.е. существует отклонение)
Необходимо выбрать такую линию, чтобы сумма всех отклонений была минимальной
Слайд 32Полученная функция является математической моделью взаимосвязи двух случайных величин
Т.к. мы рассмотрели зависимость
только от одной независимой переменной и эта зависимость носит линейный характер, то такая модель носит название простой линейной регрессии
Слайд 33Как оценить полученную модель, т.е. насколько хорошо модель отражает взаимосвязь между исследуемыми
величинами.
Можно использовать коэффициент детерминации R2
Он показывает сколько процентов исходных (выборочных) данных вписывается в полученную модель
Слайд 34Если независимых переменных много
То возможно построение уравнение множественной линейной регрессии
Например, вес
зависит также от места проживания, типа питания, социального положения, наследственных факторов, хронических заболеваний и т.д.
Слайд 35Возможны также нелинейные модели