Слайд 2План лекции
Понятие корреляции
Прогнозирование на основании уравнения регрессии
Прогнозирование на основе кривой выживаемости
![План лекции Понятие корреляции Прогнозирование на основании уравнения регрессии Прогнозирование на основе кривой выживаемости](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/877767/slide-1.jpg)
Слайд 3Какова прогнозируемая смертность в 2015 г.
и на чем основан прогноз
![Какова прогнозируемая смертность в 2015 г. и на чем основан прогноз](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/877767/slide-2.jpg)
Слайд 4Отложим на графике рост и вес каждого обследованного из 200 жителей
x1
![Отложим на графике рост и вес каждого обследованного из 200 жителей x1](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/877767/slide-3.jpg)
Слайд 6Из графика видно, что между ростом и весом есть определенная взаимосвязь –
![Из графика видно, что между ростом и весом есть определенная взаимосвязь –](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/877767/slide-5.jpg)
чем выше рост, тем больше вес. Эта связь линейная.
Слайд 8Степень выраженности связи между вариационными рядами отражает понятие корреляциию
Связь может быть слабой,
![Степень выраженности связи между вариационными рядами отражает понятие корреляциию Связь может быть](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/877767/slide-7.jpg)
средней, сильной. Связь может и отсутствовать.
Количественно взаимосвязь между случайными величинами определяет коэффициент корреляции - r
Слайд 9Коэффициент корреляции лежит в пределах
-1 ≤ r ≤ 1.
Если r
![Коэффициент корреляции лежит в пределах -1 ≤ r ≤ 1. Если r](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/877767/slide-8.jpg)
< 0, то это означает, что с увеличением величины Х1 соответствующие им значения X2 второго вариационного ряда в среднем также уменьшаются.
Если r> 0, то с увеличением значений одной величины другая также в среднем возрастает.
Если r =0, то это означает, что случайные величины Х1 и X2 абсолютно независимы.
При r = 1 между параметрами существует прямо пропорциональная функциональная зависимость (в медико-биологических исследованиях крайне редкий случай).
Слайд 12Коэффициент корреляции Пирсона
Для двух случайных величин Х1 и Х2
(n -объем каждой
![Коэффициент корреляции Пирсона Для двух случайных величин Х1 и Х2 (n -объем](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/877767/slide-11.jpg)
выборки),
если они нормально распределены, их линейную взаимосвязь можно вычислить
Слайд 13Проверка на статистическую значимость
Н(0): r=0
Проверяется гипотеза по критерию Стъюдента:
tкрит по таблице для
![Проверка на статистическую значимость Н(0): r=0 Проверяется гипотеза по критерию Стъюдента: tкрит](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/877767/slide-12.jpg)
заданного уровня значимости α и числа степеней свободы f=n-2
Если │ tвыч│≥ tкрит то принимается Н(1) и делается вывод, что между величинами существует значимая корреляция.
Если │ tвыч│< tкрит то принимается Н(0) и делается вывод о независимости исследуемых величин (коэффициент корреляции незначим).
Слайд 14Если
выборка мала
Или распределение выборки не соответствует нормальному
Или имеем дело с качественными
![Если выборка мала Или распределение выборки не соответствует нормальному Или имеем дело](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/877767/slide-13.jpg)
ординальными величинами, то используется коэффициент корреляции рангов К. Спирмена
Слайд 15Проверка на статистическую значимость
Для проверки гипотезы о значимости коэффициента корреляции Спирмена можно
![Проверка на статистическую значимость Для проверки гипотезы о значимости коэффициента корреляции Спирмена](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/877767/slide-14.jpg)
воспользоваться таблицей критических значений .
Если вычисленный коэффициент корреляции превышает табличное значение, то связь между величинами признается достоверной.
Слайд 16где di — разность между рангами сопряженных признаков, n — число парных
![где di — разность между рангами сопряженных признаков, n — число парных](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/877767/slide-15.jpg)
членов ряда.
При полной связи ранги признаков совпадут и разность между ними будет равна 0, соответственно коэффициент корреляции будет равен 1. Если же признаки варьируются независимо, коэффициент корреляции получится равным 0
Слайд 20Математическая модель сердца
СО=z*Q*DР*S*T*1333/((T-S)*CЭ, где:
z - фактор поправки (отношение длины артериального русла
![Математическая модель сердца СО=z*Q*DР*S*T*1333/((T-S)*CЭ, где: z - фактор поправки (отношение длины артериального](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/877767/slide-19.jpg)
ко всему сосудистому руслу), который лежит в пределах от 0,48 до 0,607 (для человека г в большинстве случаев около 0,6 и потому обычно берут эту величину);
DР — истинная пульсовая амплитуда,
S - время изгнания;
Т — время полной сердечной инволюции
(Т — S) — время диастолического периода в секундах;
СЭ — скорость распространения пульсовой волны по артериям эластического типа;
Q — площадь поперечного сечения аорты.
Слайд 21Вернемся к нашему графику зависимости веса от роста.
Как мы уже указали есть
![Вернемся к нашему графику зависимости веса от роста. Как мы уже указали](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/877767/slide-20.jpg)
определенная взаимосвязь между этими величинами, которая оценивается коэффициентом корреляции.
Слайд 23Из графика видно, что при увеличении роста вес также увеличивается, хотя и
![Из графика видно, что при увеличении роста вес также увеличивается, хотя и](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/877767/slide-22.jpg)
не во всех случаях.
Попытаемся вывести некоторую функцию, связывающую эти величины
- зависимая величина (вес)
- независимая величина (рост)
Слайд 24Наиболее простой является линейная функция, которая имеет вид
и называется уравнением регрессии
b0 и
![Наиболее простой является линейная функция, которая имеет вид и называется уравнением регрессии](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/877767/slide-23.jpg)
b1 - постоянные коэффициенты
b1 – коэффициент регрессии
Иногда запись имеет вид
Слайд 26Это функция показывает как в среднем меняется величина у при изменении величины
![Это функция показывает как в среднем меняется величина у при изменении величины](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/877767/slide-25.jpg)
x
Т.е. по этой функции зная величину х можно вычислить (предсказать) величину у
Слайд 27Через точки на графике можно провести сколь угодно много прямых
![Через точки на графике можно провести сколь угодно много прямых](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/877767/slide-26.jpg)
Слайд 29Каждая прямая отличается от других значениями коэффициентов b0 и b1
Для выбора
![Каждая прямая отличается от других значениями коэффициентов b0 и b1 Для выбора](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/877767/slide-28.jpg)
наиболее оптимального служит метод наименьших квадратов, который позволяет выбрать такие коэффициенты b0 и b1 , что прямая регрессии наилучшим образом отражает взаимосвязь между изучаемыми величинами
Слайд 31Из графика видно, что реальные данные и данные, полученные по уравнению отличаются
![Из графика видно, что реальные данные и данные, полученные по уравнению отличаются](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/877767/slide-30.jpg)
на некоторую величину (т.е. существует отклонение)
Необходимо выбрать такую линию, чтобы сумма всех отклонений была минимальной
Слайд 32Полученная функция является математической моделью взаимосвязи двух случайных величин
Т.к. мы рассмотрели зависимость
![Полученная функция является математической моделью взаимосвязи двух случайных величин Т.к. мы рассмотрели](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/877767/slide-31.jpg)
только от одной независимой переменной и эта зависимость носит линейный характер, то такая модель носит название простой линейной регрессии
Слайд 33Как оценить полученную модель, т.е. насколько хорошо модель отражает взаимосвязь между исследуемыми
![Как оценить полученную модель, т.е. насколько хорошо модель отражает взаимосвязь между исследуемыми](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/877767/slide-32.jpg)
величинами.
Можно использовать коэффициент детерминации R2
Он показывает сколько процентов исходных (выборочных) данных вписывается в полученную модель
Слайд 34Если независимых переменных много
То возможно построение уравнение множественной линейной регрессии
Например, вес
![Если независимых переменных много То возможно построение уравнение множественной линейной регрессии Например,](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/877767/slide-33.jpg)
зависит также от места проживания, типа питания, социального положения, наследственных факторов, хронических заболеваний и т.д.
Слайд 35Возможны также нелинейные модели
![Возможны также нелинейные модели](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/877767/slide-34.jpg)