Понятие корреляции. Прогнозирование на основании уравнения регрессии. Прогнозирование на основе кривой выживаемости

Содержание

Слайд 2

План лекции

Понятие корреляции
Прогнозирование на основании уравнения регрессии
Прогнозирование на основе кривой выживаемости

План лекции Понятие корреляции Прогнозирование на основании уравнения регрессии Прогнозирование на основе кривой выживаемости

Слайд 3

Какова прогнозируемая смертность в 2015 г. и на чем основан прогноз

Какова прогнозируемая смертность в 2015 г. и на чем основан прогноз

Слайд 4

Отложим на графике рост и вес каждого обследованного из 200 жителей

x1

Отложим на графике рост и вес каждого обследованного из 200 жителей x1

Слайд 6

Из графика видно, что между ростом и весом есть определенная взаимосвязь –

Из графика видно, что между ростом и весом есть определенная взаимосвязь –
чем выше рост, тем больше вес. Эта связь линейная.

Слайд 8

Степень выраженности связи между вариационными рядами отражает понятие корреляциию
Связь может быть слабой,

Степень выраженности связи между вариационными рядами отражает понятие корреляциию Связь может быть
средней, сильной. Связь может и отсутствовать.
Количественно взаимосвязь между случайными величинами определяет коэффициент корреляции - r

Слайд 9

Коэффициент корреляции лежит в пределах
-1 ≤ r ≤ 1.
Если r

Коэффициент корреляции лежит в пределах -1 ≤ r ≤ 1. Если r
< 0, то это означает, что с увеличением величины Х1 соответствующие им значения X2 второго вариационного ряда в среднем также уменьшаются.
Если r> 0, то с увеличением значений одной величины другая также в среднем возрастает.
Если r =0, то это означает, что случайные величины Х1 и X2 абсолютно независимы.
При r = 1 между параметрами существует прямо пропорциональная функциональная зависимость (в медико-биологических исследованиях крайне редкий случай).

Слайд 12

Коэффициент корреляции Пирсона

Для двух случайных величин Х1 и Х2
(n -объем каждой

Коэффициент корреляции Пирсона Для двух случайных величин Х1 и Х2 (n -объем
выборки),
если они нормально распределены, их линейную взаимосвязь можно вычислить

Слайд 13

Проверка на статистическую значимость

Н(0): r=0
Проверяется гипотеза по критерию Стъюдента:
tкрит по таблице для

Проверка на статистическую значимость Н(0): r=0 Проверяется гипотеза по критерию Стъюдента: tкрит
заданного уровня значимости α и числа степеней свободы f=n-2
Если │ tвыч│≥ tкрит то принимается Н(1) и делается вывод, что между величинами существует значимая корреляция.
Если │ tвыч│< tкрит то принимается Н(0) и делается вывод о независимости исследуемых величин (коэффициент корреляции незначим).

Слайд 14

Если
выборка мала
Или распределение выборки не соответствует нормальному
Или имеем дело с качественными

Если выборка мала Или распределение выборки не соответствует нормальному Или имеем дело
ординальными величинами, то используется коэффициент корреляции рангов К. Спирмена

Слайд 15

Проверка на статистическую значимость

Для проверки гипотезы о значимости коэффициента корреляции Спирмена можно

Проверка на статистическую значимость Для проверки гипотезы о значимости коэффициента корреляции Спирмена
воспользоваться таблицей критических значений .
Если вычисленный коэффициент корреляции превышает табличное значение, то связь между величинами признается достоверной.

Слайд 16

где di — разность между рангами сопряженных признаков, n — число парных

где di — разность между рангами сопряженных признаков, n — число парных
членов ряда.
При полной связи ранги признаков совпадут и разность между ними будет равна 0, соответственно коэффициент корреляции будет равен 1. Если же признаки варьируются независимо, коэффициент корреляции получится равным 0

Слайд 17

Регрессионный анализ

Регрессионный анализ

Слайд 18

Механическая модель сердца

Механическая модель сердца

Слайд 19

Электрическая модель сердца

Электрическая модель сердца

Слайд 20

Математическая модель сердца

СО=z*Q*DР*S*T*1333/((T-S)*CЭ, где:
z - фактор поправки (отношение длины артериального русла

Математическая модель сердца СО=z*Q*DР*S*T*1333/((T-S)*CЭ, где: z - фактор поправки (отношение длины артериального
ко всему сосудистому руслу), который лежит в пределах от 0,48 до 0,607 (для человека г в большинстве случаев около 0,6 и потому обычно берут эту величину);
DР — истинная пульсовая амплитуда,
S - время изгнания;
Т — время полной сердечной инволюции
(Т — S) — время диастолического периода в секундах;
СЭ — скорость распространения пульсовой волны по артериям эластического типа;
Q — площадь поперечного сечения аорты.

Слайд 21

Вернемся к нашему графику зависимости веса от роста.
Как мы уже указали есть

Вернемся к нашему графику зависимости веса от роста. Как мы уже указали
определенная взаимосвязь между этими величинами, которая оценивается коэффициентом корреляции.

Слайд 23

Из графика видно, что при увеличении роста вес также увеличивается, хотя и

Из графика видно, что при увеличении роста вес также увеличивается, хотя и
не во всех случаях.
Попытаемся вывести некоторую функцию, связывающую эти величины
- зависимая величина (вес)
- независимая величина (рост)

Слайд 24

Наиболее простой является линейная функция, которая имеет вид
и называется уравнением регрессии
b0 и

Наиболее простой является линейная функция, которая имеет вид и называется уравнением регрессии
b1 - постоянные коэффициенты
b1 – коэффициент регрессии
Иногда запись имеет вид

Слайд 26

Это функция показывает как в среднем меняется величина у при изменении величины

Это функция показывает как в среднем меняется величина у при изменении величины
x
Т.е. по этой функции зная величину х можно вычислить (предсказать) величину у

Слайд 27

Через точки на графике можно провести сколь угодно много прямых

Через точки на графике можно провести сколь угодно много прямых

Слайд 29

Каждая прямая отличается от других значениями коэффициентов b0 и b1
Для выбора

Каждая прямая отличается от других значениями коэффициентов b0 и b1 Для выбора
наиболее оптимального служит метод наименьших квадратов, который позволяет выбрать такие коэффициенты b0 и b1 , что прямая регрессии наилучшим образом отражает взаимосвязь между изучаемыми величинами

Слайд 31

Из графика видно, что реальные данные и данные, полученные по уравнению отличаются

Из графика видно, что реальные данные и данные, полученные по уравнению отличаются
на некоторую величину (т.е. существует отклонение)
Необходимо выбрать такую линию, чтобы сумма всех отклонений была минимальной

Слайд 32

Полученная функция является математической моделью взаимосвязи двух случайных величин
Т.к. мы рассмотрели зависимость

Полученная функция является математической моделью взаимосвязи двух случайных величин Т.к. мы рассмотрели
только от одной независимой переменной и эта зависимость носит линейный характер, то такая модель носит название простой линейной регрессии

Слайд 33

Как оценить полученную модель, т.е. насколько хорошо модель отражает взаимосвязь между исследуемыми

Как оценить полученную модель, т.е. насколько хорошо модель отражает взаимосвязь между исследуемыми
величинами.
Можно использовать коэффициент детерминации R2
Он показывает сколько процентов исходных (выборочных) данных вписывается в полученную модель

Слайд 34

Если независимых переменных много
То возможно построение уравнение множественной линейной регрессии
Например, вес

Если независимых переменных много То возможно построение уравнение множественной линейной регрессии Например,
зависит также от места проживания, типа питания, социального положения, наследственных факторов, хронических заболеваний и т.д.

Слайд 35

Возможны также нелинейные модели

Возможны также нелинейные модели
Имя файла: Понятие-корреляции.-Прогнозирование-на-основании-уравнения-регрессии.-Прогнозирование-на-основе-кривой-выживаемости.pptx
Количество просмотров: 46
Количество скачиваний: 0