Методы корреляционно-регрессионного анализа фондового рынка

Содержание

Слайд 2

Определение параметров уравнения регрессии с помощью метода наименьших квадратов

Определение параметров уравнения регрессии с помощью метода наименьших квадратов

Слайд 3



При использовании МНК к ошибкам предъявляются следующие требования, называемые условиями

При использовании МНК к ошибкам предъявляются следующие требования, называемые условиями Гаусса -
Гаусса - Маркова:

1) величина является случайной переменной;
2) математическое ожидание равно нулю: М( ) = 0;
3) дисперсия постоянна: D( ) = для всех i;
4) значения независимы между собой. Откуда вытекает, в
частности, что
5) величины статистически независимы от значений .

Слайд 4

Критерии значимости коэффициентов и в уравнении регрессии.

Коэффициент детерминации

.

Критерии значимости коэффициентов и в уравнении регрессии. Коэффициент детерминации .

Слайд 5

При оценке значимости коэффициента линейной регрессии можно использовать следующее грубое правило.

При оценке значимости коэффициента линейной регрессии можно использовать следующее грубое правило. Если
Если стандартная ошибка коэффициента больше его модуля, т.е. t < 1, то он не может быть признан хорошим (значимым). Если стандартная ошибка мень­ше модуля коэффициента, но больше его половины, т.е. 1 < t < 2, то сделанная оценка может рассматриваться как более или менее зна­чимая. Доверительная вероятность здесь примерно от 0,7 до 0,95. Значение t от 2 до 3 свидетельствуете весьма значимой связи (доверительная вероятность от 0,95 до 0,99), и t > 3 есть практически стопроцентное свидетельство ее наличия. Конечно, в каждом случае играет роль число наблюдений; чем их больше, тем надежнее при прочих равных условиях выводы о наличии связи и тем меньше верхняя граница доверительного интервала для данных числа степеней сво­боды и уровня значимости.

Слайд 6

Коэффициент детерминации характеризует долю вариации (разброса) зависимой перемен­ной, объясненной с помощью

Коэффициент детерминации характеризует долю вариации (разброса) зависимой перемен­ной, объясненной с помощью данного
данного уравнения. В качестве меры разброса зависимой переменной обычно используется ее дисперсия, а остаточная вариация может быть измерена как дисперсия откло­нений вокруг линии регрессии. Если числитель и знаменатель вы­читаемой из единицы дроби разделить на число наблюдений n, то получим, соответственно, выборочные оценки остаточной диспер­сии и дисперсии зависимой переменной Y. Отношение остаточной и общей дисперсий представляет собой долю необъясненной диспер­сии. Если же эту долю вычесть из единицы, то получим долю дисперсии зависимой переменной, объясненной с помощью регрес­сии.

Слайд 7

Иногда при расчете коэффициента детерминации для получе­ния несмещенных оценок дисперсии в

Иногда при расчете коэффициента детерминации для получе­ния несмещенных оценок дисперсии в числителе
числителе и знаменателе вы­читаемой из единицы дроби делается поправка на число степеней свободы; тогда

Слайд 8

Для определения статистической значимости коэффициента детерминации проверяется нулевая гипотеза для F-статистики,

Для определения статистической значимости коэффициента детерминации проверяется нулевая гипотеза для F-статистики, рассчитываемой
рассчитываемой по формуле:
Величина F, если предположить, что выполнены предпосылки относительно отклонений , имеет распределение Фишера с (m; n-m-1) степенями свободы, где m - число объясняющих переменных, n - число наблюдений.

Слайд 9

Гетероскедастичность.

Если остатки имеют постоянную дисперсию, они называются гомоскедастичными, но если они

Гетероскедастичность. Если остатки имеют постоянную дисперсию, они называются гомоскедастичными, но если они
непостоянны, то гетероскедастичными.
Гетероскедастичность приводит к тому, что коэффи­циенты регрессии больше не представляют собой лучшие оценки или не являются оценками с минимальной дисперсией, следовательно, они больше не являются наиболее эффективными коэф­фициентами.
Проверкой на гетероскедастичность служит тест Голдфелда-Кванта. Он требует, чтобы остатки были разделены на две груп­пы из n наблюдений, одна группа с низкими, а другая - с высо­кими значениями. Обычно срединная одна шестая часть наблю­дений удаляется после ранжирования в возрастающем порядке, чтобы улучшить разграничение между двумя группами.

Слайд 10

Гетероскедастичность

Критерий Голдфелда-Кванта - это отношение суммы квадра­тов отклонений (СКО) высоких остатков к

Гетероскедастичность Критерий Голдфелда-Кванта - это отношение суммы квадра­тов отклонений (СКО) высоких остатков
СКО низких остатков:
Этот критерий имеет F-распределение с (n-d)/2-k степе­нями свободы.
Чтобы решить проблему гетероскедастичности, нужно иссле­довать взаимосвязь между значениями ошибки и переменными и трансформировать регрессионную модель так, чтобы она отра­жала эту взаимосвязь.

Слайд 11

Автокорреляция.

Автокорреляция.

Слайд 12

Автокорреляция

Автокорреляция, также известная как сериальная корреляция, имеет место, когда остатки не являются

Автокорреляция Автокорреляция, также известная как сериальная корреляция, имеет место, когда остатки не
независимыми друг от друга, потому что текущие значения Y находятся под влиянием прошлых значений. Зависимость между остатками описывается с помощью авторегрессионной зависимости. Эмпирическое правило гласит, что если критерий Дарбина-Уотсона равен двум, то не существует положительной автокор­реляции, если он равен нулю, то имеет место совершенная по­ложительная автокорреляция, а если он равен четырем, то имеет место совершенная отрицательная автокорреляция. Если статистика DW находится в интервале от 1.3 до 2.7 мы можем считать, что статистическая значимая автокорреляция остатков отсутствует.

Слайд 13

Мультиколлинеарность

Если некоторые или все независимые переменные в множест­венной регрессии являются высоко

Мультиколлинеарность Если некоторые или все независимые переменные в множест­венной регрессии являются высоко
коррелированными, то рег­рессионной модели трудно разграничить их отдельные объяс­няющие воздействия на Y. В результате высококоррелирован­ные независимые переменные действуют в одном направле­нии и имеют недостаточно независимое колебание, чтобы дать возможность модели изолировать влияние каждой пере­менной. Не существует точного граничного значения уровня корреляции переменных, при котором возникает проблема мультиколлинеарности. Это явление особенно часто имеет место при ана­лизе фондовых переменных, таких, как доходность и объемы продаж, когда инфляция, например, может повлиять на оба временных ряда.

Слайд 14

Для уменьшения мультиколлинеарности может быть принято несколько мер:
Увеличивают объем выборки по принципу,

Для уменьшения мультиколлинеарности может быть принято несколько мер: Увеличивают объем выборки по
что больше данных означает меньшие дисперсии оценок МНК. Проблема реализации этого варианта решения состоит в трудности на­хождения дополнительных данных.
Исключают те переменные, которые высококоррелированны с остальными. Проблема здесь заключается в том, что возможно переменные были включены на теоретической основе, и будет неправомочным их исключение только лишь для того, чтобы сделать статистические результаты "лучше".

Слайд 15

Фиктивные переменные

Иногда необходимо включение в регрессионную модель одной или более качественных

Фиктивные переменные Иногда необходимо включение в регрессионную модель одной или более качественных
переменных, например, степени качества управления инвестиционным портфелем. Альтернативно может понадобиться сде­лать качественное различие между наблюдениями одних и тех же данных. Например, если проверяется взаимосвязь между разме­ром компании и ежемесячными доходами по акциям, может быть желательным включение качественной переменной, представ­ляющей месяц январь, по причине хорошо известного "январского эффекта" во временных рядах доходов по ценным бумагам.

Слайд 16

Нелинейная регрессия.

Интервал прогнозирования:

Нелинейная регрессия. Интервал прогнозирования:

Слайд 17

Выявление наличия корреляционной связи между парой показателей и оценка ее тесноты.

линейный (парный)

Выявление наличия корреляционной связи между парой показателей и оценка ее тесноты. линейный
коэффициент корреляции:

Для качественной оценки коэффициента корреляции применяют­ся различные шкалы, наиболее часто - шкала Чеддока. В зависи­мости от значения коэффициента корреляции связь может иметь одну из оценок:
0.1 - 0.3 - слабая;
0.3 - 0.5 - заметная;
0.5 - 0.7 - умеренная;
0.7 - 0.9 - высокая;
0.9 - 1.0 - весьма высокая.

Слайд 18

Оценка значимости коэффициента корреляции при малых объемах выборки выполняется с использованием t-критерия

Оценка значимости коэффициента корреляции при малых объемах выборки выполняется с использованием t-критерия
Стьюдента. При этом фактическое (наблюдаемое) значение этого критерия определяется по формуле

Слайд 19

Линейный коэффициент корреляции изменяется в пределах от -1 до +1. Его

Линейный коэффициент корреляции изменяется в пределах от -1 до +1. Его положительные
положительные значения свидетельствуют о пря­мой связи между переменными, отрицательные - об обратной. Близость коэффициента корреляции к нулю свидетельствует о сла­бой связи между переменными и о нецелесообразности ее моде­лирования. Следует отметить, что величина коэффициента корреляции не является доказательством того, что между исследуемыми призна­ками существует причинно-следственная связь, а представляет собой оценку степени взаимной согласованности в изменениях при­знаков. Для того чтобы установить причинно-следственную зави­симость, необходим анализ качественной природы явлений.

Слайд 20

Вычисленное по этой формуле значение tнабл сравнивается с критическим значением t-критерия,

Вычисленное по этой формуле значение tнабл сравнивается с критическим значением t-критерия, которое
которое берется из таблицы значений t-критерия Стьюдента с учетом заданного уровня значимости и числа степеней свободы (n - 2).
Если tнабл > tтаб, то полученное значение коэффициента корре­ляции признается значимым (т.е. нулевая гипотеза, утвержда­ющая равенство нулю коэффициента корреляции, отвергается). И таким образом делается вывод, что между исследуемыми пере­менными есть тесная статистическая взаимосвязь.

Слайд 21

Матрица коэффициентов парной корреляции

Матрица коэффициентов парной корреляции

Слайд 22

Анализ матрицы коэффициентов парной корреляции исполь­зуют при построении моделей множественной регрессии.

Анализ матрицы коэффициентов парной корреляции исполь­зуют при построении моделей множественной регрессии. Одной
Одной корреляционной матрицей нельзя полностью описать зависимости между величинами. В связи с этим в многомерном корреляционном анализе рассматривается две задачи:
1. Определение тесноты связи одной случайной величины с совокупностью остальных величин, включенных в анализ.
2. Определение тесноты связи между двумя величинами при фиксировании или исключении влияния остальных величин.
Эти задачи решаются соответственно с помощью коэффициен­тов множественной и частной корреляции.

Слайд 23

Множественный коэффициент корреляции

Множественный коэффициент корреляции

Слайд 24

Решение первой задачи (определение тесноты связи одной слу­чайной величины с совокупностью остальных

Решение первой задачи (определение тесноты связи одной слу­чайной величины с совокупностью остальных
величин, включен­ных в анализ) осуществляется с помощью выборочного коэффици­ента множественной корреляции по формуле, где |R| - определитель корреляционной матрицы R; - алгебраическое дополнение
элемента той же мат­рицы R.
Коэффициенты множественной корреляции и детерминации являются величинами положительными, принимающими значения в интервале от 0 до 1. При приближении коэффициента R2 к единице можно сделать вывод о тесноте взаимосвязи случай­ных величин, но не о ее направлении.

Слайд 25

Частный коэффициент корреляции

Если рассматриваемые случайные величины коррелируют друг с другом, то

Частный коэффициент корреляции Если рассматриваемые случайные величины коррелируют друг с другом, то
на величине коэффициента парной корреляции час­тично сказывается влияние других величин. В связи с этим возни­кает необходимость исследования частной корреляции между ве­личинами при исключении влияния других случайных вели­чин (одной или нескольких).
Частный коэффициент корреляции определяется по формуле:

Слайд 26

Частный коэффициент корреляции

Частный коэффициент корреляции