Методы корреляционно-регрессионного анализа фондового рынка

Февраль 24, 2021

Главная
Математика
Методы корреляционно-регрессионного анализа фондового рынка

Содержание

2. Определение параметров уравнения регрессии с помощью метода наименьших квадратов
3. При использовании МНК к ошибкам предъявляются следующие требования, называемые условиями Гаусса - Маркова: 1) величина является
4. Критерии значимости коэффициентов и в уравнении регрессии. Коэффициент детерминации .
5. При оценке значимости коэффициента линейной регрессии можно использовать следующее грубое правило. Если стандартная ошибка коэффициента больше
6. Коэффициент детерминации характеризует долю вариации (разброса) зависимой переменной, объясненной с помощью данного уравнения. В качестве меры
7. Иногда при расчете коэффициента детерминации для получения несмещенных оценок дисперсии в числителе и знаменателе вычитаемой из
8. Для определения статистической значимости коэффициента детерминации проверяется нулевая гипотеза для F-статистики, рассчитываемой по формуле: Величина F,
9. Гетероскедастичность. Если остатки имеют постоянную дисперсию, они называются гомоскедастичными, но если они непостоянны, то гетероскедастичными. Гетероскедастичность
10. Гетероскедастичность Критерий Голдфелда-Кванта - это отношение суммы квадратов отклонений (СКО) высоких остатков к СКО низких остатков:
11. Автокорреляция.
12. Автокорреляция Автокорреляция, также известная как сериальная корреляция, имеет место, когда остатки не являются независимыми друг от
13. Мультиколлинеарность Если некоторые или все независимые переменные в множественной регрессии являются высоко коррелированными, то регрессионной модели
14. Для уменьшения мультиколлинеарности может быть принято несколько мер: Увеличивают объем выборки по принципу, что больше данных
15. Фиктивные переменные Иногда необходимо включение в регрессионную модель одной или более качественных переменных, например, степени качества
16. Нелинейная регрессия. Интервал прогнозирования:
17. Выявление наличия корреляционной связи между парой показателей и оценка ее тесноты. линейный (парный) коэффициент корреляции: Для
18. Оценка значимости коэффициента корреляции при малых объемах выборки выполняется с использованием t-критерия Стьюдента. При этом фактическое
19. Линейный коэффициент корреляции изменяется в пределах от -1 до +1. Его положительные значения свидетельствуют о прямой
20. Вычисленное по этой формуле значение tнабл сравнивается с критическим значением t-критерия, которое берется из таблицы значений
21. Матрица коэффициентов парной корреляции
22. Анализ матрицы коэффициентов парной корреляции используют при построении моделей множественной регрессии. Одной корреляционной матрицей нельзя полностью
23. Множественный коэффициент корреляции
24. Решение первой задачи (определение тесноты связи одной случайной величины с совокупностью остальных величин, включенных в анализ)
25. Частный коэффициент корреляции Если рассматриваемые случайные величины коррелируют друг с другом, то на величине коэффициента парной
26. Частный коэффициент корреляции
28. Скачать презентацию

Определение параметров уравнения регрессии с помощью метода наименьших квадратов

При использовании МНК к ошибкам предъявляются следующие требования, называемые условиями

Гаусса - Маркова:

1) величина является случайной переменной;
2) математическое ожидание равно нулю: М( ) = 0;
3) дисперсия постоянна: D( ) = для всех i;
4) значения независимы между собой. Откуда вытекает, в
частности, что
5) величины статистически независимы от значений .

Слайд 4

Критерии значимости коэффициентов и в уравнении регрессии.
Коэффициент детерминации
.

Слайд 5

При оценке значимости коэффициента линейной регрессии можно использовать следующее грубое правило.

Если стандартная ошибка коэффициента больше его модуля, т.е. t < 1, то он не может быть признан хорошим (значимым). Если стандартная ошибка меньше модуля коэффициента, но больше его половины, т.е. 1 < t < 2, то сделанная оценка может рассматриваться как более или менее значимая. Доверительная вероятность здесь примерно от 0,7 до 0,95. Значение t от 2 до 3 свидетельствуете весьма значимой связи (доверительная вероятность от 0,95 до 0,99), и t > 3 есть практически стопроцентное свидетельство ее наличия. Конечно, в каждом случае играет роль число наблюдений; чем их больше, тем надежнее при прочих равных условиях выводы о наличии связи и тем меньше верхняя граница доверительного интервала для данных числа степеней свободы и уровня значимости.

Слайд 6

Коэффициент детерминации характеризует долю вариации (разброса) зависимой переменной, объясненной с помощью

данного уравнения. В качестве меры разброса зависимой переменной обычно используется ее дисперсия, а остаточная вариация может быть измерена как дисперсия отклонений вокруг линии регрессии. Если числитель и знаменатель вычитаемой из единицы дроби разделить на число наблюдений n, то получим, соответственно, выборочные оценки остаточной дисперсии и дисперсии зависимой переменной Y. Отношение остаточной и общей дисперсий представляет собой долю необъясненной дисперсии. Если же эту долю вычесть из единицы, то получим долю дисперсии зависимой переменной, объясненной с помощью регрессии.

Слайд 7

Иногда при расчете коэффициента детерминации для получения несмещенных оценок дисперсии в

числителе и знаменателе вычитаемой из единицы дроби делается поправка на число степеней свободы; тогда

Слайд 8

Для определения статистической значимости коэффициента детерминации проверяется нулевая гипотеза для F-статистики,

рассчитываемой по формуле:
Величина F, если предположить, что выполнены предпосылки относительно отклонений , имеет распределение Фишера с (m; n-m-1) степенями свободы, где m - число объясняющих переменных, n - число наблюдений.

Слайд 9

Гетероскедастичность.
Если остатки имеют постоянную дисперсию, они называются гомоскедастичными, но если они

непостоянны, то гетероскедастичными.
Гетероскедастичность приводит к тому, что коэффициенты регрессии больше не представляют собой лучшие оценки или не являются оценками с минимальной дисперсией, следовательно, они больше не являются наиболее эффективными коэффициентами.
Проверкой на гетероскедастичность служит тест Голдфелда-Кванта. Он требует, чтобы остатки были разделены на две группы из n наблюдений, одна группа с низкими, а другая - с высокими значениями. Обычно срединная одна шестая часть наблюдений удаляется после ранжирования в возрастающем порядке, чтобы улучшить разграничение между двумя группами.

Слайд 10

Гетероскедастичность
Критерий Голдфелда-Кванта - это отношение суммы квадратов отклонений (СКО) высоких остатков к

СКО низких остатков:
Этот критерий имеет F-распределение с (n-d)/2-k степенями свободы.
Чтобы решить проблему гетероскедастичности, нужно исследовать взаимосвязь между значениями ошибки и переменными и трансформировать регрессионную модель так, чтобы она отражала эту взаимосвязь.

Слайд 11

Автокорреляция.

Слайд 12

Автокорреляция
Автокорреляция, также известная как сериальная корреляция, имеет место, когда остатки не являются

независимыми друг от друга, потому что текущие значения Y находятся под влиянием прошлых значений. Зависимость между остатками описывается с помощью авторегрессионной зависимости. Эмпирическое правило гласит, что если критерий Дарбина-Уотсона равен двум, то не существует положительной автокорреляции, если он равен нулю, то имеет место совершенная положительная автокорреляция, а если он равен четырем, то имеет место совершенная отрицательная автокорреляция. Если статистика DW находится в интервале от 1.3 до 2.7 мы можем считать, что статистическая значимая автокорреляция остатков отсутствует.

Слайд 13

Мультиколлинеарность
Если некоторые или все независимые переменные в множественной регрессии являются высоко

коррелированными, то регрессионной модели трудно разграничить их отдельные объясняющие воздействия на Y. В результате высококоррелированные независимые переменные действуют в одном направлении и имеют недостаточно независимое колебание, чтобы дать возможность модели изолировать влияние каждой переменной. Не существует точного граничного значения уровня корреляции переменных, при котором возникает проблема мультиколлинеарности. Это явление особенно часто имеет место при анализе фондовых переменных, таких, как доходность и объемы продаж, когда инфляция, например, может повлиять на оба временных ряда.

Слайд 14

Для уменьшения мультиколлинеарности может быть принято несколько мер:
Увеличивают объем выборки по принципу,

что больше данных означает меньшие дисперсии оценок МНК. Проблема реализации этого варианта решения состоит в трудности нахождения дополнительных данных.
Исключают те переменные, которые высококоррелированны с остальными. Проблема здесь заключается в том, что возможно переменные были включены на теоретической основе, и будет неправомочным их исключение только лишь для того, чтобы сделать статистические результаты "лучше".

Слайд 15

Фиктивные переменные
Иногда необходимо включение в регрессионную модель одной или более качественных

переменных, например, степени качества управления инвестиционным портфелем. Альтернативно может понадобиться сделать качественное различие между наблюдениями одних и тех же данных. Например, если проверяется взаимосвязь между размером компании и ежемесячными доходами по акциям, может быть желательным включение качественной переменной, представляющей месяц январь, по причине хорошо известного "январского эффекта" во временных рядах доходов по ценным бумагам.

Слайд 16

Нелинейная регрессия.
Интервал прогнозирования:

Слайд 17

Выявление наличия корреляционной связи между парой показателей и оценка ее тесноты.
линейный (парный)

коэффициент корреляции:

Для качественной оценки коэффициента корреляции применяются различные шкалы, наиболее часто - шкала Чеддока. В зависимости от значения коэффициента корреляции связь может иметь одну из оценок:
0.1 - 0.3 - слабая;
0.3 - 0.5 - заметная;
0.5 - 0.7 - умеренная;
0.7 - 0.9 - высокая;
0.9 - 1.0 - весьма высокая.

Слайд 18

Оценка значимости коэффициента корреляции при малых объемах выборки выполняется с использованием t-критерия

Стьюдента. При этом фактическое (наблюдаемое) значение этого критерия определяется по формуле

Слайд 19

Линейный коэффициент корреляции изменяется в пределах от -1 до +1. Его

положительные значения свидетельствуют о прямой связи между переменными, отрицательные - об обратной. Близость коэффициента корреляции к нулю свидетельствует о слабой связи между переменными и о нецелесообразности ее моделирования. Следует отметить, что величина коэффициента корреляции не является доказательством того, что между исследуемыми признаками существует причинно-следственная связь, а представляет собой оценку степени взаимной согласованности в изменениях признаков. Для того чтобы установить причинно-следственную зависимость, необходим анализ качественной природы явлений.

Слайд 20

Вычисленное по этой формуле значение tнабл сравнивается с критическим значением t-критерия,

которое берется из таблицы значений t-критерия Стьюдента с учетом заданного уровня значимости и числа степеней свободы (n - 2).
Если tнабл > tтаб, то полученное значение коэффициента корреляции признается значимым (т.е. нулевая гипотеза, утверждающая равенство нулю коэффициента корреляции, отвергается). И таким образом делается вывод, что между исследуемыми переменными есть тесная статистическая взаимосвязь.

Слайд 21

Матрица коэффициентов парной корреляции

Слайд 22

Анализ матрицы коэффициентов парной корреляции используют при построении моделей множественной регрессии.

Одной корреляционной матрицей нельзя полностью описать зависимости между величинами. В связи с этим в многомерном корреляционном анализе рассматривается две задачи:
1. Определение тесноты связи одной случайной величины с совокупностью остальных величин, включенных в анализ.
2. Определение тесноты связи между двумя величинами при фиксировании или исключении влияния остальных величин.
Эти задачи решаются соответственно с помощью коэффициентов множественной и частной корреляции.

Слайд 23

Множественный коэффициент корреляции

Слайд 24

Решение первой задачи (определение тесноты связи одной случайной величины с совокупностью остальных

величин, включенных в анализ) осуществляется с помощью выборочного коэффициента множественной корреляции по формуле, где |R| - определитель корреляционной матрицы R; - алгебраическое дополнение
элемента той же матрицы R.
Коэффициенты множественной корреляции и детерминации являются величинами положительными, принимающими значения в интервале от 0 до 1. При приближении коэффициента R2 к единице можно сделать вывод о тесноте взаимосвязи случайных величин, но не о ее направлении.

Слайд 25

Частный коэффициент корреляции
Если рассматриваемые случайные величины коррелируют друг с другом, то

на величине коэффициента парной корреляции частично сказывается влияние других величин. В связи с этим возникает необходимость исследования частной корреляции между величинами при исключении влияния других случайных величин (одной или нескольких).
Частный коэффициент корреляции определяется по формуле:

Методы корреляционно-регрессионного анализа фондового рынка

Содержание

Определение параметров уравнения регрессии с помощью метода наименьших квадратов

При использовании МНК к ошибкам предъявляются следующие требования, называемые условиями

Критерии значимости коэффициентов и в уравнении регрессии. Коэффициент детерминации .

При оценке значимости коэффициента линейной регрессии можно использовать следующее грубое правило.

Коэффициент детерминации характеризует долю вариации (разброса) зависимой перемен­ной, объясненной с помощью

Иногда при расчете коэффициента детерминации для получе­ния несмещенных оценок дисперсии в

Для определения статистической значимости коэффициента детерминации проверяется нулевая гипотеза для F-статистики,

Гетероскедастичность. Если остатки имеют постоянную дисперсию, они называются гомоскедастичными, но если они

ГетероскедастичностьКритерий Голдфелда-Кванта - это отношение суммы квадра­тов отклонений (СКО) высоких остатков к

Автокорреляция.

АвтокорреляцияАвтокорреляция, также известная как сериальная корреляция, имеет место, когда остатки не являются

Мультиколлинеарность Если некоторые или все независимые переменные в множест­венной регрессии являются высоко

Для уменьшения мультиколлинеарности может быть принято несколько мер:Увеличивают объем выборки по принципу,

Фиктивные переменные Иногда необходимо включение в регрессионную модель одной или более качественных

Нелинейная регрессия.Интервал прогнозирования:

Выявление наличия корреляционной связи между парой показателей и оценка ее тесноты. линейный (парный)