Категориальные переменные

Содержание

Слайд 2

Категориальные переменные

Принимают конечное, но большее двух множество значений
Например, переменная education – принимает

Категориальные переменные Принимают конечное, но большее двух множество значений Например, переменная education
значение:
1 - для индивидов с незаконченным средним образованием;
2 – для индивидов с законченным средним образованием;
3 – для индивидов с незаконченным высшим образованием;
4 – для индивидов с законченным высшим образованием;
5 – для закончивших аспирантуру.

Слайд 3

Например, переменная trustgovernment – принимает значение:
1 – если индивид полностью доверяет правительству;
2

Например, переменная trustgovernment – принимает значение: 1 – если индивид полностью доверяет
– если скорее доверяет;
3 – если относится нейтрально;
4 – если скорее не доверяет;
5 – если совсем не доверяет.

Слайд 4

Например, переменная fedokrug– федеральный округ, в котором проживает индивид, принимает значение:
1 –

Например, переменная fedokrug– федеральный округ, в котором проживает индивид, принимает значение: 1
для Северо-Западного ФО ;
2 – для Центрального ФО;
3 – для Южного ФО;
4 – для Сибирского ФО;
5 – для Уральского ФО
6 – для Приволжского ФО
7 – для Дальневлсточного ФО
8 – для Северо-Кавказского ФО
9 – для Крымского ФО.

Слайд 5

Категориальные переменные не рекомендуется включать в уравнение регрессии в первоначальном виде.
Вместо одной

Категориальные переменные не рекомендуется включать в уравнение регрессии в первоначальном виде. Вместо
категориальной в уравнение регрессии включается набор фиктивных переменных
При этом (важно!!!) фиктивных переменных в уравнение регрессии следует включать на одну меньше, чем выделено категорий.
Невключенная категория называется базовой и все остальные категории сравниваются с ней.

Слайд 6

Например, при моделировании зависимости спроса на некоторый товар Y от его цены

Например, при моделировании зависимости спроса на некоторый товар Y от его цены
Р и среднего дохода покупателей I нередко возникает необходимость учитывать сезонность. Пусть данные являются квартальными, тогда можно создать 4 дополнительные дамми-переменные:
D1, которая =1 если период наблюдения первый квартал, и =0, если период наблюдения 2, 3 или 4 кварталы;
D2, которая =1 если период наблюдения второй квартал, и =0, если период наблюдения 1, 3 или 4 кварталы;
D3, которая =1 если период наблюдения третий квартал, и =0, если период наблюдения 1, 2 или 4 кварталы;
D4, которая =1 если период наблюдения четвертый квартал, и =0, если период наблюдения 1, 2 или 3 кварталы;

Слайд 7

Но в уравнение регрессии следует включать не все 4, а только 3

Но в уравнение регрессии следует включать не все 4, а только 3
квартальные дамми-переменные.
Это объясняется тем, что дамми-переменные D1, D2,D3 и D4 в сумме дают единичный столбец, и тогда условие теоремы Гаусса-Маркова о независимости столбцов матрицы Х будет нарушено (возникнет мультиколлинеарность).

Слайд 8

Если в примере с сезонностью в качестве базового выбран первый квартал, то

Если в примере с сезонностью в качестве базового выбран первый квартал, то
уравнение регрессии имеет вид
Оцененное уравнение регрессии
Для 1-го квартала
Для 2-го квартала
Для 3-го квартала
Для 4-го квартала

Слайд 9

Интерпретация коэффициентов:
Если коэффициент значим, то разница в спросе в первом и

Интерпретация коэффициентов: Если коэффициент значим, то разница в спросе в первом и
втором кварталах составляет . Аналогично значимость
отражает разницу в спросе в первом и третьем (четвертом) квартале

Слайд 10

Пример

Имеются данные о цвете (Color), длине (Length), ширине (Width) лепестков и показателе

Пример Имеются данные о цвете (Color), длине (Length), ширине (Width) лепестков и показателе роста цветков (Rate).
роста цветков (Rate).