Слайд 2Категориальные переменные
Принимают конечное, но большее двух множество значений
Например, переменная education – принимает

значение:
1 - для индивидов с незаконченным средним образованием;
2 – для индивидов с законченным средним образованием;
3 – для индивидов с незаконченным высшим образованием;
4 – для индивидов с законченным высшим образованием;
5 – для закончивших аспирантуру.
Слайд 3Например, переменная trustgovernment – принимает значение:
1 – если индивид полностью доверяет правительству;
2

– если скорее доверяет;
3 – если относится нейтрально;
4 – если скорее не доверяет;
5 – если совсем не доверяет.
Слайд 4Например, переменная fedokrug– федеральный округ, в котором проживает индивид, принимает значение:
1 –

для Северо-Западного ФО ;
2 – для Центрального ФО;
3 – для Южного ФО;
4 – для Сибирского ФО;
5 – для Уральского ФО
6 – для Приволжского ФО
7 – для Дальневлсточного ФО
8 – для Северо-Кавказского ФО
9 – для Крымского ФО.
Слайд 5Категориальные переменные не рекомендуется включать в уравнение регрессии в первоначальном виде.
Вместо одной

категориальной в уравнение регрессии включается набор фиктивных переменных
При этом (важно!!!) фиктивных переменных в уравнение регрессии следует включать на одну меньше, чем выделено категорий.
Невключенная категория называется базовой и все остальные категории сравниваются с ней.
Слайд 6Например, при моделировании зависимости спроса на некоторый товар Y от его цены

Р и среднего дохода покупателей I нередко возникает необходимость учитывать сезонность. Пусть данные являются квартальными, тогда можно создать 4 дополнительные дамми-переменные:
D1, которая =1 если период наблюдения первый квартал, и =0, если период наблюдения 2, 3 или 4 кварталы;
D2, которая =1 если период наблюдения второй квартал, и =0, если период наблюдения 1, 3 или 4 кварталы;
D3, которая =1 если период наблюдения третий квартал, и =0, если период наблюдения 1, 2 или 4 кварталы;
D4, которая =1 если период наблюдения четвертый квартал, и =0, если период наблюдения 1, 2 или 3 кварталы;
Слайд 7Но в уравнение регрессии следует включать не все 4, а только 3

квартальные дамми-переменные.
Это объясняется тем, что дамми-переменные D1, D2,D3 и D4 в сумме дают единичный столбец, и тогда условие теоремы Гаусса-Маркова о независимости столбцов матрицы Х будет нарушено (возникнет мультиколлинеарность).
Слайд 8Если в примере с сезонностью в качестве базового выбран первый квартал, то

уравнение регрессии имеет вид
Оцененное уравнение регрессии
Для 1-го квартала
Для 2-го квартала
Для 3-го квартала
Для 4-го квартала
Слайд 9Интерпретация коэффициентов:
Если коэффициент значим, то разница в спросе в первом и

втором кварталах составляет . Аналогично значимость
отражает разницу в спросе в первом и третьем (четвертом) квартале
Слайд 10Пример
Имеются данные о цвете (Color), длине (Length), ширине (Width) лепестков и показателе

роста цветков (Rate).