Кластерный анализ в программе Statistica

Содержание

Слайд 2

Данные Росстат

Данные Росстат

Слайд 3

Данные ЦБ РФ

Динамика
курса доллара

Данные ЦБ РФ Динамика курса доллара

Слайд 4

Запускаем программу Statistica
Открываем документ (Open Document): В меню Файл выбрать команду Open
Открываем лист

Запускаем программу Statistica Открываем документ (Open Document): В меню Файл выбрать команду
КурсАлко в файле КурсАлко.xls

Слайд 5

В Statistica 6 вызываем диалог кластерного анализа Меню Статистика / Многомерные исследовательские методы

В Statistica 6 вызываем диалог кластерного анализа Меню Статистика / Многомерные исследовательские методы / Анализ кластера
/ Анализ кластера

Слайд 6

В Statistica 10 переходим на вкладку Анализ→Многомерный разведочный→Кластерный

В Statistica 10 переходим на вкладку Анализ→Многомерный разведочный→Кластерный

Слайд 7

В появившемся окне диалога Statistica 6 выбираем иерархические агломеративные методы Joining (tree

В появившемся окне диалога Statistica 6 выбираем иерархические агломеративные методы Joining (tree clustering)
clustering)

Слайд 8

Открываем вкладку Advanced

Открываем вкладку Advanced

Слайд 9

Выбираем переменные - кнопка Variables (Дополнительно) - в открывшемся окне диалога выбрать все переменные

Выбираем переменные - кнопка Variables (Дополнительно) - в открывшемся окне диалога выбрать
(можно нажать кнопку Select All) - нажать кнопку Ok

Слайд 10

Выбираем переменные - в открывшемся окне диалога выбрать первые две переменные и нажать

Выбираем переменные - в открывшемся окне диалога выбрать первые две переменные и нажать кнопку Ok
кнопку Ok

Слайд 11

В открывающемся списке Amalgamation (linkage) rule (правило объединения в кластеры) можно указать: -

В открывающемся списке Amalgamation (linkage) rule (правило объединения в кластеры) можно указать:
Single Linkage (метод одиночной связи) - Complete Linkage (метод полной связи) - Unweighted pair-group average (метод невзвешенного попарного среднего) - Ward’s method (метод Уорда) и другие

Слайд 12

В открывающемся списке Distance measure (метрика – расстояние между объектами) можно указать: -

В открывающемся списке Distance measure (метрика – расстояние между объектами) можно указать:
Euclidean distance (евклидова метрика) - City-block Manhattan distance (манхеттенское расстояние городских кварталов) - Percent disagreement (процент несогласия) и другие

Слайд 13

Выберем метод одиночной связи и евклидову метрику
После нажатия кнопки Ok появится окно,

Выберем метод одиночной связи и евклидову метрику После нажатия кнопки Ok появится
в котором по умолчанию откроется вкладка Быстрый

Слайд 14

На вкладке Advanced (Дополнительно) представлен расширенный набор результатов

На вкладке Advanced (Дополнительно) представлен расширенный набор результатов

Слайд 15

Кнопка Distance matrix выводит матрицу расстояний (с учетом выбранной метрики)

Например, расстояние

Кнопка Distance matrix выводит матрицу расстояний (с учетом выбранной метрики) Например, расстояние
между 2000 и 2001 годом равно 3,0 по евклидовой метрике

Слайд 16

На вкладке Advanced (Дополнительно) можно вывести Схему объединения

На вкладке Advanced (Дополнительно) можно вывести Схему объединения

Слайд 17

Кнопка Amalgamation schedule (Схема объединения) выводит последовательность объединения в кластеры в виде

Кнопка Amalgamation schedule (Схема объединения) выводит последовательность объединения в кластеры в виде
таблицы

При уровне 1,91 (расстояние между кластерами не превышает два стандартных отклонения) образовано 5 кластеров:
1 КЛАСТЕР: 2003,2012 3 КЛАСТЕР: 2009 4 КЛАСТЕР: 2010,2011
2 КЛАСТЕР: 2004,2005 5 КЛАСТЕР: 2007,2008

Слайд 18

Содержательная интерпретация

Замечание
Возрастание номера кластера не означает возрастание характеристик, входящих в состав кластера
В

Содержательная интерпретация Замечание Возрастание номера кластера не означает возрастание характеристик, входящих в
кластерах с меньшим номером объекты расположены ближе друг к другу (плотнее) и были раньше объединены в один кластер

Слайд 19

Кнопка hierarchical tree plot (вертикальная) выводит дендрограмму в вертикальном виде

Кнопка hierarchical tree plot (вертикальная) выводит дендрограмму в вертикальном виде

Слайд 20

Содержательная интерпретация

Наиболее удалены от основной группы 2000-2013гг. следующие годы:
2015-2016
2014
В эти годы наблюдается

Содержательная интерпретация Наиболее удалены от основной группы 2000-2013гг. следующие годы: 2015-2016 2014
максимальный рост курса доллара и минимальное потребление алкоголя
Таким образом, рост курса доллара содействует снижению потребления алкоголя населением.

Слайд 21

Иллюстрация динамики

Иллюстрация динамики

Слайд 22

Иллюстрация динамики

Иллюстрация динамики