Кластерный анализ

Содержание

Слайд 2

Литература

1. Факторный, дискриминантный и кластерный анализ: Пер. с англ. / Дж.-О.Ким, Ч.У.Мюллер, У.Р.Клекка

Литература 1. Факторный, дискриминантный и кластерный анализ: Пер. с англ. / Дж.-О.Ким,
и др.; Под ред. И.С.Енюкова. – М.: Финансы и статистика, 1989.
2. Бююль А., Цефель П. SPSS: искусство обработки информации. – СПб.: ДиаСофт, 2001.

Слайд 3

Предназначение кластерного анализа

Построение эмпирической классификации
Кластерный анализ позволяет разбить выборку на группы схожих

Предназначение кластерного анализа Построение эмпирической классификации Кластерный анализ позволяет разбить выборку на
объектов, называемых кластерами. Члены одной группы (кластера) должны обладать схожими проявлениями переменных, а члены разных групп – различными.

Слайд 4

Стратегия кластерного анализа

1.  Выбор переменных и их   предварительные преобразования
2.  Определение меры сходства

Стратегия кластерного анализа 1. Выбор переменных и их предварительные преобразования 2. Определение
(подобия) между   объектами
3.  Выбор метода кластеризации
4.  Определение числа кластеров и   обоснование кластерного решения

Слайд 5

Важнейшие семейства кластерных методов

1. Иерархические методы
1.1. Аггломеративные *
1.2. Дивизимные
2. Итеративные методы
2.1. Метод

Важнейшие семейства кластерных методов 1. Иерархические методы 1.1. Аггломеративные * 1.2. Дивизимные
К средних *
2.2. Метод "восхождения на холм"
3. Факторные методы *
4. Нейросетевые методы
* Реализованы в SPSS

Слайд 6

Пример: классификация людей по скорости реакции на свет и звук

Пример: классификация людей по скорости реакции на свет и звук

Слайд 7

1. Выбор переменных

время реакции на свет
время реакции на звук

2. Выбор меры сходства

Евклидово

1. Выбор переменных время реакции на свет время реакции на звук 2.
расстояние

Слайд 8

3. Выбор метода кластеризации

аггломеративный
метод одиночной связи
(метод "ближайшего соседа")

3. Выбор метода кластеризации аггломеративный метод одиночной связи (метод "ближайшего соседа")

Слайд 9

Дендрограмма

Дендрограмма

Слайд 11

Диаграмма рассеяния

Диаграмма рассеяния

Слайд 12

Порядок объединения

Порядок объединения

Слайд 13

Сколько кластеров оставить

Там где расстояние между кластерами (колонка «coefficients»), определенное на основании

Сколько кластеров оставить Там где расстояние между кластерами (колонка «coefficients»), определенное на
выбранной меры увеличивается скачкообразно, процесс необходимо остановить, так как будут объеденены кластеры находящиеся слишком далеко друг от друга.

Слайд 14

Методы объединения или связи

На первом шаге, когда каждый объект представляет собой отдельный

Методы объединения или связи На первом шаге, когда каждый объект представляет собой
кластер, расстояния между этими объектами определяются выбранной мерой. Однако когда связываются вместе несколько объектов, возникает вопрос, как следует определить расстояния между кластерами?
Другими словами, необходимо правило объединения или связи для двух кластеров. Здесь имеются различные возможности.

Слайд 15

Методы объединения кластеров

1. Метод одиночной связи
2. Метод полной связи
3. Метод средней связи
3.1.

Методы объединения кластеров 1. Метод одиночной связи 2. Метод полной связи 3.
Невзвешенный
3.2. Взвешенный (внутригрупповой)
4. Центроидный метод
4.1. Невзвешенный
4.2. Взвешенный (медианый)
5. Метод Уорда

Слайд 16

Меры подобия в SPSS

Евклидова дистанция. Наиболее простой и легко интерпретируемый путь.

Меры подобия в SPSS Евклидова дистанция. Наиболее простой и легко интерпретируемый путь.
Следует помнить, что на расстояния могут сильно влиять различия между осями, по координатам которых вычисляются эти расстояния. К примеру, если одна из осей измерена в сантиметрах, а вы потом переведете ее в миллиметры (умножая значения на 10), то окончательное евклидово расстояние (или квадрат евклидова расстояния), вычисляемое по координатам, сильно изменится, и, как следствие, результаты кластерного анализа могут сильно отличаться от предыдущих. При этом следует использовать z-стандартизацию.
Имя файла: Кластерный-анализ.pptx
Количество просмотров: 374
Количество скачиваний: 1