Кластерный анализ

Содержание

Слайд 2

Кластерный анализ -
многомерная статистическая процедура, выполняющая сбор данных, содержащих информацию о

Кластерный анализ - многомерная статистическая процедура, выполняющая сбор данных, содержащих информацию о
выборке объектов, и затем упорядочивающая объекты в сравнительно однородные группы

Слайд 3

Применение кластерного анализа

1

в маркетинге — для сегментирования клиентов, конкурентов, исследования рынка

2

в медицине

Применение кластерного анализа 1 в маркетинге — для сегментирования клиентов, конкурентов, исследования
— для кластеризации симптомов, заболеваний, препаратов

3

в биологии — для классификации животных и растений

4

компьютерных науках — для группировки результатов при поиске сайтов, файлов и других объектов

Слайд 4

Курильщики сигар, возраст и уровень доходов которых известны, исследуются на предмет возможности

Курильщики сигар, возраст и уровень доходов которых известны, исследуются на предмет возможности
их разделения на однородные группы

Слайд 5

Методы кластерного анализа

1

Иерархические - первоначально все обЪекты рассматриваются как отдельные кластеры. Выстраивается

Методы кластерного анализа 1 Иерархические - первоначально все обЪекты рассматриваются как отдельные
дерево кластеров путем обЪединения первоначальных существовавших кластеров.

2

Итеративные - разбиение на кластеры получается из некоторого начального разбиения способом последовательных итераций. Число конечных кластеров пользователь задает самостоятельно.

Слайд 6

Анализ рынка

Дендрограмма - древовидная диаграмма, содержащая n уровней, каждый из которых соответствует

Анализ рынка Дендрограмма - древовидная диаграмма, содержащая n уровней, каждый из которых
одному из шагов процесса последовательного укрупнения кластеров

Слайд 7

Метод k-средних - это алгоритм, смысл которого заключается в наблюдении за набором

Метод k-средних - это алгоритм, смысл которого заключается в наблюдении за набором
немаркированных данных для автоматического обнаружения скрытой структуры, а также для обнаружения закономерности в немаркированных данных.

Слайд 8

Метрики расстояний

1

Евклидово расстояние — это прямая линия между двумя точками с координатами

Метрики расстояний 1 Евклидово расстояние — это прямая линия между двумя точками
X и Y (кратчайший путь).

2

Манхэттенское расстояние (L1)— измеряет дистанцию не по кратчайшей прямой, а по блокам. Расстояние L1 измеряет дистанцию между городскими блоками: это расстояние всех прямых линий пути.

3

Расстояние Чебышева — метрика на векторном пространстве, задаваемая как максимум модуля разности компонент векторов.

Слайд 9

Анализ рынка

Евклидово расстояние

Анализ рынка Евклидово расстояние

Слайд 10

Анализ рынка

Манхэттенское расстояние

Анализ рынка Манхэттенское расстояние

Слайд 11

Анализ рынка

Расстояние Чебышева

Анализ рынка Расстояние Чебышева

Слайд 12

В заключение

В отличие от многих других статистических процедур, методы кластерного анализа используются

В заключение В отличие от многих других статистических процедур, методы кластерного анализа
в большинстве случаев тогда, когда вы не имеете каких-либо априорных гипотез относительно классов, но все еще находитесь в описательной стадии исследования.
Имя файла: Кластерный-анализ.pptx
Количество просмотров: 32
Количество скачиваний: 0