Иерархическая кластеризация

Содержание

Слайд 2

Иерархическая кластеризация – алгоритмы таксономии (биологическая таксономия)
Дендограмма
Многомерное шкалирование
Карты Кохонена

Иерархическая кластеризация – алгоритмы таксономии (биологическая таксономия) Дендограмма Многомерное шкалирование Карты Кохонена

Слайд 3

Типы иерархической кластеризации

Дивизимный (нисходящий)
Алгомеративный (восходящий)

Типы иерархической кластеризации Дивизимный (нисходящий) Алгомеративный (восходящий)

Слайд 4

Для одноэлементных кластеров
Универсальная формула расстояние между кластерами. Ланс и Уильямс 1967 году

Расстояния

Для одноэлементных кластеров Универсальная формула расстояние между кластерами. Ланс и Уильямс 1967 году Расстояния между кластерами
между кластерами

Слайд 5

Расстояние на практике

Расстояние на практике

Слайд 6

Агломеративная кластеризация Ланса-Уильямса

Агломеративная кластеризация Ланса-Уильямса

Слайд 7

Свойство монотонности

Теорема Миллигана 1997г.
Из перечисленных выше не является монотонным

Свойство монотонности Теорема Миллигана 1997г. Из перечисленных выше не является монотонным

Слайд 8

Свойства растяжения и сжатия

Растягивающие
Сжимающие
Сохраняющие метрику пространства
Определяется через отношение
Гибкое расстояние

Свойства растяжения и сжатия Растягивающие Сжимающие Сохраняющие метрику пространства Определяется через отношение Гибкое расстояние

Слайд 9

Свойство редуктивности

Ускорение алгоритма кластеризации
Определение Брюиноша 1978г.
Теорема Диде и Моро 1984г.

Свойство редуктивности Ускорение алгоритма кластеризации Определение Брюиноша 1978г. Теорема Диде и Моро 1984г.

Слайд 10

Быстрая агломеративная кластеризация на основе редуктивности

Быстрая агломеративная кластеризация на основе редуктивности

Слайд 11

Определение числа кластеров

Число кластеров
Ограничение
Выбор количество t множеств

Определение числа кластеров Число кластеров Ограничение Выбор количество t множеств

Слайд 12

Достоинства и недостатки

Метод ближнего соседа обладает цепочечным эффектом
Метод дальнего соседа на раннем

Достоинства и недостатки Метод ближнего соседа обладает цепочечным эффектом Метод дальнего соседа
этапе может объединять довольно несхожие группы
Метод расстояние между центрами масс «золотая середина»
Метод Уорда чаще восстанавливает наилучшую кластеризацию

Слайд 13

Источники

http://www.ccas.ru/voron/download/Clustering.pdf
https://yadi.sk/i/MelajPEXcG84H
http://logic.pdmi.ras.ru/~sergey/teaching/ml/11-cluster.pdf

Источники http://www.ccas.ru/voron/download/Clustering.pdf https://yadi.sk/i/MelajPEXcG84H http://logic.pdmi.ras.ru/~sergey/teaching/ml/11-cluster.pdf