Слайд 2Иерархическая кластеризация – алгоритмы таксономии (биологическая таксономия)
Дендограмма
Многомерное шкалирование
Карты Кохонена
Слайд 3Типы иерархической кластеризации
Дивизимный (нисходящий)
Алгомеративный (восходящий)
Слайд 4Для одноэлементных кластеров
Универсальная формула расстояние между кластерами. Ланс и Уильямс 1967 году
Расстояния
между кластерами
Слайд 6Агломеративная кластеризация Ланса-Уильямса
Слайд 7Свойство монотонности
Теорема Миллигана 1997г.
Из перечисленных выше не является монотонным
Слайд 8Свойства растяжения и сжатия
Растягивающие
Сжимающие
Сохраняющие метрику пространства
Определяется через отношение
Гибкое расстояние
Слайд 9Свойство редуктивности
Ускорение алгоритма кластеризации
Определение Брюиноша 1978г.
Теорема Диде и Моро 1984г.
Слайд 10Быстрая агломеративная кластеризация на основе редуктивности
Слайд 11Определение числа кластеров
Число кластеров
Ограничение
Выбор количество t множеств
Слайд 12Достоинства и недостатки
Метод ближнего соседа обладает цепочечным эффектом
Метод дальнего соседа на раннем
этапе может объединять довольно несхожие группы
Метод расстояние между центрами масс «золотая середина»
Метод Уорда чаще восстанавливает наилучшую кластеризацию
Слайд 13Источники
http://www.ccas.ru/voron/download/Clustering.pdf
https://yadi.sk/i/MelajPEXcG84H
http://logic.pdmi.ras.ru/~sergey/teaching/ml/11-cluster.pdf