Содержание
- 2. предложен MacQueen в 1967 году (цит. по Kopparapu, Desai Bayesian Approach to Image Interpretation стр 99)
- 3. В пакете SPSS Quick Cluster. В пакете SAS – процедура FASTCLUS. Быстрый не значит небрежный.
- 4. Идея метода Заранее определяется k - число кластеров. Это непросто. Хотя ниже обсуждается процедура для определения
- 5. Далее в цикле применяем правила. Правило 1 Объект приписывается к тому кластеру, чей центр ближайший. Правило
- 6. Используется только евклидово расстояние. Недостаток исправляется в других вариантах метода к-средних. Например k-медоиды Реализован в пакете
- 7. Рассмотрим работу метода на примере. Скрипт k_means_ex_pictures_2.r
- 8. Результат зависит от начальных центров кластеров
- 9. Начальное расположение центров кластеров. Наиболее популярны два метода. 1 Forgy (фамилия). Случайным образом выбираются k наблюдений.
- 10. Определение числа кластеров То, что надо задать число кластеров, не обременительно, ведь можно прогнать процедуру, задав
- 11. Математическая модель
- 12. Отступление Расстояние Варда в иерархическом кластерном анализе https://en.wikipedia.org/wiki/Nearest-neighbor_chain_algorithm#Complete_linkage_and_average_distance
- 13. Недостатки k-means Только евклидово расстояние. Решение зависит от начальных центров. Надо определять число кластеров Слишком много
- 17. Скачать презентацию