Содержание

Слайд 2

Кластерный анализ - многомерная статистическая процедура, выполняющая сбор данных, содержащих информацию о

Кластерный анализ - многомерная статистическая процедура, выполняющая сбор данных, содержащих информацию о
выборке объектов, и затем упорядочивающая объекты в сравнительно однородные группы. Задача кластеризации относится к статистической обработке, а также к широкому классу задач самообучения. Входные данные в случае кластерного анализа являются объекты со своими признаками, характеризующие эти объекты. По этим же признакам происходит анализ и сравнение.

Определение

Слайд 3

Задачи кластерного анализа

Кластерный анализ выполняет следующие основные задачи:
Разработка типологии или классификации.
Исследование полезных

Задачи кластерного анализа Кластерный анализ выполняет следующие основные задачи: Разработка типологии или
концептуальных схем группирования объектов.
Порождение гипотез на основе исследования данных.
Проверка гипотез или исследования для определения, действительно ли типы (группы), выделенные тем или иным способом, присутствуют в имеющихся данных.
Независимо от предмета изучения применение кластерного анализа предполагает следующие этапы:
Отбор выборки для кластеризации. Подразумевается, что имеет смысл кластеризовать только количественные данные.
Определение множества переменных, по которым будут оцениваться объекты в выборке, то есть признакового пространства.
Вычисление значений той или иной меры сходства (или различия) между объектами.
Применение метода кластерного анализа для создания групп сходных объектов.
Проверка достоверности результатов кластерного решения.

Слайд 4

Сфера применения кластерного анализа

-Биология
-Информатика
-Социология
-Аналитика
-Анализ финансового рынка
-Маркетинг и др.

Сфера применения кластерного анализа -Биология -Информатика -Социология -Аналитика -Анализ финансового рынка -Маркетинг и др.

Слайд 5

Методы кластеризации

Вероятностный подход. Предполагается, что каждый рассматриваемый объект относится к одному из

Методы кластеризации Вероятностный подход. Предполагается, что каждый рассматриваемый объект относится к одному
классов.
Подходы на основе систем искусственного интеллекта
Логический подход. Построение дендрограммы осуществляется с помощью дерева решений.
Теоретико-графовый подход.

Слайд 6

Этапы кластеризации

Этапы кластеризации

Слайд 7

Пример работы кластерного анализа

рис. 1 до процедуры кластерного анализа

рис. 2 после процедуры кластерного анализа

Пример работы кластерного анализа рис. 1 до процедуры кластерного анализа рис. 2 после процедуры кластерного анализа

Слайд 8

Цели кластерного анализа

1. Понимание данных путём выявления кластерной структуры.
Разбиение выборки на

Цели кластерного анализа 1. Понимание данных путём выявления кластерной структуры. Разбиение выборки
группы схожих объектов позволяет упростить дальнейшую обработку данных и принятия решений, применяя к каждому кластеру свой метод анализа.
2. Сжатие данных.
Если исходная выборка избыточно большая, то можно сократить её, оставив по одному наиболее типичному представителю от каждого кластера.
3. Обнаружение новизны. - Выделяются нетипичные объекты, которые не удаётся присоединить ни к одному из кластеров.

Слайд 9

Выводы

Кластерный анализ или кластеризация - это универсальный, точный аналитический метод анализа данных,

Выводы Кластерный анализ или кластеризация - это универсальный, точный аналитический метод анализа
задача, которого группировка набора объектов таким образом, чтобы объекты в одной группе (называемой кластером) были более похожи друг на друга, чем объекты в других группах (кластерах). Это основная задача исследовательского анализа данных и распространенный метод статистического анализа данных, используемый во многих областях, включая распознавание образов, анализ изображений, поиск информации, биоинформатику, сжатие данных, компьютерную графику и машинное обучение.