Содержание
- 2. Задачи интеллектуального анализа данных Задачи ИАД Описательные Ассоциативные правила Кластеризация Классификация Прогнозирование Предсказательные
- 3. Введение Задача кластеризации состоит в разделении исследуемого множества объектов на группы «похожих» объектов, называемых кластерами Решение
- 4. Кластеризация отличается от классификации тем, что этап обучения на примерах отсутствует В задачах классификации множество классов
- 5. Задача кластеризации часто решается на начальных этапах исследования, когда о данных мало что известно Ее решение
- 6. ПРИМЕР –кластеризация результатов поиска
- 8. Формальная постановка задачи Дано множество данных, состоящее из N объектов (векторов): S1, S2, …, SN Каждый
- 9. Формальная постановка задачи Таким образом, i-й объект можно записать в виде: Si = (xi1, xi2, …,
- 10. Формальная постановка задачи Требуется: найти способ сравнения d(Sp, Sq) объектов между собой (меру сходства, функцию расстояния)
- 11. евклидово расстояние Манхэттенское расстояние расстояние Чебышева Метрики расстояния между объектами
- 12. Методы кластерного анализа можно разделить на две группы: неиерархические иерархические
- 13. Виды кластеров Внутрикластерные расстояния, как правило, меньше межкластерных Но бывают ленточные кластеры, в которых внутрикластерные расстояния
- 14. Разные виды кластеров ведут к проблеме выбора оптимального алгоритма кластеризации
- 15. Алгоритмы кластеризации
- 16. Как сделать признаки равноправными в образовании кластеров? ИТОГ: мы получим значения признаков, 95% которых находится в
- 17. Метод k-средних Неиерархическим методом кластеризации является метод k-средних (k-means) Предварительно необходимо выбрать вероятное число кластеров k
- 18. Метод k-средних 1. Выбирается k произвольных исходных центров кластеров – обычно выбираются k объектов 2. Все
- 19. Метод k-средних Пример. Примем k = 3 Начальные центры – объекты 1, 3, 4 Разобьем все
- 20. Метод k-средних Найдем новые центры кластеров
- 21. Метод k-средних Найдем новые центры кластеров
- 22. Метод k-средних Разобьем все объекты по новым кластерам, относя каждый объект к кластеру с ближайшим центром
- 23. Метод k-средних Пересчитаем центры кластеров. Дальнейшая разбивка объектов по новым кластерам не меняет расположение центров
- 24. Метод k-средних: определение k с помощью метода каменистой осыпи J (Ck) - сумма квадратов расстояний от
- 25. До стандартизации После График средних значений Признаков в кластерах
- 26. Иерархические методы К иерархическим методам кластеризации относятся: агломеративный алгоритмы дивизимный алгоритмы
- 27. Агломеративный метод В начале работы алгоритма все объекты являются отдельными кластерами На первом шаге наиболее похожие
- 28. Метод ближайшего соседа (одиночная связь, Single linkage). Расстояние между двумя кластерами определяется расстоянием между двумя наиболее
- 29. 4. Невзвешенный центроидный метод (Unweighted pair-group centroid). В этом методе расстояние между двумя кластерами определяется как
- 30. Агломеративный метод Пример. Каждый объект формирует свой кластер
- 31. Агломеративный метод Выбираем и объединяем два наиболее близких кластера
- 32. Агломеративный метод Выбираем и объединяем два наиболее близких кластера
- 33. Агломеративный метод Выбираем и объединяем два наиболее близких кластера
- 34. Дивизимный метод На первом шаге все объекты помещаются в один кластер С1 Выбирается объект, у которого
- 35. Дивизимный метод Выбранный объект удаляется из кластера С1 и формирует первый элемент второго кластера С2 На
- 36. Дивизимный метод В результате один кластер делится на два дочерних, один из которых расщепляется на следующем
- 37. Иерархические методы
- 38. ДЕНДРОГРАММА
- 39. Метрики качества кластеризации Коэффициент силуэта: Здесь a — среднее внутрикластерное расстояние (то есть среднее расстояние между
- 40. Пример программы на Python from sklearn import datasets dataset = datasets.load_iris() X = dataset.data y =
- 41. DBSCAN На вход алгоритму подаётся набор точек, параметры ϵ (радиус окрестности) и m (минимальное число точек
- 42. DBSCAN
- 43. DBSCAN: результаты работы
- 45. Скачать презентацию










































Умножение дробей
Треугольники
Построение симметричных фигур
Олимпиадная математика
Презентация на тему Подобие треугольников
Теорема Байеса
Вероятность события (часть 2.1)
Периметр восьмиугольника
Письменный прием вычитания
Памятник числу π в Сиэтле
Перпендикулярности прямой и плоскости
Как умножали египтяне
Знаки тригонометрических функций. Формулы сложения
Теория вероятностей и математическая статистика
Приёмы письменного деления на однозначное число
Четырёхугольники
Презентация на тему Умножение и деление чисел на 2 и на 3 (2 класс)
Аппликации из геометрических фигур
История зарождения и развития геометрии
Начальное понятие стереометрии. Аксиомы в стереометрии. Тема 8.1 лекция (2ч)!!
Система линейных алгебраических уравнений (СЛАУ)
Область определения функции. 9 класс
Деление на десятичную дробь
Многогранники + точки. Лекция 5
Определенный интеграл
Презентация на тему Иррациональные уравнения
Начальные геометрические сведения. Признаки равенства треугольников
Учебно-методический комплект по математике по ФГОС второй ступени