Интеллектуальные методы обнаружения аномалий функционирования автоматизированных систем управления техническими процессами

Содержание

Слайд 2

Что такое аномалии?

Перед началом, важно определиться с типами аномалий:
1. Точечные аномалии. Единичный

Что такое аномалии? Перед началом, важно определиться с типами аномалий: 1. Точечные
случай аномального поведения, когда паттерн сильно отличается от всех предыдущих. Реальный пример: кража денег с карты, распознание на основе потраченных денег.
2. Контекстные аномалии. Аномалии завязанные на контекст, наиболее распространено в данных с временными рядами. Реальный пример: Траты $100 в день по праздникам нормально, но вызывает подозрения в других случаях.
3. Коллективные аномалии: множество данных, совокупно помогающих определить аномалии. Реальный пример: Попытка скопировать данные с удалённой машины.

Слайд 3

Простые статистические методы

Простейшим способом обнаружения аномалий является выделение отклонений от обычных статистических

Простые статистические методы Простейшим способом обнаружения аномалий является выделение отклонений от обычных
параметров распределения, таких как среднее, медиана, мода и квантили.

Слайд 4

Минусы статистических подходов

Статистические методы плохо работают в следующих случаях:
Данные содержат шум близкий

Минусы статистических подходов Статистические методы плохо работают в следующих случаях: Данные содержат
к аномальному, бывает тяжело разделить нормальный и аномальный шум
Плавное изменение данных может изменить данные распределения, поэтому такой способ не всегда применим
Данные имеют сезонное распределение, это может потребовать разделение данных на несколько групп

Слайд 5

Поиск аномалий, основанный на плотности

Аномалии обнаруживаются из предположения, что схожие данные должны

Поиск аномалий, основанный на плотности Аномалии обнаруживаются из предположения, что схожие данные
находится рядом. Метрики могут отличаться, в общему случае используется евклидова метрика, но в случае категориальных данных используются другие.
Наиболее распространённый алгоритм KNN

Слайд 6

Кластеризация

Ещё одной популярной техникой является кластеризация, основанная на обучении без учителя. Полагается,

Кластеризация Ещё одной популярной техникой является кластеризация, основанная на обучении без учителя.
что схожие точки стремятся принадлежать к схожим кластерам.
K — means — широко используемый алгоритм, он создаёт „k“ схожих кластеров данных. Точки, не относящиеся к кластерам считаются аномалиями.

Слайд 7

Local Outlier Factor

Фактор локального выброса основан на понятии локальной плотности, которая определяется

Local Outlier Factor Фактор локального выброса основан на понятии локальной плотности, которая
k ближайшими соседями, расстояние до которых используется для оценки плотности. Сравнивая локальную плотность объекта с локальными плоскостями его соседей, можно идентифицировать точки, которые имеют существенно более низкую плотность чем их соседи. Они считаются выбросами.

Слайд 8

Метод опорных векторов(SVM)

Основная идея метода — перевод исходных векторов в пространство более

Метод опорных векторов(SVM) Основная идея метода — перевод исходных векторов в пространство
высокой размерности и поиск разделяющей гиперплоскости с максимальным зазором в этом пространстве. Обычно он используется при обучении с учителем, однако существуют модификации(OneClassSVM), которые позволяют обнаружить аномалии без учителя, такие алгоритмы строят границы на обучающей выборке, а затем на тестовой выборке подстраивается таким образом, чтобы идентифицировать аномалии

Слайд 9

Изолирующий лес

Ещё одним эффективным способом поиска аномалий является модифицированные алгоритм случайного леса.

Изолирующий лес Ещё одним эффективным способом поиска аномалий является модифицированные алгоритм случайного
Такой лес случайно выбирает признак, и затем выбирает случайное значение, по которому разделяет точки. Поскольку такое разделение можно представить в виде дерева, количество разделений, необходимое для изоляции точки, равно длине пути из корня дерева к отделяемому объекту. Средняя длина пути в лесу является мерой нормальности точки, если множество деревьев коллективно строит короткие пути для точки, такая точка является аномалией.
Имя файла: Интеллектуальные-методы-обнаружения-аномалий-функционирования-автоматизированных-систем-управления-техническими-процессами.pptx
Количество просмотров: 40
Количество скачиваний: 0