Интеллектуальные методы обнаружения аномалий функционирования автоматизированных систем управления техническими процессами

Март 4, 2021

Главная
Информатика
Интеллектуальные методы обнаружения аномалий функционирования автоматизированных систем управления техническими процессами

Содержание

2. Что такое аномалии? Перед началом, важно определиться с типами аномалий: 1. Точечные аномалии. Единичный случай аномального
3. Простые статистические методы Простейшим способом обнаружения аномалий является выделение отклонений от обычных статистических параметров распределения, таких
4. Минусы статистических подходов Статистические методы плохо работают в следующих случаях: Данные содержат шум близкий к аномальному,
5. Поиск аномалий, основанный на плотности Аномалии обнаруживаются из предположения, что схожие данные должны находится рядом. Метрики
6. Кластеризация Ещё одной популярной техникой является кластеризация, основанная на обучении без учителя. Полагается, что схожие точки
7. Local Outlier Factor Фактор локального выброса основан на понятии локальной плотности, которая определяется k ближайшими соседями,
8. Метод опорных векторов(SVM) Основная идея метода — перевод исходных векторов в пространство более высокой размерности и
9. Изолирующий лес Ещё одним эффективным способом поиска аномалий является модифицированные алгоритм случайного леса. Такой лес случайно
11. Скачать презентацию

Слайд 2

Что такое аномалии?
Перед началом, важно определиться с типами аномалий:
1. Точечные аномалии. Единичный

случай аномального поведения, когда паттерн сильно отличается от всех предыдущих. Реальный пример: кража денег с карты, распознание на основе потраченных денег.
2. Контекстные аномалии. Аномалии завязанные на контекст, наиболее распространено в данных с временными рядами. Реальный пример: Траты $100 в день по праздникам нормально, но вызывает подозрения в других случаях.
3. Коллективные аномалии: множество данных, совокупно помогающих определить аномалии. Реальный пример: Попытка скопировать данные с удалённой машины.

Слайд 3

Простые статистические методы
Простейшим способом обнаружения аномалий является выделение отклонений от обычных статистических

параметров распределения, таких как среднее, медиана, мода и квантили.

Слайд 4

Минусы статистических подходов
Статистические методы плохо работают в следующих случаях:
Данные содержат шум близкий

к аномальному, бывает тяжело разделить нормальный и аномальный шум
Плавное изменение данных может изменить данные распределения, поэтому такой способ не всегда применим
Данные имеют сезонное распределение, это может потребовать разделение данных на несколько групп

Слайд 5

Поиск аномалий, основанный на плотности
Аномалии обнаруживаются из предположения, что схожие данные должны

находится рядом. Метрики могут отличаться, в общему случае используется евклидова метрика, но в случае категориальных данных используются другие.
Наиболее распространённый алгоритм KNN

Слайд 6

Кластеризация
Ещё одной популярной техникой является кластеризация, основанная на обучении без учителя. Полагается,

что схожие точки стремятся принадлежать к схожим кластерам.
K — means — широко используемый алгоритм, он создаёт „k“ схожих кластеров данных. Точки, не относящиеся к кластерам считаются аномалиями.

Слайд 7

Local Outlier Factor
Фактор локального выброса основан на понятии локальной плотности, которая определяется

k ближайшими соседями, расстояние до которых используется для оценки плотности. Сравнивая локальную плотность объекта с локальными плоскостями его соседей, можно идентифицировать точки, которые имеют существенно более низкую плотность чем их соседи. Они считаются выбросами.

Слайд 8

Метод опорных векторов(SVM)
Основная идея метода — перевод исходных векторов в пространство более

высокой размерности и поиск разделяющей гиперплоскости с максимальным зазором в этом пространстве. Обычно он используется при обучении с учителем, однако существуют модификации(OneClassSVM), которые позволяют обнаружить аномалии без учителя, такие алгоритмы строят границы на обучающей выборке, а затем на тестовой выборке подстраивается таким образом, чтобы идентифицировать аномалии

Слайд 9

Изолирующий лес
Ещё одним эффективным способом поиска аномалий является модифицированные алгоритм случайного леса.

Такой лес случайно выбирает признак, и затем выбирает случайное значение, по которому разделяет точки. Поскольку такое разделение можно представить в виде дерева, количество разделений, необходимое для изоляции точки, равно длине пути из корня дерева к отделяемому объекту. Средняя длина пути в лесу является мерой нормальности точки, если множество деревьев коллективно строит короткие пути для точки, такая точка является аномалией.

Интеллектуальные методы обнаружения аномалий функционирования автоматизированных систем управления техническими процессами

Содержание

Что такое аномалии?Перед началом, важно определиться с типами аномалий:1. Точечные аномалии. Единичный

Простые статистические методыПростейшим способом обнаружения аномалий является выделение отклонений от обычных статистических

Минусы статистических подходовСтатистические методы плохо работают в следующих случаях:Данные содержат шум близкий

Поиск аномалий, основанный на плотностиАномалии обнаруживаются из предположения, что схожие данные должны

КластеризацияЕщё одной популярной техникой является кластеризация, основанная на обучении без учителя. Полагается,

Local Outlier FactorФактор локального выброса основан на понятии локальной плотности, которая определяется

Метод опорных векторов(SVM)Основная идея метода — перевод исходных векторов в пространство более

Изолирующий лесЕщё одним эффективным способом поиска аномалий является модифицированные алгоритм случайного леса.

Похожие презентации