Data Mining Ассоциативные правила

Содержание

Слайд 2

Цель данного метода — исследование взаимной связи между событиями, которые происходят совместно.
Разновидностью

Цель данного метода — исследование взаимной связи между событиями, которые происходят совместно.
аффинитивного анализа является анализ рыночной корзины (market basket analysis), цель которого — обнаружить ассоциации между различными событиями, то есть найти правила для количественного описания взаимной связи между двумя или более событиями.

Слайд 3

Примерами приложения ассоциативных правил могут быть следующие задачи:
выявление наборов товаров, которые в

Примерами приложения ассоциативных правил могут быть следующие задачи: выявление наборов товаров, которые
супермаркетах часто покупаются вместе или никогда не покупаются вместе;
определение доли клиентов, положительно относящихся к нововведениям в их обслуживании;
определение профиля посетителей веб-ресурса;
определение доли случаев, в которых новое лекарство показывает опасный побочный эффект.

Слайд 4

Базовые понятия

транзакция — некоторое множество событий, происходящих совместно.
предметный набор — это непустое

Базовые понятия транзакция — некоторое множество событий, происходящих совместно. предметный набор —
множество предметов, появившихся в одной транзакции.

Слайд 6

ассоциативное правило формулируется в виде: «Если условие, то следствие».
Условие может ограничиваться только

ассоциативное правило формулируется в виде: «Если условие, то следствие». Условие может ограничиваться
одним предметом
(left-hand side — LHS) и (right-hand side — RHS) компоненты

Слайд 7

Показатели

Поддержка ассоциативного правила — это число транзакций, которые содержат как условие, так

Показатели Поддержка ассоциативного правила — это число транзакций, которые содержат как условие, так и следствие.
и следствие.

Слайд 8

Показатели

Достоверность ассоциативного правила A → B представляет собой меру точности правила и

Показатели Достоверность ассоциативного правила A → B представляет собой меру точности правила
определяется как отношение количества транзакций, содержащих и условие, и следствие, к количеству транзакций, содержащих условие:

Слайд 9

Значимость ассоциативных правил

Если условие и следствие независимы, то поддержка правила примерно соответствует

Значимость ассоциативных правил Если условие и следствие независимы, то поддержка правила примерно
произведению поддержек условия и следствия, то естьSAB ≈ SASB
Пример с товарами и автомобилем ВАЗ

Слайд 10

Дополнительные показатели

Лифт — это отношение частоты появления условия в транзакциях, которые также

Дополнительные показатели Лифт — это отношение частоты появления условия в транзакциях, которые
содержат и следствие, к частоте появления следствия в целом.
L(A → B) = C(A → B) / S(B).
L>1, связь положительная
L=1 связь отсутствует
L<1 связь отрицательная

Слайд 11

НО!

Правило с меньшей поддержкой и большим лифтом может быть менее значимым, чем

НО! Правило с меньшей поддержкой и большим лифтом может быть менее значимым,
альтернативное правило с большей поддержкой и меньшим лифтом, потому что последнее применяется для большего числа покупателей.

Слайд 13

Дополнительные показатели

Левередж — это разность между наблюдаемой частотой, с которой условие и

Дополнительные показатели Левередж — это разность между наблюдаемой частотой, с которой условие
следствие появляются совместно (то есть поддержкой ассоциации), и произведением частот появления (поддержек) условия и следствия по отдельности. Предложена Г. Пятецким-Шапиро.
T(A → B) = S(A → B) – S(A)S(B).

Слайд 14

Если в базе данных транзакций присутствует k предметов и все ассоциации являются

Если в базе данных транзакций присутствует k предметов и все ассоциации являются
бинарными (то есть содержат по одному предмету в условии и следствии), то потребуется проанализировать k · 2k –1 ассоциаций.

Слайд 15

Алгоритм Apriori

Алгоритм Apriori

Слайд 16

Частый предметный набор — предметный набор с поддержкой больше заданного порога либо

Частый предметный набор — предметный набор с поддержкой больше заданного порога либо
равной ему. Этот порог называется минимальной поддержкой.

Слайд 17

Методика поиска

1 Следует найти частые наборы.
2 На их основе необходимо сгенерировать ассоциативные

Методика поиска 1 Следует найти частые наборы. 2 На их основе необходимо
правила, удовлетворяющие условиям минимальной поддержки и достоверности.

Слайд 18

свойство антимонотонности

если предметный набор Z не является частым, то добавление некоторого нового

свойство антимонотонности если предметный набор Z не является частым, то добавление некоторого
предмета A к набору Z не делает его более частым.
Т.е. , если Z не является частым набором, то и набор Z U A также не будет являться таковым.

Слайд 19

Набор транзакций D

F1 = {спаржа, фасоль, капуста, кукуруза, перец, кабачки, помидоры}

Набор транзакций D F1 = {спаржа, фасоль, капуста, кукуруза, перец, кабачки, помидоры}

Слайд 20

Создание множеств Fk

алгоритм Apriori сначала создает множество Fk кандидатов в k- предметные

Создание множеств Fk алгоритм Apriori сначала создает множество Fk кандидатов в k-
наборы путем связывания множества Fk – 1 с самим собой. Затем Fk сокращается с использованием свойства антимонотонности.

Слайд 21

Множества F2

Множества F2

Слайд 22

Генерация множеств F3

Для этого нужно связать наборы из множества F2 между собой,,

Генерация множеств F3 Для этого нужно связать наборы из множества F2 между
если у них первые k – 1 предметов общие.
{спаржа, фасоль} + {спаржа, кабачки} = {спаржа, фасоль, кабачки}

Слайд 23

Теперь F3 также сокращается с помощью свойства антимонотонности. Для каждого предметного набора

Теперь F3 также сокращается с помощью свойства антимонотонности. Для каждого предметного набора
s из множества F3 создаются и проверяются поднаборы размером k – 1.

Слайд 24

Генерация ассоциативных правил

1 Генерируются все возможные поднаборы s
2 Если поднабор ss является

Генерация ассоциативных правил 1 Генерируются все возможные поднаборы s 2 Если поднабор
непустым поднабором s, то рассматривается ассоциативное правило R: ss → (s – ss), где s – ss представляет собой набор s без поднабора ss.

Слайд 25

{спаржа, фасоль, кабачки}
и {фасоль, кукуруза, помидоры}
Для первого ассоциативного правила ss =

{спаржа, фасоль, кабачки} и {фасоль, кукуруза, помидоры} Для первого ассоциативного правила ss
{спаржа, фасоль}, и тогда (s – ss) = {кабачки}

Слайд 26

Иерархические ассоциативные правила

Иерархические ассоциативные правила

Слайд 27

S(I) ≥ S(ij),
где I — группа в иерархии,
ij — предмет, входящий в

S(I) ≥ S(ij), где I — группа в иерархии, ij — предмет, входящий в данную группу.
данную группу.

Слайд 28

Ассоциативные правила, обнаруженные для предметов, расположенных на различных иерархических уровнях, получили название

Ассоциативные правила, обнаруженные для предметов, расположенных на различных иерархических уровнях, получили название
иерархические ассоциативные правила.
В зарубежной литературе они также известны как многоуровневые правила (multilevel rules) или обобщенные правила (generalized rules).

Слайд 30

1 Сначала ищутся ассоциации с высокой поддержкой для верхних уровней иерархии.
2 Анализируются

1 Сначала ищутся ассоциации с высокой поддержкой для верхних уровней иерархии. 2
потомки только тех предметов верхних уровней, которые удовлетворяют заданному минимуму поддержки Smin. Анализ потомков тех предметов, которые сами по себе являются редкими, не имеет смысла, поскольку они будут встречаться еще реже, чем их предки.

Слайд 31

Методы поиска иерархических ассоциативных правил

Вариант 1 — использование одинакового порога минимальной поддержки

Методы поиска иерархических ассоциативных правил Вариант 1 — использование одинакового порога минимальной
Smin на всех иерархических уровнях.

Слайд 32

Маловероятно, что предметы нижних уровней продаются так же часто, как предметы более

Маловероятно, что предметы нижних уровней продаются так же часто, как предметы более
высоких уровней.
Если Smin слишком большой, это может привести к потере полезных ассоциаций между предметами низких уровней.
Если Smin слишком низкий, это может породить много неинтересных ассоциаций между предметами высоких уровней.

Слайд 33

Вариант 2 — использование пониженного порога минимальной поддержки для нижних уровней иерархии

Вариант 2 — использование пониженного порога минимальной поддержки для нижних уровней иерархии

Слайд 34

Вариант 3 — независимая установка порога.
Межуровневая (cross-level) фильтрация по одному предмету.
Предмет

Вариант 3 — независимая установка порога. Межуровневая (cross-level) фильтрация по одному предмету.
на i-м уровне проверяется тогда и только тогда, когда его родительский узел на уровне i – 1 содержит частые наборы.
Имя файла: Data-Mining-Ассоциативные-правила.pptx
Количество просмотров: 412
Количество скачиваний: 10