Афинитивный анализ (теория и практика)

Содержание

Слайд 2

Аффинитивный анализ (affinity analysis) — методы исследования взаимной связи (ассоциаций) между событиями

Аффинитивный анализ (affinity analysis) — методы исследования взаимной связи (ассоциаций) между событиями
происходящими совместно и их количественная (т.е. в виде числа) оценка.
Результальт выполенния аффинитивного анализа – набор ассоциативных правил.
«affinity», в переводе означает «близость», «сходство».

Определение

Слайд 3

Сфера применения

Торговая сфера. Для выявление наборов товаров, которые в супермаркетах часто покупаются

Сфера применения Торговая сфера. Для выявление наборов товаров, которые в супермаркетах часто
вместе или никогда не покупаются вместе.
Медицина. Выявление причинно-следственных связей по возникновению побочных эффектов лекарств.
Производственная сфера. Выявление связи между параметрами оборудования и получаемыми качественными характеристиками продукта.
и многие другие сферы

Слайд 4

Ключевое понятие – транзакция – множество событий происходящих одновременно (совместно)
Например: если мы

Ключевое понятие – транзакция – множество событий происходящих одновременно (совместно) Например: если
анализируем деятельность торговой площадки, то в качестве транзакции можно рассматривать отдельный чек отдельного покупателя – совместная покупка отдельных товаров
Тогда проанализировав множество транзакций можно определить - является ли покупка одного товара следствием или причиной покупки другого товара. (клиент, купивший молоко, с вероятностью 75 % купит и хлеб)

Понятие транзакции

Слайд 5

Исходные данные – множество транзакций

Исходные данные – множество транзакций

Слайд 6

Ассоциативные правила

Импликация (бинарная логическая связка)
X→Y, где X⊂I, Y⊂I и X∩Y=⊘,
I –

Ассоциативные правила Импликация (бинарная логическая связка) X→Y, где X⊂I, Y⊂I и X∩Y=⊘,
множество всех событий
T - транзакция
X – множества событий транзакции, называемых
условием (antecedent)
Y – множества событий транзакции, называемых
Следствием (consequent)
Читается правило: «Из X следует Y»

Слайд 7

Связь между наборами предметов

X→Y
Ассоциативные правила описывают связь между
наборами событий X и

Связь между наборами предметов X→Y Ассоциативные правила описывают связь между наборами событий
Y.
Связь оценивается численно с помощью набора
показателей:
Основных:
Поддержка (support), обозначение S
Достоверность (confidence), обозначение С
и вспомогательных:
Лифт (lift), обозначение L
Левередж (leverage), обозначение T

Слайд 8

Поддержка S (support) правила A→B, рассчитывается так:

Достоверность С (сonfidence) правила A→B,
рассчитывается так:

Основные

Поддержка S (support) правила A→B, рассчитывается так: Достоверность С (сonfidence) правила A→B, рассчитывается так: Основные показатели:
показатели:

Слайд 9

Пример расчета поддержки S для правила салат→помидоры

Пример расчета поддержки S для правила салат→помидоры

Слайд 10

Пример расчета достоверности С для правила салат→помидоры

Пример расчета достоверности С для правила салат→помидоры

Слайд 11

Проверка зависимости А от B в правиле A→B

S(А,B) ≈ S(A)·S(B)

Если выполняется,

Проверка зависимости А от B в правиле A→B S(А,B) ≈ S(A)·S(B) Если
то A и B
независимы друг от друга и правило A→B непригодно.

Пример:
Всего транзакций 100 штук.
А и В встречаются совместно в 50 транзакциях: S(А,B)=50/100
А встречается в 70 транзакциях: S(A)=70/100
B встречается в 80 транзакциях: S(B)=80/100
Проверим по правилу выше:
S(А,B) ≈ S(A)·S(B)
0,5 ≈ 0,7·0,8
0,5 ≈ 0,56. Наше правило выполняется, это значит, что условие A и следствие B часто встречаются вместе, не менее часто они встречаются и по отдельности. Правило A→B непригодно.

Слайд 12

Лифт, L для правила A→B – это отношение
С(A→B)
S(B)

Значения лифта большие, чем единица,

Лифт, L для правила A→B – это отношение С(A→B) S(B) Значения лифта
показывают, что условие чаще появляется в транзакциях, содержащих следствие, чем в остальных. Можно сказать, что лифт является обобщенной мерой связи двух предметных наборов: при значениях лифта > 1 связь положительная, при 1 она отсутствует, а при значениях < 1 — отрицательная.

Слайд 13

Рассмотрим пример использования лифта для меры связи в двух правилах:
1. Помидоры →салат

Рассмотрим пример использования лифта для меры связи в двух правилах: 1. Помидоры

2. Помидоры → конфеты

Слайд 14

S(салат) = 4/10 = 0,4; С(помидоры → салат) = 4/7 = 0,57.
Следовательно,

S(салат) = 4/10 = 0,4; С(помидоры → салат) = 4/7 = 0,57.
L(помидоры → салат) = 0,57/0,4 = 1,425. >1, хорошо

Слайд 15

S(конфеты) = 6/10; С(помидоры → конфеты) = 4/7 =0,57.
Тогда L(помидоры → конфеты)

S(конфеты) = 6/10; С(помидоры → конфеты) = 4/7 =0,57. Тогда L(помидоры →
= 0,57/0,6 = 0,95. <1 плохо

Слайд 16

Противоречие использование меры лифт

Хотя лифт используется широко, он не всегда оказывается удачной

Противоречие использование меры лифт Хотя лифт используется широко, он не всегда оказывается
мерой значимости правила. Правило с меньшей поддержкой и большим лифтом может быть менее значимым, чем альтернативное правило с большей поддержкой и меньшим лифтом, потому что последнее применяется для большего числа покупателей. Значит, увеличение числа покупателей приводит к возрастанию связи между условием и следствием.

Слайд 17

Мера левередж, Т для правила A→B – это разность

Левередж применяется для сравнения

Мера левередж, Т для правила A→B – это разность Левередж применяется для
значимости двух и более правил, у которых поддержка и достоверность одинаковые.
Чем левередж больше, тем значимее правило.

Слайд 18

Сравним значимость двух правил:
морковь → помидоры
салат → помидоры
И определим, какое из

Сравним значимость двух правил: морковь → помидоры салат → помидоры И определим,
правил значимее (“сильней”)

Слайд 19

С(морковь → помидоры) = 3 / 3 = 1 L(…)=1/S(помидоры)=1/(6/10)
С(салат → помидоры)

С(морковь → помидоры) = 3 / 3 = 1 L(…)=1/S(помидоры)=1/(6/10) С(салат →
=3 / 3 = 1 L(…)=1/S(помидоры)=1/(6/10)
Имя файла: Афинитивный-анализ-(теория-и-практика).pptx
Количество просмотров: 43
Количество скачиваний: 0