Кошмар Бонферрони

Февраль 13, 2021

Главная
Разное
Кошмар Бонферрони

Содержание

2. Опыты по выявлению людей с паранормальными способностями: Joseph Rhine (1950) Вывод Д. Райна: «нельзя сообщать подопытным
3. Что произошло? 1- Р(100 раз не найти)
4. Точный тест Фишера с помощью монеты Значимость различий 9 против 1 равна вероятности выпадения 9 или
5. Почему в середине 90-ых заговорили о проблеме «multiple comparisons» ? В ассоциативных исследованиях полиморфизма ДНК, как
6. Генерируем две одинаково распределенные выборки по 100 особей с 20-локусными генотипами Как это бывает? Наблюдаем появление
7. Как же избежать фальшивых открытий? При проведении m независимых статистических тестов на уровне значимости α ,
8. Правило Бонферрони ликвидирует значимость вполне определенных результатов: Однако правило Бонферрони требует: p Две мутации, ассоциированные с
9. Правило Бонферрони ликвидирует значимость вполне определенных результатов: Правило Бонферрони требует: p Одна мутация + любой, не
10. Assessment of individual sensitivity to ionizing radiation and DNA repair efficiency in a healthy population F.
11. High-Throughput Detection of GST Polymorphic Alleles in a Pediatric Cancer Population P. Barnette, R. Scholl, et
12. Implication of Xenobiotic Metabolizing Enzyme gene (CYP2E1, CYP2C19, CYP2D6, mEH and NAT2) Polymorphisms in Breast Carcinoma
13. Bonferroni method creates more problems than it solves Аргументы Томаса Пернежера (Thomas Perneger, 1998): Интерпретация данных
14. …мы не будем гробить свои результаты из-за какого-то там Бонферрони …спрашивать диссертанта о Бонферрони – это
15. Чуть-чуть об ошибках статистических тестов Ошибка I рода (α) Вероятность отвергнуть правильную нулевую гипотезу = Вероятность
16. Мощность статистических тестов Мощность 80% считается приемлемой (мощность обычных тестов в реальных ситуациях) Консервативный тест -
17. От чего зависят ошибки статистических тестов? От размаха реально существующих отличий и разброса данных От объемов
18. Зависимость ошибки II рода от числа тестов при использовании поправки Бонферрони Вероятность пропустить ген с OR=2.7
19. Новый принцип проверки статистических гипотез: FDR-контроль False Discovery Rate control: Benjamini, Hochberg (1995) Вероятность фальшивого открытия
20. Алгоритм контроля FDR (Benjamini, Hochberg, 1995) Упорядочиваем тесты по уровню p-величин: p1 ≤ p2 ≤ …
21. Пример: множественные сравнения по 10 тестам Значимые различия без поправок на множественность Располагаем тесты в порядке
22. То же самое в общем случае: m – число сравнений, α =0.05 (например) Бонферрони торжествует! Контроль
23. Пример: экспрессия 3051 генов при острой лейкемии Golub T.R. Molecular classification of cancer: class discovery and
24. Permutation tests: случайные перестановки пометок «case-control» в компьютерных симуляциях по алгоритму: Что делать, если FDR не
25. Permutation test применительно к данным об ассоциации заболеваемости с 10 SNP Переставляем отметки «case-control» 10000 раз.
26. Почему Permutation test так либерален? Поправки Бонферрони и FDR предполагают, что все тесты независимы Перестановка лейблов
27. Не предусмотрен в стандартных статпакетах. На сегодняшний день доступно: Как реализовать permutation tests? free 30-day demo
28. Борьба с кошмаром Бонферрони продолжается! Нейронные сети, случайные деревья, генетические алгоритмы, гибсовские поля и еще Бог
29. http://www.bios.unc.edu/~lin/hapstat/ X. Sole, E. Guino, J. Valls, R. Iniesta1, V. Moreno (2006) http://bioinfo.iconcologia.net/index.php?module=Snpstats Soft для работы
30. SNPStats Однолокусный анализ Allele and genotype frequencies Test for Hardy-Weinberg equilibrium Analysis of association with a
31. По отдельности локусы не обнаруживают значимых ассоциаций! SNPstats в действии: ассоциации миом с 3 SNP (данные
32. Чтобы не уподобиться старому Джозефу Чтобы преодолеть соблазн раздувать отчет о проделанной работе Чтобы предупредить выпады
33. Спасибо Оргкомитету школы и Всем присутствующим !!! С удовольствием предоставлю копию презентации заинтересованными коллегам [email protected]
34. Bonferroni, FWER, FDR и все такое Bonferroni контролирует FWER (family-wise error rate), т.е., вероятность хотя бы
35. Переход от генотипов к гаплотипам Изменчивость признаков не определяется редкими мутациями отдельных генов, но зависит от
37. Скачать презентацию

Опыты по выявлению людей с паранормальными способностями:
Joseph Rhine (1950)
Вывод Д.

Райна:
«нельзя сообщать подопытным людям
об их паранормальных способностях»

Все выявленные «экстрасенсы» в последующих опытах не подтвердили свои способности

Что произошло?
1- Р(100 раз не найти)

Точный тест Фишера с помощью монеты
Значимость различий
9 против 1 равна
вероятности

выпадения
9 или 10 «орлов»
в 10 бросаниях монеты

Если объемы выборок равны, значимость различий
зависит только от числа событий
(числа мутаций в выборках)

…и не зависит от самих объемов выборок!!!

Почему в середине 90-ых заговорили о проблеме «multiple comparisons» ?
В

ассоциативных исследованиях полиморфизма ДНК, как правило, фигурируют 3-5 (или 5-20) полиморфных локусов (это число еще нужно умножить на число заболеваний или сравниваемых признаков)
Genome-wide association: изучение экспрессии генов при помощи микрочипов – 500 000 SNP.
При уровне значимости 0.01 можно ожидать 5000 ложных ассоциаций
Мета-исследования (исследования исследований): как объединять и сравнивать данные, полученные разными авторами

Проведение большого количества тестов
(множественных сравнений)
связано с опасностью фальшивых открытий

Слайд 6

Генерируем две одинаково распределенные выборки
по 100 особей с 20-локусными генотипами
Как это

бывает?
Наблюдаем появление фальшивых ассоциаций

OR p

Ген Выборка 1 Выборка 2

Больные Здоровые

Odd Ratio – отношение шансов,
популярная мера сопряженности.
При отсутствии связи OR=1

Должно быть
OR=1

Сразу 3 локуса
«ассоциированы»
с заболеваемостью!

Частоты минорых аллелей (в среднем 0.1)

Слайд 7

Как же избежать фальшивых открытий?
При проведении m независимых статистических тестов на уровне

значимости α , вероятность хотя бы одного фальшивого результата
должна быть
1-(1-α)m < 0.05

Слайд 8

Правило Бонферрони ликвидирует значимость вполне определенных результатов:
Однако правило Бонферрони требует:
p < 0,05/2=0,025
Две

мутации, ассоциированные с заболеванием

Слайд 9

Правило Бонферрони ликвидирует значимость вполне определенных результатов:
Правило Бонферрони требует:
p < 0,05/2=0,025
Одна мутация

Правило Бонферрони ликвидирует значимость вполне определенных результатов: Правило Бонферрони требует: p Одна

+ любой, не относящийся к делу признак

Увы, это не шутка!!!

Слайд 10

Assessment of individual sensitivity to ionizing radiation and DNA repair efficiency in

a healthy population
F. Marcona, C. Andreoli, et al. Mut. Res., 541 (2003)

Генотипы

Слайд 11

High-Throughput Detection of GST Polymorphic Alleles in a Pediatric Cancer Population
P.

Barnette, R. Scholl, et al. Cancer Epidemiology, Biomarkers & PreventionVol. 13, 304–313, 2004

8 видов заболеваний

13 генотипов

OR=6,4
P=0,007

OR=2,3
P=0,018

Гомозиготность по делециям GST защищает от рака!

Контроль

Слайд 12

Implication of Xenobiotic Metabolizing Enzyme gene (CYP2E1, CYP2C19, CYP2D6, mEH and NAT2)

Polymorphisms in Breast Carcinoma
A. Khedhaier, E. Hassen, et. al. BMC Cancer, 2008

microsomal Epoxide Hydrolase:
Минорный аллель (С) обуславливает пониженную активность фермента

У больных 12%
гомозигот СС
против 6% в контроле

При этом среднее время выживания
гомозигот СС выше, чем у больных с
другими генотипами
(повышенная эффективность химиотерапии?)

Слайд 13

Bonferroni method creates more problems than it solves
Аргументы Томаса Пернежера (Thomas

Perneger, 1998):
Интерпретация данных зависит от числа тестов. Это противно нашей интуиции. Данные не могут терять значимость от того, что их кто-то подтвердил!
При большом количестве тестов гипотеза о том, что все наблюдаемые различия неслучайны, никому не нужна
При коррекции Бонферрони вероятность упустить существенные различия столь велика, что
…лучше просто перечислить какие тесты дали
значимые результаты и, главное, почему

“Bonferroni adjustments are, at best, unnecessary and,
at worst, deleterious to sound statistical inference…”

Слайд 14

…мы не будем гробить свои результаты из-за какого-то там Бонферрони
…спрашивать диссертанта

о Бонферрони – это дурной тон
…«бонферронофобия» набирает обороты
…разработчики программ не желают вводить кнопочку «Bonferroni»
…хуже Бонферрони ничего нет, не считая отсутствия всякой коррекции

Из разговоров на форуме molbiol.ru:

Слайд 15

Чуть-чуть об ошибках статистических тестов
Ошибка I рода (α)
Вероятность отвергнуть правильную нулевую

гипотезу = Вероятность обнаружить различия там, где их нет = Вероятность совершить фальшивое открытие

Ошибка II рода (β)
Вероятность принять неправильную нулевую гипотезу = Вероятность не обнаружить существующие различия = Вероятность упустить открытие

Мощность теста = 1- Ошибка II рода =
Вероятность правильно отвергнуть нулевую гипотезу
Вероятность не упустить открытие

Нулевая гипотеза – обычно предположение об отсутствии различий = 2 выборки из одной генеральной совокупности

Традиционно биолог ориентирован на контроль
ошибки I рода (через уровень значимости),
т.е. на гарантии отсутствия ложных открытий,

… и при этом мало заботится о возможности
упустить открытие (ошибка II рода)

Слайд 16

Мощность статистических тестов
Мощность 80% считается приемлемой
(мощность обычных тестов в реальных

ситуациях)
Консервативный тест - это тест с низкой мощностью
(напр., критерий Колмогорова-Смирнова)
Метод Бонферрони – архиконсервативен
(особенно при сравнении частот)
Во многих случаях коррекция Бонферрони делает
выявление значимых результатов попросту невозможным

Слайд 17

От чего зависят ошибки статистических тестов?
От размаха реально существующих отличий и

разброса
данных
От объемов выборок
Ошибки I и II рода однозначно не связаны. В целом
ошибка II рода растет при уменьшении ошибки I рода
(главная причина маломощности метода Бонферрони )

С увеличением объема выборки мощность теста
(вероятность не упустить открытие)
всегда возрастает

Крайний случай:
«критерий» св. Фомы Неверующего (0033)
Ошибка I рода = 0 ⇔ Ошибка II рода = 1

Ошибка I рода (вероятность фальшивого открытия)
слабо зависит от объемов выборок,
если они сравнимы по величине

Слайд 18

Зависимость ошибки II рода от числа тестов при использовании поправки Бонферрони
Вероятность пропустить

ген с OR=2.7
на выборках 100 (case) и 100 (control)

При 100 сравнениях ради того, чтобы гарантировать
отсутствие хотя бы одного
ложного результата, мы упускаем 88% открытий!

При m=100 ошибка равна 0.88

В отдельном тесте вероятность упустить открытие равна 0.2

При 5 сравнениях упускаем 50% открытий

Слайд 19

Новый принцип проверки статистических гипотез: FDR-контроль
False Discovery Rate control: Benjamini, Hochberg

(1995)

Вероятность фальшивого открытия < Уровня значимости
Ошибка I рода < 0.05

Слайд 20

Алгоритм контроля FDR (Benjamini, Hochberg, 1995)
Упорядочиваем тесты по уровню p-величин:

p1 ≤ p2 ≤ … ≤ pm.
Для контроля FDR на уровне α (например 0.05),
находим
Считаем различия значимыми при j = 1, …, j*.
При j > j* различия считаются незначимыми

Порядковый номер гена

Желательный уровень значимости

Общее число тестов (генов)

Величина p для j-ого теста (гена)

Слайд 21

Пример: множественные сравнения по 10 тестам
Значимые различия без поправок на множественность
Располагаем тесты

в порядке увелечения p

Поправка Бонферрони оставляет значимым лишь первое сравнение

В первой клетке
как у Бонферрони,

во второй клетке
вдвое больше,

втрое больше
и т.д ….

Для 6-ого теста p больше этого значения

Значимые различия после коррекции по FDR

И это все!!!

Слайд 22

То же самое в общем случае:
m – число сравнений, α =0.05 (например)
Бонферрони

торжествует!
Контроль FDR приносит ощутимые результаты,
если хотя бы один тест удовлетворяет
правилу p < α/m

Слайд 23

Пример: экспрессия 3051 генов при острой лейкемии Golub T.R. Molecular classification of cancer:

class discovery and class prediction by gene expression monitoring. // Science. 2001, v.286.

t-тест: 1045 генов, для которых p<0.05
Коррекция Бонферрони : 98 генов для p’<0.000016
FDR: 681 генов, для которых FDR< 0.05

t-статистика при сравнении экспрессии гена у больных и здоровых

Число генов с данным уровнем t-статистики

Слайд 24

Permutation tests:
случайные перестановки пометок «case-control»
в компьютерных симуляциях по алгоритму:
Что делать,

если FDR не помогает?
В исходной базе данных делаем случайную перестановку
лейблов case-control
Вычисляем заново p-уровни для каждого гена (pperm)
Повторяем процедуру N раз (минимум 10000), фиксируя
случаи, когда pperm меньше исходного значения p
Вычисляем откорректированное p как

Тем самым мы отказываемся от попыток
вычислить значимость различий.
Вместо этого мы ее «измеряем» экспериментально,
разыгрывая ситуацию на компьютере

Точный тест Фишера – это тоже permutation test,
только реализованный аналитически (р вычисляется
по формулам комбинаторной теории вероятностей)

Слайд 25

Permutation test применительно к данным об ассоциации заболеваемости с 10 SNP
Переставляем отметки

«case-control» 10000 раз. В результате получаем коррекцию p

Indulgentia

Но так бывает не всегда

Слайд 26

Почему Permutation test так либерален?
Поправки Бонферрони и FDR предполагают, что все

тесты
независимы
Перестановка лейблов «case-control» сохраняет
корреляционные связи между данными
(в случае полиморфных генов можно сказать: «учитывает
неравновесие по сцеплению»)
Учитывает совместные распределения тестовых
статистик
В результате Permutation test значительно менее
консервативен, чем Bonferroni и FDR

Слайд 27

Не предусмотрен в стандартных статпакетах. На сегодняшний день доступно:
Как реализовать permutation tests?
free

30-day demo version
https://www.dynacom.co.jp/e/products/package/snpalyze
FREE!!!
http://statgen.ncsu.edu/powermarker/index.html
Free software environment for statistical computing:
встроенные функции + HaploStats, SNPassoc и многое др.
http://www.r-project.org/index.html

И все же всегда проще самому!

Слайд 28

Борьба с кошмаром Бонферрони продолжается!
Нейронные сети, случайные деревья,
генетические алгоритмы,

гибсовские поля
и еще Бог знает что
Переход от генотипов к гаплотипам:
реальное уменьшение числа сравнений.
Информация о межлокусных корреляциях сохраняется!
Если число локусов ≥3, то обычно
число наблюдаемых гаплотипов << числа генотипов

Типичная ситуация для 3 локусов:
27 возможных генотипов, но лишь
5-7 гаплотипов встречаются с частотой >1%

Слайд 29

http://www.bios.unc.edu/~lin/hapstat/
X. Sole, E. Guino, J. Valls, R. Iniesta1, V. Moreno (2006)

http://bioinfo.iconcologia.net/index.php?module=Snpstats

Soft для работы с гаплотипами

Слайд 30

SNPStats
Однолокусный анализ
Allele and genotype frequencies
Test for Hardy-Weinberg equilibrium
Analysis of

association with a response variable based on
linear or logistic regression
Multiple inheritance models: co-dominant, dominant,
recessive, over-dominant and additive
Analysis of interactions (gene-gene or gene-environment)
Многолокусный анализ
Linkage disequilibrium statistics
Haplotype frequency estimation
Analysis of association of haplotypes with the response
Analysis of interactions (haplotypes-covariate)

Слайд 31

По отдельности локусы не обнаруживают
значимых ассоциаций!
SNPstats в действии: ассоциации миом с

3 SNP (данные Т.И. Ивановой и Л.Е. Сальниковой, май 2008)

Слайд 32

Чтобы не уподобиться старому Джозефу
Чтобы преодолеть соблазн раздувать отчет о

проделанной работе
Чтобы предупредить выпады недоброжелателей
Это просто и делается вручную.
Если хотя бы одно сравнение проходит через сито
Бонферрони, то с Вас хватит FDR. В противном случае
Вам не обойтись без перестановочного компьютерного
теста.

Почему не следует пренебрегать коррекцией на множественность сравнений?

Слайд 33

Спасибо
Оргкомитету школы
и Всем присутствующим !!!
С удовольствием предоставлю копию презентации заинтересованными коллегам
[email protected]

Спасибо Оргкомитету школы и Всем присутствующим !!! С удовольствием предоставлю копию презентации заинтересованными коллегам rubanovich@vigg.ru

Слайд 34

Bonferroni, FWER, FDR и все такое
Bonferroni контролирует FWER
(family-wise error

rate), т.е., вероятность
хотя бы одного фальшивого открытия
ассоциации гена с заболеваемостью
FDR – это контроль средней доли
фальш-ассоциированных генов среди всех
генов, для которых отвергнута нулевая
гипотеза.

Слайд 35

Переход от генотипов к гаплотипам
Изменчивость признаков не определяется редкими
мутациями

отдельных генов, но зависит от большого числа
SNP (со слабыми индивидуальными эффектами)
Ассоциативные исследования полиморфизма ДНК
с необходимостью должны быть многолокусными

Association between Common Variation in 120 Candidate Genes and Breast Cancer Risk
P. Pharoah, J. Tyrer1 et al. PLoS Genetics, 2007.
710 SNP (120 genes), Case - 4400, Control – 4400.
Слабые ассоциации:
104 SNP в 8 генах метаболизма стероидных гормонов
112 SNP в 18 генах контроля клеточного цикла

Кошмар Бонферрони

Содержание

Опыты по выявлению людей с паранормальными способностями: Joseph Rhine (1950) Вывод Д.

Что произошло?1- Р(100 раз не найти)

Точный тест Фишера с помощью монетыЗначимость различий 9 против 1 равна вероятности

Почему в середине 90-ых заговорили о проблеме «multiple comparisons» ? В

Генерируем две одинаково распределенные выборки по 100 особей с 20-локусными генотипамиКак это

Как же избежать фальшивых открытий?При проведении m независимых статистических тестов на уровне

Правило Бонферрони ликвидирует значимость вполне определенных результатов:Однако правило Бонферрони требует:p < 0,05/2=0,025Две

Правило Бонферрони ликвидирует значимость вполне определенных результатов:Правило Бонферрони требует:p < 0,05/2=0,025Одна мутация

Assessment of individual sensitivity to ionizing radiation and DNA repair efficiency in

High-Throughput Detection of GST Polymorphic Alleles in a Pediatric Cancer Population P.

Implication of Xenobiotic Metabolizing Enzyme gene (CYP2E1, CYP2C19, CYP2D6, mEH and NAT2)

Bonferroni method creates more problems than it solves Аргументы Томаса Пернежера (Thomas

…мы не будем гробить свои результаты из-за какого-то там Бонферрони …спрашивать диссертанта

Чуть-чуть об ошибках статистических тестовОшибка I рода (α) Вероятность отвергнуть правильную нулевую

Мощность статистических тестов Мощность 80% считается приемлемой (мощность обычных тестов в реальных

От чего зависят ошибки статистических тестов? От размаха реально существующих отличий и

Зависимость ошибки II рода от числа тестов при использовании поправки БонферрониВероятность пропустить

Новый принцип проверки статистических гипотез: FDR-контроль False Discovery Rate control: Benjamini, Hochberg

Алгоритм контроля FDR (Benjamini, Hochberg, 1995) Упорядочиваем тесты по уровню p-величин:

Пример: множественные сравнения по 10 тестамЗначимые различия без поправок на множественностьРасполагаем тесты

То же самое в общем случае:m – число сравнений, α =0.05 (например)Бонферрони