Метод максимальной парсимонии

Содержание

Слайд 2

Метод максимальной парсимонии (наибольшей экономии) Критерий оптимальности: лучшее дерево – самое простое дерево (самое

Метод максимальной парсимонии (наибольшей экономии) Критерий оптимальности: лучшее дерево – самое простое дерево (самое короткое)
короткое)

Слайд 3

Варианты топологий в случае трех таксонов

Ищем все
возможные топологии

Варианты топологий в случае трех таксонов Ищем все возможные топологии

Слайд 4

Для 5 таксонов возможны 15 неукорененных деревьев и 105 укорененных деревьев

Один

Для 5 таксонов возможны 15 неукорененных деревьев и 105 укорененных деревьев Один из вариантов топологии
из вариантов топологии

Слайд 5

Существует (2n-5)!! разных неукорененных
деревьев с n вершинами

Если число таксонов равно n,

Существует (2n-5)!! разных неукорененных деревьев с n вершинами Если число таксонов равно
существует (2n-3)!!
разных бинарных укоренных деревьев.
(2n-3)!! – это нечто вроде факториала, но
учитываются только четные числа.

Вначале ищем все
возможные топологии

Слайд 6

Признак 1

Для каждой топологии рассматриваем все возможные
варианты эволюции каждого признака

Признак 1 Для каждой топологии рассматриваем все возможные варианты эволюции каждого признака

Слайд 7

Считаем число изменений признаков в каждом из эволюционных сценариев

Считаем число изменений признаков в каждом из эволюционных сценариев

Слайд 8

Анализ парсимониальных деревьев

Выявление равнопарсимониальных деревьев
Построение консенсуса

Анализ парсимониальных деревьев Выявление равнопарсимониальных деревьев Построение консенсуса

Слайд 9

Пример Филогения бабочек рода Parnassius, основанная на анализе гена COI с использованием метода

Пример Филогения бабочек рода Parnassius, основанная на анализе гена COI с использованием метода максимальной парсимонии
максимальной парсимонии

Слайд 10

Проверка устойчивости филогенетической реконструкции Нужна статистика: среднее значение и уровень изменчивости Варианты реальная статистика и

Проверка устойчивости филогенетической реконструкции Нужна статистика: среднее значение и уровень изменчивости Варианты реальная статистика и bootstrapping
bootstrapping

Слайд 11

Проверка устойчивости филогенетической реконструкции Jackknife (метод вырезания)

Проверка устойчивости филогенетической реконструкции Jackknife (метод вырезания)

Слайд 12

Проверка устойчивости филогенетической реконструкции

Бутстреп (bootstrap)
Что это такое?

Проверка устойчивости филогенетической реконструкции Бутстреп (bootstrap) Что это такое?

Слайд 13

Бутстреп-анализ филогении бабочек рода Parnassius (ген COI, метод максимальной парсимонии

Бутстреп-анализ филогении бабочек рода Parnassius (ген COI, метод максимальной парсимонии

Слайд 14

Бутстреп – это не вероятность данной клады!!!!
Это скорее мера ее устойчивости при

Бутстреп – это не вероятность данной клады!!!! Это скорее мера ее устойчивости
искусственной манипуляции с данными

Слайд 15

Проверка устойчивости филогенетической реконструкции

Бутстреп
Что это такое?
Сколько псевдореплик нужно получать?
Какой смысл имеют

Проверка устойчивости филогенетической реконструкции Бутстреп Что это такое? Сколько псевдореплик нужно получать?
разные проценты бутстреп-поддержки?
Ограничение в применении метода бутстрепа (малое число признаков)

Слайд 16

Bremer support (поддержка Бремера)

Мы выбрали наиболее парсимониальное дерево, в этом случае на

Bremer support (поддержка Бремера) Мы выбрали наиболее парсимониальное дерево, в этом случае
дереве имеется определенная клада
А что будет если мы возьмем менее парсимониальное (т.е. более длинное дерево)? Сохранится ли эта клада?
Да, если есть запас прочности в виде набора синапоморфий

Слайд 17

Bremer support

BS=0
Удлинение дерева на один шаг приводит к тому, что клада исчезает
BS=1
При

Bremer support BS=0 Удлинение дерева на один шаг приводит к тому, что
удлинении дерева на один шаг данная клада сохраняется.

Слайд 18

Взвешивание признаков и сайтов – способ задать более сложные модели эволюции в

Взвешивание признаков и сайтов – способ задать более сложные модели эволюции в рамках метода максимальной парсимонии
рамках метода максимальной парсимонии

Слайд 19

Возможности и ограничения метода максимальной парсимонии Парсимония как философский принцип и парсимония как

Возможности и ограничения метода максимальной парсимонии Парсимония как философский принцип и парсимония
математическая модель Чем реже встречается признак (чем реже его изменения), тем более адекватно применение принципа парсимонии

Слайд 20

критерий парсимонии имеет некоторое теоретическое обоснование. Однако в общем виде он является

критерий парсимонии имеет некоторое теоретическое обоснование. Однако в общем виде он является
несостоятельным, и при ряде условий его использование приводит к ошибочным реконструкциям (Felsenstein, 1978, 2004)

Слайд 21

Проблема длинных ветвей

Проблема длинных ветвей

Слайд 23

Влияние эффекта притяжения длинных ветвей на результаты парсимониального филогенетического анализа таксонов A,

Влияние эффекта притяжения длинных ветвей на результаты парсимониального филогенетического анализа таксонов A,
B, C и D. 0 – плезиоморфный признак, 1-14 – апоморфные признаки. A – реальная (истинная) филогения и распределение на ней признаков. B – ложная реконструкция филогении A, получаемая при проведении кладистического анализа с использованием метода максимальной парсимонии

Слайд 24

Влияние неполноты выборки таксонов на результаты парсимониального кладистического анализа

Влияние неполноты выборки таксонов на результаты парсимониального кладистического анализа

Слайд 26

Критерии оценки методов построения деревьев

скорость (быстродействие)
трудоемкость получения исходных данных
соответствуют ли реконструкции действительности
помехоустойчивость

Критерии оценки методов построения деревьев скорость (быстродействие) трудоемкость получения исходных данных соответствуют
(чувствительность к отклонениям в модели, в данных)
проверяемость получаемых выводов

Слайд 27

Правильную ли филогению мы получили?
Возможные источники ошибок
Как проверить правильность реконструкции

Правильную ли филогению мы получили? Возможные источники ошибок Как проверить правильность реконструкции

Слайд 28

Источники ошибок в филогенетических реконструкциях

1 ) не правильный и/или недостаточный выбор признаков
2)

Источники ошибок в филогенетических реконструкциях 1 ) не правильный и/или недостаточный выбор
неправильный sampling
3) неправильный выбор внешней группы (для укорененного дерева)
4) выбор неправильной модели или метода
5) объективные трудности - сложность структуры самого дерева

Слайд 29

Метод максимального правдоподобия

Joseph Felsenstein

Метод максимального правдоподобия Joseph Felsenstein

Слайд 30

Принципы работы метода максимального правдоподобия

если имеется информация о закономерностях эволюционных преобразований признаков

Принципы работы метода максимального правдоподобия если имеется информация о закономерностях эволюционных преобразований
(иными словами, если есть модель эволюции признака),

Слайд 31

если имеется информация о закономерностях эволюционных преобразований признаков (иными словами, если есть

если имеется информация о закономерностях эволюционных преобразований признаков (иными словами, если есть
модель эволюции признака),
и известно распределение состояний признаков у изучаемых организмов,

Принципы работы метода максимального правдоподобия

Слайд 32

если имеется информация о закономерностях эволюционных преобразований признаков (иными словами, если есть

если имеется информация о закономерностях эволюционных преобразований признаков (иными словами, если есть
модель эволюции признака),
и известно распределение состояний признаков у изучаемых организмов,
то можно рассчитать вероятности различных эволюционных траекторий, которые могли привести к современным формам

Принципы работы метода максимального правдоподобия

Слайд 33

А затем к качестве оптимального дерева выбрать ту траекторию, которая имеет наибольшую

А затем к качестве оптимального дерева выбрать ту траекторию, которая имеет наибольшую
вероятность

Принципы работы метода максимального правдоподобия

Слайд 34

Построение дерева, состоящего из 3 таксонов, с использованием метода максимального правдоподобия

Построение дерева, состоящего из 3 таксонов, с использованием метода максимального правдоподобия

Слайд 35

Три возможных дерева

Три возможных дерева

Слайд 36

Рассмотрим дерево 1

Возможны 16 вариантов нуклеотидных переходов

Рассмотрим дерево 1 Возможны 16 вариантов нуклеотидных переходов

Слайд 37

Дерево 1 из 3

Вариант 1 из 16

Дерево 1 из 3 Вариант 1 из 16

Слайд 38

Дерево 1 из 3

Вариант 2 из 16

Дерево 1 из 3 Вариант 2 из 16

Слайд 39

Модель Фитча-Вагнера (Fitch-Wagner parsimony) для нуклеотидных замен
A <—› C A <—› G

Модель Фитча-Вагнера (Fitch-Wagner parsimony) для нуклеотидных замен A C G
A <—› T
C <—› G C <—› T
G <—› T

Слайд 40

Дерево 1 из 3

Вариант 1 из 16

Вероятности всех замен одинаковы, т.е. P(AC)=P(AG)=P(AT)=

Дерево 1 из 3 Вариант 1 из 16 Вероятности всех замен одинаковы,
P(CA)= P(CG)=P(CT)=
P(GA)= P(GC)=P(GT)= P(TA)=P(TC)=P(TG)= α частоты нуклеотидов равны,
т.е. f(A)=f(C)=f(G)=f(T)=0.25
Pxy = α = 1/12=0,083
Ptree = 0.25xαxαxαxα =
= 0.25x0.083x0.083x0.083x0.083
=0.00001186

Слайд 41

Это вероятность конкретного сценария в контексте вероятностей отдельных событий.
Поэтому для этой

Это вероятность конкретного сценария в контексте вероятностей отдельных событий. Поэтому для этой
величины используют понятие правдоподобие
Правдоподобие гипотезы = 0.00001186
Сумма правдоподобий не равна единице! 0.00001186 х 48=0.00056928
Но это не тоже самое что вероятность дерева как гипотезы.
P (Вероятность гипотезы) = 1/48= 0.0208
Сумма вероятностей = 1!

Слайд 42

Вопрос: какую модель мы использовали?

Вопрос: какую модель мы использовали?

Слайд 43

JC model Вероятности всех замен одинаковы, т.е. P(AC)=P(AG)=P(AT)=P(CG)=P(CT)=P(GT)=α частоты нуклеотидов равны, т.е. f(A)=f(C)=f(G)=f(T)=0.25

JC model Вероятности всех замен одинаковы, т.е. P(AC)=P(AG)=P(AT)=P(CG)=P(CT)=P(GT)=α частоты нуклеотидов равны, т.е. f(A)=f(C)=f(G)=f(T)=0.25

Слайд 44

Дерево 1 из 3

Вариант 1 из 16

А если более сложная модель?
Рассчитываем параметры,

Дерево 1 из 3 Вариант 1 из 16 А если более сложная

исходя из матрицы данных

Слайд 45

Используются те же модели, что и для расчета генетических дистанций

Где t -

Используются те же модели, что и для расчета генетических дистанций Где t
это время, PAC –
PAC = PCA

Как рассчитать эти вероятности (а вернее правдоподобия)?
Обращаемся к моделям нуклеотидных замен

Слайд 46

JC model Вероятности всех замен одинаковы, т.е. P(AC)=P(AG)=P(AT)=P(CG)=P(CT)=P(GT)=α частоты нуклеотидов равны, т.е. f(A)=f(C)=f(G)=f(T)=0.25

JC model Вероятности всех замен одинаковы, т.е. P(AC)=P(AG)=P(AT)=P(CG)=P(CT)=P(GT)=α частоты нуклеотидов равны, т.е. f(A)=f(C)=f(G)=f(T)=0.25

Слайд 47

Дерево 1 из 3

Вариант 1 из 16

Вероятности всех замен одинаковы, т.е. P(AC)=P(AG)=P(AT)=

Дерево 1 из 3 Вариант 1 из 16 Вероятности всех замен одинаковы,
P(CA)= P(CG)=P(CT)=
P(GA)= P(GC)=P(GT)= P(TA)=P(TC)=P(TG)= α частоты нуклеотидов равны,
т.е. f(A)=f(C)=f(G)=f(T)=0.25
Pxy = α = 1/12=0,083
Ptree = 0.25xαxαxαxα =
= 0.25x0.083x0.083x0.083x0.083
=0.00001186

Слайд 48

K2P Вероятности транзиций и трансверсий разные, частоты нуклеотидов равны, т.е. f(A)=f(C)=f(G)=f(T)=0.25

α – транзиция
β

K2P Вероятности транзиций и трансверсий разные, частоты нуклеотидов равны, т.е. f(A)=f(C)=f(G)=f(T)=0.25 α
– трансверсия
Параметры α и β
(т.е. вероятность
транзиций и
трансверсий)
можно оценить,
исходя из данных

Слайд 49

F81 Вероятности всех замен одинаковы, но частоты нуклеотидов разные

F81 Вероятности всех замен одинаковы, но частоты нуклеотидов разные

Слайд 50

K2P Вероятности транзиций и трансверсий разные, частоты нуклеотидов разные

K2P Вероятности транзиций и трансверсий разные, частоты нуклеотидов разные

Слайд 51

General Reversible Model Вероятности ВСЕХ ЗАМЕН разные, т.е. P(AC)=a, P(AG)=b, P(AT)c, P(CG)=d, P(CT)=e, P(GT)=f частоты

General Reversible Model Вероятности ВСЕХ ЗАМЕН разные, т.е. P(AC)=a, P(AG)=b, P(AT)c, P(CG)=d,
нуклеотидов разные т.е. f(A)=π1, f(C)= π2, f(G)= π3, f(T)= π4

Слайд 52

Для 4 таксонов возможны 3 варианта неукорененного дерева и 15 вариантов укорененного

Для 4 таксонов возможны 3 варианта неукорененного дерева и 15 вариантов укорененного дерева Один из них
дерева

Один из них

Слайд 53

Возможность использования метода максимального правдоподобия опирается в первую очередь на наличие реалистичных

Возможность использования метода максимального правдоподобия опирается в первую очередь на наличие реалистичных моделей эволюции признаков
моделей эволюции признаков

Слайд 54

Для морфологических признаков, как правило, имеются только вербальные (словесные) модели эволюции, прописанные

Для морфологических признаков, как правило, имеются только вербальные (словесные) модели эволюции, прописанные
в виде эволюционных сценариев, а не формул.
Количественные параметры этих моделей трудно, фактически невозможно разработать, исходя из имеющихся эмпирических данных
Но даже если мы создадим модель для одного признака, она не пригодны для других, так как признаки очень разнородны

Слайд 55

легко формализуются в виде формул, так как признаки стереотипны, а из изменения

легко формализуются в виде формул, так как признаки стереотипны, а из изменения
стандартны
например, модели, описывающие эволюцию нуклеотидных последовательностей:
JC (Jukes-Cantor model)
K2P (Kimura 2 parameter model)
F81 (Felsenstein 1981 model)
HKY85 (Hasegawa et al. 1985 model)
REV (general reversible model)
HKY85 + Г (Hasegawa et al. 1985 +gamma distribution model)

Модели молекулярной эволюции

Слайд 56

Аналитический и эвристические методы построения дерева максимального правдоподобия
Бутстреп

Аналитический и эвристические методы построения дерева максимального правдоподобия Бутстреп

Слайд 57

Пример Филогения бабочек рода Parnassius, основанная на анализе гена COI с использованием метода

Пример Филогения бабочек рода Parnassius, основанная на анализе гена COI с использованием метода максимального правдоподобия
максимального правдоподобия

Слайд 59

Соотношение парсимонии и максимального правдоподобия

Соотношение парсимонии и максимального правдоподобия

Слайд 60

Теоретически более состоятелен, так как не ограничен в выборе модели эволюции
1) не

Теоретически более состоятелен, так как не ограничен в выборе модели эволюции 1)
нуждается в теоретически и практически несостоятельном принципе парсимонии в качестве критерия правильной реконструкции
(хотя при необходимости и желании парсимония может быть использована как один возможных критериев выбора оптимального дерева)

Преимущества метода максимального правдоподобия:

Слайд 61

2) возможность использования гораздо большего числа признаков
не только синапоморфий, но и

2) возможность использования гораздо большего числа признаков не только синапоморфий, но и
аутапоморфий (на самом деле еще и плезиоморфий [роль инвариантных сайтов] ! – эволюционные филогенетики должны возрадоваться -
что дает принципиальную возможность разрешения большего числа узлов ветвления филогенетического дерева

Преимущество метода максимального правдоподобия:

Слайд 62

3) дает более адекватное представление об анагенетической составляющей эволюции

Преимущества метода максимального

3) дает более адекватное представление об анагенетической составляющей эволюции Преимущества метода максимального правдоподобия:
правдоподобия:

Слайд 63

4) Менее чувствителен к эффекту длинных ветвей

4) Менее чувствителен к эффекту длинных ветвей

Слайд 64

Недостатки

Ошибка в выборе модели может быть фатальна, т.е. иногда лучше упрощенная модель,

Недостатки Ошибка в выборе модели может быть фатальна, т.е. иногда лучше упрощенная
чем более совершенная, но явно ошибочная

Слайд 65

Методы укоренения деревьев

По внешней группе
Принципы выбора внешней группы
По средней точке – чтобы

Методы укоренения деревьев По внешней группе Принципы выбора внешней группы По средней
расстояние от общего предка до конца ветвей было одинаковым (основан на принципе молекулярных часов)

Слайд 66

По внешней группе
Принципы выбора внешней группы
Внешняя точка должна быть заведомо внешней

По внешней группе Принципы выбора внешней группы Внешняя точка должна быть заведомо внешней

Слайд 67

По внешней группе
Принципы выбора внешней группы
Внешняя точка должна быть заведомо внешней
Но желательно

По внешней группе Принципы выбора внешней группы Внешняя точка должна быть заведомо
не слишком далекой (т.е. максимально близкая, но заведомо внешняя)

Слайд 68

По внешней группе
Принципы выбора внешней группы
Внешняя группа должна быть заведомо внешней
Но желательно

По внешней группе Принципы выбора внешней группы Внешняя группа должна быть заведомо
не слишком далекой (т.е. максимально близкая, но заведомо внешняя)
Внешняя группа желательно должна быть множественной

Слайд 69

По внешней группе
Принципы выбора внешней группы
Внешняя группа должна быть заведомо внешней
Но желательно

По внешней группе Принципы выбора внешней группы Внешняя группа должна быть заведомо
не слишком далекой (т.е. максимально близкая, но заведомо внешняя)
Внешняя группа желательно должна быть множественной
Внешняя группа не должна быть полифилетической

Слайд 70

(по: Клюге, 2000,
с изменениями)

Представление о филогении членистоногих, которое недавно считалось классическим: насекомые

(по: Клюге, 2000, с изменениями) Представление о филогении членистоногих, которое недавно считалось
(Hexapoda) и многоножки (Myriapoda) – сестринские группы

Слайд 71

Regier et al., 2008. Resolving Arthropod phylogeny: Exploring phylogenetic signal within 41

Regier et al., 2008. Resolving Arthropod phylogeny: Exploring phylogenetic signal within 41
kb of
protein-coding nuclear gene sequence. Syst.biol. 57:920-938

формальный анализ всей совокупности молекулярных признаков (62 гена, 41000 пар нуклеотидов) поддерживает как Pancrustacea, так и Myriochelata

Слайд 72

Методы укоренения деревьев

По средней точке – чтобы расстояние от общего предка до

Методы укоренения деревьев По средней точке – чтобы расстояние от общего предка
конца ветвей было одинаковым (основан на принципе молекулярных часов)
Имя файла: Метод-максимальной-парсимонии-.pptx
Количество просмотров: 481
Количество скачиваний: 0