Полногеномный поиск ассоциаций для множества фенотипических признаков

Содержание

Слайд 2

Полногеномный поиск ассоциаций

Подходы в исследованиях GWAS

Случай - контроль

Анализ количественных фенотипических признаков

Схема, при

Полногеномный поиск ассоциаций Подходы в исследованиях GWAS Случай - контроль Анализ количественных
которой сравниваются две большие группы особей

Нет разделения особей на группу случаев и группу контроля

SNP - отличия последовательности ДНК размером в один нуклеотид (A, T, G или C) в геноме представителей одного вида или между гомологичными участками гомологичных хромосом.

Полногеномный поиск ассоциаций (GWAS, Genome-Wide Association Studies) – направление биологических исследований, связанных с изучением ассоциаций между геномными вариантами и фенотипическими признаками.

Слайд 3

Алгоритм mtSet программного комплекса Limix

 

 

 

 

 

Алгоритм mtSet программного комплекса Limix

Слайд 4

Цель работы

Цель данной работы заключается в том, чтобы разработать алгоритм, который, возможно,

Цель работы Цель данной работы заключается в том, чтобы разработать алгоритм, который,
с небольшой потерей точности, мог бы производить полногеномный поиск ассоциаций множественных фенотипических признаков быстрее, чем алгоритм mtSet.
Для достижения поставленной цели в работе решаются следующие задачи:

1. Разработка алгоритма формирования групп фенотипических признаков.

2. Разработка алгоритма быстрого полногеномного поиска ассоциаций для группы фенотипических признаков.

3. Реализация интеграционного модуля между алгоритмом быстрого полногеномного поиска ассоциаций и алгоритмом mtSet.

4. Выполнение тестирования на данных фенотипа и генотипа растения Arabidopsis thaliana

Слайд 5

Разработанный алгоритм

Алгоритм формирования групп фенотипических признаков

Алгоритм быстрого полногеномного поиска ассоциаций

Интеграционный модуль

Алгоритм

Разработанный алгоритм Алгоритм формирования групп фенотипических признаков Алгоритм быстрого полногеномного поиска ассоциаций
полногеномного поиска mtSet

 

 

 

 

Слайд 6

Алгоритм формирования групп фенотипических признаков

Количественные фенотипические признаки

Решение проблемы неполноты данных

Замена средним
Метод

Алгоритм формирования групп фенотипических признаков Количественные фенотипические признаки Решение проблемы неполноты данных
линейной регрессионной модели

Построение графа фенотипических признаков

Подсчет корреляций для всевозможных пар признаков
Статистическая значимость корреляции

Кластеризация фенотипических признаков

Алгоритм Клаусета-Ньюмена-Мура
Алгоритм Гирван-Ньюмена
Поправка на множественное сравнение

Слайд 7

Алгоритм формирования групп фенотипических признаков часть 1

0.95
0.80
0.70

Алгоритм формирования групп фенотипических признаков часть 1 0.95 0.80 0.70

Слайд 8

Алгоритм формирования групп фенотипических признаков часть 2

Результат применения алгоритма Гирвен-Ньюмен к зеленому

Алгоритм формирования групп фенотипических признаков часть 2 Результат применения алгоритма Гирвен-Ньюмен к
графу
Было выделено 10 групп признаков

Результат применения алгоритма Гирвен-Ньюмен к зеленому графу
Было выделено 12 групп признаков

Слайд 9

Алгоритм быстрого полногеномного поиска ассоциаций часть 1

 

 

 

 

 

 

 

 

 

 

Показатель вклада i-го SNP
в данную группу

Алгоритм быстрого полногеномного поиска ассоциаций часть 1 Показатель вклада i-го SNP в данную группу фенотипических признаков

фенотипических признаков

Слайд 10

Алгоритм быстрого полногеномного поиска ассоциаций часть 2

 

 

Алгоритм иерархической кластеризации
методом ближайшего соседа

Получили

Алгоритм быстрого полногеномного поиска ассоциаций часть 2 Алгоритм иерархической кластеризации методом ближайшего
набор отрезков генома,
которые затем направляются на вход алгоритма mtSet

Слайд 11

Тестирование

Описание дата-сета*

Была взята группа из следующих
Фенотипических признаков:

0W
2W
4W

Различные фенотипические признаки,
связанные

Тестирование Описание дата-сета* Была взята группа из следующих Фенотипических признаков: 0W 2W
с количеством
дней до цветения

*Atwell, S., Huang, Y., Vilhjálmsson, B. et al. Genome-wide association study of 107 phenotypes in Arabidopsis thaliana inbred lines. // Nature 465, 627–631 (2010). https://doi.org/10.1038/nature08800

Слайд 12

Результаты тестирования

mtSet

Разработанный алгоритм

Результаты тестирования mtSet Разработанный алгоритм

Слайд 13

Дальнейшие шаги

Скорректировать кластеризацию координат аллелей для получения более точных отрезков генома для

Дальнейшие шаги Скорректировать кластеризацию координат аллелей для получения более точных отрезков генома
их дальнейшей подачи в mtSet
Выполнить сравнение полученных участков с результатами, опубликованными в Nature
Произвести анализ полученных участков генома на наличие в них каких-то генов

Слайд 14

Список литературы

Casale, F., Rakitsch, B., Lippert, C. et al. Efficient set tests

Список литературы Casale, F., Rakitsch, B., Lippert, C. et al. Efficient set
for the genetic analysis of correlated traits. // Nat Methods 12, 755–758 (2015). https://doi.org/10.1038/nmeth.3439
Уткин Л.В., Жук Ю.А. Полногеномный поиск ассоциаций с использованием матриц парных сравнений // Труды СПИИРАН. 2016. Вып. 47. C. 225-240.
Atwell, S., Huang, Y., Vilhjálmsson, B. et al. Genome-wide association study of 107 phenotypes in Arabidopsis thaliana inbred lines. // Nature 465, 627–631 (2010). https://doi.org/10.1038/nature08800