Слайд 2Что нужно знать из определений
Мутации соматические и герментативные
Мажорный аллель (часто
(но не 100%) это основной или «дикий» аллель ancestral (wild ) allele)
Минорный аллель
Minor allele frequency (MAF) частота второго по популярности в популяции. Обычно это рисковый аллель.
Рисковый аллель
Snp Однонуклеотидный полиморфизм (Single nucleotide polymorphism, SNP— отличия последовательности ДНК размером в один нуклеотид (A, T, G или C). SNPs возникают в результате точечных мутаций. Например, В гене HTR2A, который отвечает за 5-hydroxytryptamine receptor 2A описано около 700 snp.
Magnitude - Magnitude is a subjective measure of interest varying from 0 to 10.
Слайд 3База данных SNP
Для того, чтобы найти необходимый полиморфизм нужно знать его код
(rs), но почти все базы поддерживают и поиск по заболеваниям.
Базы данных SNP содержит данные о различных названиях полиморфизма, что необходимо для поиска литературы в других базах данных
Варианты дикого типа и минорных аллелей
Данные о секвенировании участка гена, содержащего этот полиморфизм
Карту гена с указанием локализации полиморфизма
Распределение аллелей и генотипов полиморфизма в различных популяциях
Данные об патогенности данного варианта (будь то магнитуда, оценка шансов, p value, Evidence details – в зависимости от базы данных)
Ссылки на исследовани
Ссылки на другие базы данных
Слайд 4Влияние полиморфизмов в зависимости от положения в гене
Слайд 5Дана задача исследования
Выявление факторов генетической предрасположенности к заболеванию
Слайд 6Этапы работы
Выбор полиморфных участков генов (PubMed)
Подсчет размер выборки в зависимости от частоты
встречаемости аллеля
Выбор метода исследования
Подбор праймеров и рестриктаз
Подбор условий
Постановка серии экспериментов
Обработка результатов
Слайд 7сервисы NCBI: GTR, ClinVar, MedGene (http://ncbiinsights.ncbi.nlm.nih.gov/2014/10/02/ncbis..).
Genetic Testing Registry (GTR) содержит информацию о
более чем 19000 генетических тестах по наследственным и соматическим изменениям у человека. Вы можете увидеть связанные публикации и лаборатории, которые проводят тест.
ClinVar – это попытка связать геномные вариации и фенотипы. База данных содержит как связи генотип-феонтип, так и материалы, которые доказывают эту связь.
MedGene – это база данных медицинских синдромов, состояний, заболеваний. База данных интегрирует информацию из OMIM, GeneReivews, PubMed, Genetics Human References, чтобы вывести данные о заболеваниях и связанных исследованиях.
Слайд 8OMIM - https://www.ncbi.nlm.nih.gov/omim «Менделевское наследование у человека» (англ. Mendelian Inheritance in Man, MIM) —
медицинская база данных, в которой собирается информация об известных заболеваниях с генетическим компонентом и генах, ответственных за их развитие. Эта база данных предоставляет библиографию для будущих исследований, инструментарий для геномного анализа зарегистрированного гена и используется в медицинской литературе, чтобы обеспечить единый индекс для генетических заболеваний.
область применения dbSNP https://www.ncbi.nlm.nih.gov/snp/ включает вызывающие заболевание клинические мутации, а также нейтральные полиморфизмы. В дополнение к идентификаторам записей, присваиваемым как отправителем, так и NCBI, записи dbSNP записывают информацию о последовательности вокруг полиморфизма, конкретные условия эксперимента, необходимые для проведения эксперимента, описания популяции, содержащей вариацию, и информацию о частоте в зависимости от популяции или отдельного генотипа. ,
Слайд 14EnsEMBL - http://www.ensembl.org/index.html
Ресурс, содержащий базу данных геномов позвоночных и других эукариот и
различные инструменты для работы с ними. Это совместный проект EMBL - European Bioinformatics Institute (EBI) и Wellcome Trust Sanger Institute (WTSI), целью которого является создание программной среды для автоматической аннотацию эукариотических геномов. Началось все с проекта по секвенированию генома человека, теперь база включает большое число других геномов. Содержит разнообразную информацию и ресурсы по аннотации известных и предсказанию новых генов, визуализации данных, перекрестные ссылки на другие базы, информацию об однонуклеотидных полиморфмзмах (SNP), данные по регуляторным элементам (из ENCODE). Предусмотрен доступ с помощью Perl API. Позволяет проводить сравнение полных геномов. На странице
Слайд 15SNPedia - https://www.snpedia.com/
Переведено с английского языка.-SNPedia - это сайт биоинформатики на основе
вики, который служит базой данных однонуклеотидных полиморфизмов. Каждая статья в SNP содержит краткое описание, ссылки на научные статьи и личные сайты по геномике, а также информацию о микрочипах этого SNP.
GWAS Central -https://www.gwascentral.org/
База данных GWAS Central выдает краткое содержание объединенных данных в одном или нескольких полно-геномных исследованиях. В этой базе данных представлено наиболее полное собрание p-value ассоциаций. GWAS Central использует мощные графические и текстовые методы представления данных для открытия и одновременной визуализации многих однонуклеотидных полиморфизмов. Исследователям также предоставляется возможность просматривать их персональные данные рядом с выбранными. Кроме того, данные находятся в свободном доступе для скачивания их научными сообществами.
COSMIC - это онлайновая база данных соматически приобретенных мутаций, обнаруженных при раке человека. https://cancer.sanger.ac.uk/cosmic
Слайд 17GOLD (Genomes OnLine Database) - http://www.genomesonline.org/
Система, которая содержит информацию об уже секвенированных
геномах и о текущих проектов по секвенированию по всему миру (название штаммов; организаций, осуществляющих проекты по секвенированию, приблизительная длина генома). Данные структурированы по таксономическому признаку - отдельно сведения из других баз данных по вирусам, фагам, вироидам, плазмидам, органеллам. Есть библиографические ссылки на публикации в журналах по полным геномам, а также ежедневные и еженедельные новости геномики.
Слайд 19База данных частот аллелей (большей частью HLA и цитокинов http://www.allelefrequencies.net/default.asp
Слайд 20Базы данных не только человека
Базы данных есть не только для человека,
есть базы данных генов с/х ( в т.ч. племенных) животных, лабораторных животных, с/х культур (пшеницы и т.п.),очень распространены базы данных в микробиологии.
Например изменения генома короновируса во время эпидемии –заметно разделение на субпопуляции и клональные группы
https://nextstrain.org/narratives/ncov/sit-rep/ru/2020-03-27
Слайд 21Объем выборки
Для набора пациентов с целью изучения ассоциации snp с патологией важно
знать частоту встречаемости искомых аллелей. Чем реже - тем больше выборка
Он-лайн калькуляторы:
http://osse.bii.a-star.edu.sg/calculation1.phphttp://osse.bii.a-star.edu.sg/calculation1.php
http://csg.sph.umich.edu/abecasis/cats/gas_power_calculator/
Описано в публикациях
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4180089/
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3592339/
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3480678/