Оценка качества прочтений NGS

Март 2, 2021

Главная
Биология
Оценка качества прочтений NGS

Содержание

2. Примеры экспериментов в основе которых лежит NGS Этап обработки данных Формат данных Ресеквенирование человеческих генов RNA
3. Сырые данные на выходе у секвенатора Этап обработки данных Формат данных Ресеквенирование человеческих генов RNA -
4. Контроль качества обязательный этап Этап обработки данных Формат данных Ресеквенирование человеческих генов RNA - seq Формат
5. А на кой черт оно собственно надо?
6. А на кой черт оно собственно надо? Сырые данные, полученные в ходе работы секвенатора. Их вы
7. А на кой черт оно собственно надо? Сырые данные, полученные в ходе работы секвенатора. Их вы
8. А на кой черт оно собственно надо? Сырые данные, полученные в ходе работы секвенатора. Их вы
9. А на кой черт оно собственно надо? Сырые данные, полученные в ходе работы секвенатора. Их вы
10. А на кой черт оно собственно надо? Сырые данные, полученные в ходе работы секвенатора. Их вы
11. FASTQ формат @cluster_2:UMI_ATTCCG TTTCCGGGGCACATAATCTTCAGCCGGGCGC + 9C;=;= 9:67AA 65 591
12. FASTQ формат @cluster_2:UMI_ATTCCG TTTCCGGGGCACATAATCTTCAGCCGGGCGC + 9C;=;= 9:67AA 65 591 Идентификатор последовательности с необязательным описанием. Начинается с
13. FASTQ формат @cluster_2:UMI_ATTCCG TTTCCGGGGCACATAATCTTCAGCCGGGCGC + 9C;=;= 9:67AA 65 591 Идентификатор последовательности с необязательным описанием. Начинается с
14. FASTQ формат @cluster_2:UMI_ATTCCG TTTCCGGGGCACATAATCTTCAGCCGGGCGC + 9C;=;= 9:67AA 65 591 Идентификатор последовательности с необязательным описанием. Начинается с
15. FASTQ формат @cluster_2:UMI_ATTCCG TTTCCGGGGCACATAATCTTCAGCCGGGCGC + 9C;=;= 9:67AA 65 591 Идентификатор последовательности с необязательным описанием. Начинается с
16. FASTQ формат @cluster_2:UMI_ATTCCG TTTCCGGGGCACATAATCTTCAGCCGGGCGC + 9C;=;= 9:67AA 65 591 Идентификатор последовательности с необязательным описанием. Начинается с
17. Q score кодируется символами ASKII
18. FastQC FastQC – инструмент, позволяющий проводить контроль качества сырых ридов. В настоящее время по сути стал
19. Quality score по основаниям в ридах Красная линия – медианное значе ние Qscore в данной позиции
20. Ухудшение качества прочтения к концу ридов
21. Quality score целых последовательностей Этот график позволяет увидеть часть ваших последовательностей, имеющих более низкое среднее качество,
22. Содержание нуклеотидов по позициям в ридах График показывает пропорцию по нуклеотидам в конкретной позиции ридов. В
23. Содержание нуклеотидов по позициям в ридах График показывает пропорцию по нуклеотидам в конкретной позиции ридов. В
24. Содержание GC по позициям в ридах В случаной библиотеке вы ожидает увидеть незначительную разницу по содержанию
25. Содержание GC в целых последовательностях Вы ожидаете увидеть похожее на нормальное распределение с одним пиком. Наличие
26. Содержание N по позиции в ридах Наличие небольшого количество N (неопределенных нуклеотидов) в ридах, полученных секвенатором
27. Распределение длин прочтений
28. Распределение длин прочтений
29. Дуплицированные последовательности В полностью рандомизированной библиотеке большинство сиквенсов встречаются в ридах только 1 раз. Небольшой количество
30. Сверхпредставленные последовательности Обычно библиотека для NGS содержит разнообразный набор последовательностей, без единственной последовательности, составляющая существенную часть
31. Сверхпредставленные последовательности
32. Содержание адаптеров
34. Скачать презентацию

Примеры экспериментов в основе которых лежит NGS
Этап обработки данных
Формат данных
Ресеквенирование человеческих

генов

RNA - seq

Формат данных

Этап обработки данных

Сырые риды (FASTQ)

Выравненные риды (SAM/BAM)

Сырой набор вариантов (VCF)

Аннотированные варианты (VCF)

Выравнивание

Определение вариантов

аннотация

Интерпретация отличий от референса / диагноз

Сырые риды (FASTQ)

Выравненные риды (SAM/BAM)

Уровни экспрессии FPKM (TCV)

Список дифф. экспрес. генов

Выравнивание

Подсчет количества ридов, выравненных в конкретное место

Анализ диф. экспресии

Интерпретация DEG / изменение в сигнальных и метаболических путях

Сырые данные на выходе у секвенатора
Этап обработки данных
Формат данных
Ресеквенирование человеческих генов
RNA -

seq

Формат данных

Этап обработки данных

Сырые риды (FASTQ)

Сырой набор вариантов (VCF)

Аннотированные варианты (VCF)

Выравнивание

Определение вариантов

аннотация

Интерпретация отличий от референса / диагноз

Сырые риды (FASTQ)

Выравненные риды (SAM/BAM)

Уровни экспрессии FPKM (TCV)

Список дифф. экспрес. генов

Выравнивание

Подсчет количества ридов, выравненных в конкретное место

Анализ диф. экспресии

Интерпретация DEG / изменение в сигнальных и метаболических путях

Выравненные риды (SAM/BAM)

Контроль качества обязательный этап
Этап обработки данных
Формат данных
Ресеквенирование человеческих генов
RNA - seq
Формат данных
Этап

обработки данных

Сырые риды (FASTQ)

Сырой набор вариантов (VCF)

Аннотированные варианты (VCF)

Выравнивание

Определение вариантов

аннотация

Интерпретация отличий от референса / диагноз

Сырые риды (FASTQ)

Выравненные риды (SAM/BAM)

Уровни экспрессии FPKM (TCV)

Список дифф. экспрес. генов

Выравнивание

Подсчет количества ридов, выравненных в конкретное место

Анализ диф. экспресии

Интерпретация DEG / изменение в сигнальных и метаболических путях

Выравненные риды (SAM/BAM)

Контроль качества