Биоинформатика, или молекулярная биология in silico

Содержание

Слайд 2

Расшифрован геном!

Расшифрован геном!

Слайд 3

Перехватить зашифрованное сообщение – еще не значит его понять

Геном бактерии: несколько миллионов

Перехватить зашифрованное сообщение – еще не значит его понять Геном бактерии: несколько
нуклеотидов
От 600 до 9 тысяч генов (примерно 90% генома кодирует белки)
На этом слайде – 0,1% генома Escherichia coli

Слайд 4

Экспоненциальный рост объема данных

красный – статьи (PubMed)
синий – последовательности (GenBank)
зеленый – объем

Экспоненциальный рост объема данных красный – статьи (PubMed) синий – последовательности (GenBank)
в нуклеотидах (GenBank)

из 18 миллионов ссылок, ~675 тыс. отвечают на “bioinformat* OR comput*”
16 тыс. “bioinformat*” 65 тыс. “bioinformat* OR computat*”

Слайд 5

Цель (локальная): аннотировать гены / белки in silico

Что?
(биохимическая) функция
клеточная роль
Когда?
Регуляция
Экспрессия
Время жизни (мРНК,

Цель (локальная): аннотировать гены / белки in silico Что? (биохимическая) функция клеточная
белка)
Где?
Локализация
Внутри/снаружи
Органеллы и компартменты
Как?
Механизм
Специфичность, регуляция
Наиболее важные предсказания затем проверяются экспериментально

Слайд 6

622 полных генома (прокариот)

622 полных генома (прокариот)

Слайд 7

Цель (глобальная)

Предсказать свойства организма путем (компьютерного) анализа его генома
(возможно, с использованием дополнительной

Цель (глобальная) Предсказать свойства организма путем (компьютерного) анализа его генома (возможно, с
информации: эпигенетика, белок-белковые взаимодействия и т.п.)
сейчас: метаболическая реконструкция, транспортные системы, ответ на стресс и т.д.
“Понять” эволюцию геномов/организмов

Слайд 8

Сравнительная геномика

Базовые постулаты:
Сходство => гомология (общность происхождения)
Гомология => сходная функция
Консервативно то, что

Сравнительная геномика Базовые постулаты: Сходство => гомология (общность происхождения) Гомология => сходная
важно
структурные и функциональные мотивы в белках
регуляторные сайты в ДНК

Слайд 9

Математические и алгоритмические проблемы

Формализация понятия сходства
теория вероятностей: значимость наблюдаемого уровня сходства
вычислительная геометрия:

Математические и алгоритмические проблемы Формализация понятия сходства теория вероятностей: значимость наблюдаемого уровня
сходство структур
Алгоритмические проблемы:
быстрый поиск сходных последовательностей
большой объем базы данных (растет быстрее, чем быстродействие процессоров)
множественное выравнивание
оптимальный алгоритм имеет полиномиальное время работы, но степень равна числу последовательностей
построение эволюционных деревьев
баланс между биологическими соображениями и вычислительными возможностями
Идентификация функциональных и регуляторных мотивов в последовательностях
теория предсказания образов: нейронные сети, поддерживающие вектора и т.п.

Слайд 10

Первый российский бактериальный геном - Acholeplasma laidlawii Секвенирование: ИФХМ МЗ РФ, аннотация:

Первый российский бактериальный геном - Acholeplasma laidlawii Секвенирование: ИФХМ МЗ РФ, аннотация:
ИППИ РАН

~1,5 Mb; ~1400 генов. Установлены функции ~80% генов; проведена метаболическая реконструкция

Слайд 11

Сравнение с родственными геномами

Сравнение с родственными геномами

Слайд 12

Сравнительная геномика - 2

Не обязательно последовательности:
структура белка и РНК
расположение генов на хромосоме

Сравнительная геномика - 2 Не обязательно последовательности: структура белка и РНК расположение
(ко-локализация)
ко-регуляция и ко-экспрессия генов
филогенетические образцы (совместное появление в геномах)
Предсказав структурные особенности белка, можно определить его функциональный класс
Изучение геномного контекста позволяет отнести ген (белок) к функциональной подсистеме
Задача: формализация этих подходов
Полногеномные сравнения
Статистическая значимость
Распознавание образов и экспертные системы

Слайд 13

РНК-переключатели: от биоинформатического анализа к экспериментальной проверке

Новый универсальный механизм регуляции экспрессии генов

РНК-переключатели: от биоинформатического анализа к экспериментальной проверке Новый универсальный механизм регуляции экспрессии
за счет формирования альтернативных структур РНК и прямого связывания малых молекул
Структуры и механизм предсказаны биоинформатически и затем подтверждены экспериментально

Слайд 14

Регуляция экспрессии генов за счет формирования альтернативных структур РНК

Transcription attenuation

Translation

Регуляция экспрессии генов за счет формирования альтернативных структур РНК Transcription attenuation Translation
attenuation

Структура предсказана на основе сравнитель-ного анализа выравненных последова-тельностей
Механизм предсказан на основе литературных данных и анализа структурных особенностей

Слайд 15

5’-нетранслируемые области бактериальных генов биосинтеза рибофлавина

5’-нетранслируемые области бактериальных генов биосинтеза рибофлавина

Слайд 16

Аттенюация транскрипции

Terminator

The RFN element

Antiterminator

Antiterminator

Аттенюация транскрипции Terminator The RFN element Antiterminator Antiterminator

Слайд 17

Другие РНК-переключатели, найденные методами сравнительной геномики

Есть во всех трех основных царствах

Другие РНК-переключатели, найденные методами сравнительной геномики Есть во всех трех основных царствах
(бактерии, археи, эукариоты)
Древнейшие регуляторные элементы: реликт «РНКового мира»?

Слайд 18

Регуляторы гомеостаза цинка

nZUR-γ

nZUR-α

AdcR

pZUR

TTAACYRGTTAA

GATATGTTATAACATATC

GAAATGTTATANTATAACATTTC

GTAATGTAATAACATTAC

TAAATCGTAATNATTACGATTTA

Регуляторы гомеостаза цинка nZUR-γ nZUR-α AdcR pZUR TTAACYRGTTAA GATATGTTATAACATATC GAAATGTTATANTATAACATTTC GTAATGTAATAACATTAC TAAATCGTAATNATTACGATTTA

Слайд 19

Регуляция гомологов рибосомальных белков

nZUR

pZUR

AdcR

Регуляция гомологов рибосомальных белков nZUR pZUR AdcR

Слайд 20

Плохой сценарий

достаточно цинка

недостаточно цинка: весь цинк использован рибосомами, не хватает цинка для

Плохой сценарий достаточно цинка недостаточно цинка: весь цинк использован рибосомами, не хватает цинка для ферментов
ферментов

Слайд 21

Регуляторный механизм

рибосомы

Zn-зависимые ферменты

R

Достаточно Zn

Голодание по Zn

R

репрессор

Регуляторный механизм рибосомы Zn-зависимые ферменты R Достаточно Zn Голодание по Zn R репрессор

Слайд 22

Предсказание … (Proc Natl Acad Sci U S A. 2003 Aug 19;100(17):9912-7.)

Предсказание … (Proc Natl Acad Sci U S A. 2003 Aug 19;100(17):9912-7.)
и подтверждение (Mol Microbiol. 2004 Apr;52(1):273-83.)

(+ еще пять статей в последующие годы): другие гены, другие бактерии

Слайд 23

Сводка подтвердившихся предсказаний

Регуляторы
РНК-переключатели
витамины: рибофлавин, тиамин, кобаламин
аминокислоты: лизин, метионин
Факторы транскрипции
NrdR: рибонуклеотид-редуктазы
MtaR, CmbR: метионин

Сводка подтвердившихся предсказаний Регуляторы РНК-переключатели витамины: рибофлавин, тиамин, кобаламин аминокислоты: лизин, метионин
и цистеин
NiaR, NrtR: метаболизм NAD
NsrR, NnrA: нитрозативный стресс
Регуляторные взаимодействия
регуляторные мотивы в ДНК (>10)
отдельные сайты связывания (>20)

Ферменты
ThiN и TenA (биосинтез тиамина)
CobX, CobZ (биосинтез кобаламина)
FadE (синтез жирных кислот)
AbnA, Xca (катаболизм арабинозы)
NagK, NagBII (катаболизм N-ацетилглюкозамина)
Транспортеры
витамины и кофакторы
YpaA и RibM: рибофлавин
BioMNY: биотин
ThiXYZ: тиамин
NiaP: ниацин
Vng1369-71: корриноиды
сахара и полисахариды
OgtABCD: продукты деградации пектина
NagP: N-ацетилглюкозамин
аминокислоты
MetD: метионин
SteT: треонин
ионы металлов
CbiMNQO, HoxN: кобальт
NikMNQO: никель
нуклеотиды:
YicE: ксантин

Слайд 24

Не только тексты

Другие типы массовых экспериментов:
Транскриптомика
«выстилающие массивы»: полная карта транскриптов
уровень экспрессии и

Не только тексты Другие типы массовых экспериментов: Транскриптомика «выстилающие массивы»: полная карта
время жизни мРНК
ДНК-белковые взаимодействия
Протеомика
концентрации белков
белок-белковые взаимодействия, белковые комплексы
структуры белков
Эпигенетика
метилирование ДНК
положение и модификации нуклеосом
Генетика
летальность мутаций
фенотипы
синтетические летали

Слайд 25

«Неприкладная» биоинформатика

Молекулярная эволюция
филогения генов
таксономия организмов
горизонтальные переносы и т.п.
положительный и отрицательный отбор
что сделало

«Неприкладная» биоинформатика Молекулярная эволюция филогения генов таксономия организмов горизонтальные переносы и т.п.
нас людьми?
лекарственная устойчивость
эволюция геномов
Системная биология
строение геномов
сети взаимодействий
белок-белковые
регуляция транскрипции
сигнальные пути

Слайд 26

Перспективы

Индивидуальные геномы
персональные человеческие геномы
геномы штаммов
Метагеномы
некультивируемые бактерии
метагеномы экологических ниш
бактериальный метагеном человека
Другие виды данных
интеграция
Моделирование

Перспективы Индивидуальные геномы персональные человеческие геномы геномы штаммов Метагеномы некультивируемые бактерии метагеномы
(пока рано)
построение полных карт

Слайд 27

Биоинформатика в России

Сильные устойчивые школы
Москва+Пущино: содружество лабораторий в разных учреждениях
Новосибирск: вертикальная структура
Высокий

Биоинформатика в России Сильные устойчивые школы Москва+Пущино: содружество лабораторий в разных учреждениях
уровень
конкурентоспособный в мире
Интеграция с образованием
Факультет биоинженерии и биоинформатики МГУ
Кафедра информационной биологии ФЕН НГУ
Перспективная область:
относительно дешево
общедоступная информация – можно использовать чужие данные
связь с экспериментальными исследованиями, ведущимися на современном уровне
Как развивать:
технические разработки (базы данных, пакеты программ») – контракты, наличие потребителя
интегрированные компоненты в медицинских и молекулярно-биологических проектах (крупные проекты должны иметь биоинформатическую поддержку)
самостоятельные исследовательские работы – гранты
Имя файла: Биоинформатика,-или-молекулярная-биология-in-silico.pptx
Количество просмотров: 167
Количество скачиваний: 2