Функции белков и генов

Содержание

Слайд 2

План

Что важно знать функции данного белка и где это найти?
Как найти все

План Что важно знать функции данного белка и где это найти? Как
белки с определенной функцией?
Как бороться с синонимами?
База данных GO: структура; использование
Что такое “Protein evidence”?

Слайд 3

Задача I: узнать функцию белка Пример: что за белок Q71SG9_KLEPN

Название (кто?)
Uniprot:
Cytosine-specific methyltransferase
ген

Задача I: узнать функцию белка Пример: что за белок Q71SG9_KLEPN Название (кто?)
kpn2kIM
Откуда?
Klebsiella pneumoniae
плазмида

Слайд 4

Q71SG9_KLEPN

Что делает?
Pubmed:
статей нет
ссылка на Gene DB (NCBI) (часть проекта RefSeq):
type

Q71SG9_KLEPN Что делает? Pubmed: статей нет ссылка на Gene DB (NCBI) (часть
II DNA-methyltransferase
Кто – ближайший изученный гомолог?
BLAST
MTS2_SHISO, Identity 100% по всей длине (!?)
M.SsoII, Shigella sonnei , плазмида

Слайд 7

M.SsoII

Что делает?
Pubmed:
есть статьи; нет обзоров
Uniprot ссылается на разные БД
GO:0003886 (F)
Molecular Function:

M.SsoII Что делает? Pubmed: есть статьи; нет обзоров Uniprot ссылается на разные
Catalysis of the reaction: S-adenosyl-L-methionine + DNA containing cytosine = S-adenosyl-L-homocysteine + DNA containing 5-methylcytosine
Переносит метильную группу с кофактора на цитозин ДНК
приведен список из 20 синонимов

Слайд 8

M.SsoII

Uniprot ссылается на разные БД (продолжение)
GO:0043565: (F)
Name: sequence-specific DNA binding
Molecular

M.SsoII Uniprot ссылается на разные БД (продолжение) GO:0043565: (F) Name: sequence-specific DNA
Function: Interacting selectively and non-covalently with DNA of a specific nucleotide composition, e.g. GC-rich DNA binding, or with a specific sequence motif or type of DNA e.g. promotor binding or rDNA binding.
EC 2.1.1.37
Catalysis of the reaction: S-adenosyl-L-methionine + DNA containing cytosine = S-adenosyl-L-homocysteine + DNA containing 5-methylcytosine
COMMENT * See the REBASE database for a complete list of these enzymes: http://rebase.neb.com/rebase/
приведен список из 20 синонимов

Слайд 9

Мы описали МОЛЕКУЛЯРНУЮ ФУНКЦИЮ белка M.SsoII (и гомолога из K.pn.)

Мы описали МОЛЕКУЛЯРНУЮ ФУНКЦИЮ белка M.SsoII (и гомолога из K.pn.)

Слайд 10

M.SsoII

Каков механизм работы?
кофактор SAM (S-adenosyl-L-methionine)
на какой атом ДНК переносится – углерод в

M.SsoII Каков механизм работы? кофактор SAM (S-adenosyl-L-methionine) на какой атом ДНК переносится
5-м положении цитозина
как фермент, кофактор и субстрат расположены в пространстве? 3D структуры нет; есть модель, построенная по гомологам доменов с известной структурой. Цитозин выворачивается, см. рис.
как устроен активный центр? – известны консервативные мотивы и остатки
как происходит узнавание последовательности ДНК? – известна узнаваемая последовательность – CCNGG - и домен, отвечающий за узнавание (TRD)
…. Методы:
Пришивка (cross-linking)
Мутагенез
…..
моделирование структуры
консервативность последовательностей ….
….. множество всего

Модель метилазного домена M.SsoII

Метилируемый цитозин

SAM

Слайд 11

Описали МЕХАНИЗМ действия M.SsoII

Описали МЕХАНИЗМ действия M.SsoII

Слайд 12

M.SsoII: зачем нужно метилировать ДНК?

Зачем?
GO:0009307: (P)
Name: DNA restriction-modification system
Biological Process: Any process

M.SsoII: зачем нужно метилировать ДНК? Зачем? GO:0009307: (P) Name: DNA restriction-modification system
that protect an organism from invading foreign DNA by methylation of self DNA at specific sequences and nucleolytic cleavage of unmethylated foreign DNA.
Система рестрикции-модификации: любой процесс, защищающий организм от вторжения чужеродной ДНК посредством метилирования специфических последовательностей и гидролиза неметилированной чужеродной ДНК Чужеродная ДНК – ДНК бактериофагов, плазмид и др.
Какие гены включает система РМ?
Rebase:
M.SsoII:
M.SsoII – ДНК метилтрансфераза
SsoII – эндонуклеаза рестрикции SsoII - вносит двухцепочечный разрыв ДНК в неметилированных сайтах CCNGG M.SsoII метилирует цитозин только в сайтах той же последовательности CCNGG; метилируя хозяйскую ДНК M.SsoII предотвращает фрагментацию собственного генома

Слайд 13

Мы описали БИОЛОГИЧЕСКИЙ ПРОЦЕСС и систему генов его осуществляющих

Мы описали БИОЛОГИЧЕСКИЙ ПРОЦЕСС и систему генов его осуществляющих

Слайд 14

M.Kpn2kI и M.SsoII

В каком организме?
Klebsiella pneumoniae
плазмида
Shigella sonnei, бактерия из семейства Enterobacteriaceae; патоген
плазмида
Сходство

M.Kpn2kI и M.SsoII В каком организме? Klebsiella pneumoniae плазмида Shigella sonnei, бактерия
100%; как объяснить?

Слайд 15

M.SsoII

Какие еще функции известны?
Pfam:
два домена
GO:0045449: (P)
regulation of transcription; IEA:UniProtKB-KW.
регулятор

M.SsoII Какие еще функции известны? Pfam: два домена GO:0045449: (P) regulation of
транскрипции:
связывается с сайтами NNNNNN;
такие сайты расположены между генами M.SsoII и SsoII
репрессор гена M.SsoII и активатор SsoII
для чего?
для “размножения” плазмиды: проникновения в нового хозяина
механизм регуляции?
имеет N-концевой HTH домен, гомологичный известным доменам транскрипционных факторов
димеризуется при связывании с ДНК – еще одна функция: способность димеризации

Слайд 16

M.SsoII

Где локализуется?
в цитоплазме хозяйской бактериальной клетки
а точнее? …..
Когда экспрессируется?
небольшая поддерживается

M.SsoII Где локализуется? в цитоплазме хозяйской бактериальной клетки а точнее? ….. Когда
постоянно; авторегуляция
при проникновении в нового хозяина увеличивается

ЛОКАЛИЗАЦИЯ и
ЭКСПРЕССИЯ

Слайд 17

Итог: M.SsoII (и M.Kpn2kI)

Функции:
метилирование цитозина в сайтах CCNGG
связывание с ДНК в

Итог: M.SsoII (и M.Kpn2kI) Функции: метилирование цитозина в сайтах CCNGG связывание с
сайтах определенной последовательности
гомодимеризация при связывании с ДНК
Механизм:
узнавание последовательности – TRD домен
кофактор SAM
мотивы I - X
выворачивание основания
ход реакции
Биологический процесс:
защита от чужеродной ДНК
регуляция транскрипции системы РМ SsoII
Система рестрикции-модификации II типа; состоит из двух генов на трансмиссивной плазмиде
Локализация:
цитоплазма хозяйской клетки
Экспрессия
негативная авторегуляция

Слайд 18

Базы данных

Uniprot
Pubmed
GO – gene onthology
EC - enzyme classification
Pfam, Interpro, а также Prosite,

Базы данных Uniprot Pubmed GO – gene onthology EC - enzyme classification
Panther, Prints, TIGERFam, SMART, Supfam – семейства белков/доменов
Brenda - The Comprehensive Enzyme Information System
Rebase – специализированная БД

Слайд 19

Где искать описание функции

Краткое описание функций одного белка и ссылки на другие

Где искать описание функции Краткое описание функций одного белка и ссылки на
ресурсы см.
Краткое описание функций семейств белков и доменов
см. в и
Подробное описание функций генов и их продуктов см в энциклопедиях, таких как или
Подробное описание отдельных классов функций и соответствующих белков см. в специализированных БД, таких как ENZYME,Rebase , ...

Слайд 20

Как нам узнать функцию интересующего нас и б.м. известного науке белка или

Как нам узнать функцию интересующего нас и б.м. известного науке белка или
гена?

+/+++ Читайте оригинальные статьи хороших авторов в хороших журналах! Ищите в PubMed
-/++ Читайте аннотации записи Uniprot Используйте SRS
-/+ Читайте аннотации записей Pfam и InterPro, содержащие описания семейств доменов, к которым принадлежат домены белка
-/+ Ищите ваш белок в специализированных БД (БД и энциклопедии, в которых подробно описаны функции генов и их продуктов : KEGG, BIOCYC, ENZYME, TC-DB, REACTOME….)
Ищите, предположительно, гомологичные белки самостоятельно. Используйте BLAST, psiBLAST, профили и паттерны

Слайд 21

Задача II: найти белки с той же функцией

Та же молекулярная функция?
в аннотации

Задача II: найти белки с той же функцией Та же молекулярная функция?
записи Uniprot
нужные термины GO, помеченные F (molecular function)
нужные коды EC
Тот же механизм?
….. функция + гомология
Тот же биологический процесс?
нужные термины GO, помеченные P (biological process)
Та же система генов?
БД систем: KEGG, SEED, …
Та же локализация?
нужные термины GO, помеченные С (cellular component)

Слайд 22

Что бывает

Верно ли, что у белки всегда есть “главная” функция?
нет; цитохром

Что бывает Верно ли, что у белки всегда есть “главная” функция? нет;
с: окислительное фосфорилирование
индукция апоптоза
Верно ли, что гомологичные белки имеют ту же основную функцию?
часто, но не всегда!
Верно ли, что белки с той же функцией гомологичны?
часто, но не всегда! (карбоангидраза)
Верно ли, что белки с одинаковой функцией участвуют в тех же биологических процессах?
не обязательно! (ДНК-метилтрансферазы)
Верно ли, что один и тот же биологический процесс реализуется сходными системами генов?
не обязательно! (лекарственная устойчивость)

Слайд 23

Figure 1. Specific example of
convergent and divergent evolution.
Top, an example of convergent
evolution,

Figure 1. Specific example of convergent and divergent evolution. Top, an example
showing structures
of two carbonic anhydrases with
the same enzymatic function (EC
number 4.2.1.1), but with different
folds. The Figure was drawn with
Molscript (Kraulis, 1991) from 1THJ
(left-handed beta helix) and 1DMX
(¯at beta sheet).

Hedi Hegyi and Mark Gerstein
J. Mol. Biol. (1999) 288, 147±164

Слайд 24

Пробуем выделить классы белков по функции

Молекулярные машины – рибосома [&&&]
Ферменты - РНК-зависимая

Пробуем выделить классы белков по функции Молекулярные машины – рибосома [&&&] Ферменты
РНК полимераза [рабочие на производстве]
Регуляторные белки – регулируют биологические процессы, например, активность ферментов – TetR [бюрократия]
Хранение и транспорт (ионов, маленьких молекул) – гемоглобин [складские рабочие]
Транспорт через мембраны – TetA [таможенники]
Секреторные, взаимодействие с другими клетками – инсулин [командировочные?]
Структурные [атланты ☺]
Сигнальные [ ]
Рецепторы []
Мотор []

Слайд 25

Проблема неоднозначности терминологии

Проблема неоднозначности терминологии

Слайд 26

Питер Брейгель старший
"Вавилонская башня" 1563 Музей истории искусств, Вена

Питер Брейгель старший "Вавилонская башня" 1563 Музей истории искусств, Вена

Слайд 27

Проект GO (Gene Ontology )

Цель: Создание унифицированной терминологии для аннотации генов
БД

Проект GO (Gene Ontology ) Цель: Создание унифицированной терминологии для аннотации генов
GO Включает три независимых словаря
Молекулярные функциии (molecular Function) (Как? С чем?) Например, carbohydrate binding или ATPase activity
Биологические процессы (biological Process) (Зачем?) Например, митоз или биосинтез пуринов
Клеточные компоненты (cellular Component) (Где?) Например, ядро или холофермент РНК-полимераза II
В консорциум GO входит EBI (БД Uniprot, Interpro) и много других организаций
GOA – проект описания записей Uniprot терминами GO
94% записей Swissprot и 65% Trembl имеют хотя бы один термин GO

Слайд 28

Запись GO называется “термин GO”

Термины имеют определение и перечень синонимов.
Термины в пределах

Запись GO называется “термин GO” Термины имеют определение и перечень синонимов. Термины
одной онтологии (словаря) связаны отношениями ”is_a", “is_part_of”
Термины имеют стандартные идентификаторы: GO:0000093 (пример)

Слайд 29

tricarboxylic acid cycle
Accession: GO:0006099
Ontology: biological_process
Synonyms:
exact: citric acid cycle
exact:

tricarboxylic acid cycle Accession: GO:0006099 Ontology: biological_process Synonyms: exact: citric acid cycle
Krebs cycle
exact: TCA cycle
Definition: A nearly universal metabolic pathway in which the acetyl group of acetyl coenzyme A is effectively oxidized to two C02 and four pairs of electrons are transferred to coenzymes. The acetyl group combines with oxaloacetate to form citrate, which undergoes successive transformations to isocitrate, 2-oxoglutarate, succinyl-CoA, succinate, fumarate, malate, and oxaloacetate again, thus completing the cycle. In eukaryotes the tricarboxylic acid is confined to the mitochondria. See also glyoxylate cycle.

Слайд 30

Directed acyclic graph DAG —ориентированный ациклический граф

отношение "is_part_of":
"A is part of

Directed acyclic graph DAG —ориентированный ациклический граф отношение "is_part_of": "A is part
B" означает, что А — часть В, но
В не обязательно содержит А.

отношение "_is_a":
"A is B" означает, что
А — частный случай В;

Слайд 31

The Gene Ontology database

Apoptotic protease activator

The Gene Ontology database Apoptotic protease activator

Слайд 32

Аннотация GO записей Uniprot

Два принципа:
каждая аннотация должна ссылаться на источник:
литературная ссылка
другая база

Аннотация GO записей Uniprot Два принципа: каждая аннотация должна ссылаться на источник:
данных
компьютерное предсказание
…….
аннотация должна указывать на достоверность применимости термина GO к данному белку в источнике (kind of evidence)

Слайд 33

Аннотация GO для MTS2_SHISO (UniProt)

Аннотация GO для MTS2_SHISO (UniProt)

Слайд 34

Evidence Codes

IDA Inferred from Direct Assay
TAS Traceable Author Statement
IMP Inferred from

Evidence Codes IDA Inferred from Direct Assay TAS Traceable Author Statement IMP
Mutant Phenotype
IGI Inferred from Genetic Interaction
IPI Inferred from Physical Interaction
RCA Inferred from Reviewed Computational Analysis
ISS Inferred from Sequence Similarity
IEP Inferred from Expression Pattern
NAS Non-traceable Author Statement
IEA Inferred from Electronic Annotation
IC Inferred by Curator
ND No biological Data available

Слайд 35

Предостережение:

GO не является номенклатурой генов или их продуктов (белков). Словари описывают биологические

Предостережение: GO не является номенклатурой генов или их продуктов (белков). Словари описывают
феномены (например, программируемую клеточную смерть), а не конкретные биологические объекты

Слайд 36

Есть и другие онтологии, например,

exon,
promoter, binding_site, non_canonical_splice_site,
stop_codon. pseudogene

Есть и другие онтологии, например, exon, promoter, binding_site, non_canonical_splice_site, stop_codon. pseudogene

Слайд 37

Резюме

Функциональная аннотация геномов — задача биоинформатики
Существуют энциклопедии, где можно узнать о функциях

Резюме Функциональная аннотация геномов — задача биоинформатики Существуют энциклопедии, где можно узнать
генов и их продуктов, например, BioCyc.
Полное описание функции — это ответы на вопросы "где?", "зачем?", "как?“, "с чем?“.
GO — перспективный подход к
разработке общего языка (решение проблема синонимов),
разработке формализованного описания функций, общего для всех организмов.