Отчет о прохождении учебной практики, научно-исследовательской работы

Содержание

Слайд 2

Ознакомление с основными направлениями исследований Отдела системной биологии ИЦиГ СО РАН, включая

Ознакомление с основными направлениями исследований Отдела системной биологии ИЦиГ СО РАН, включая
анализ сетей белок- белковых взаимодействий, анализ динамических биологических сетей, анализ суточной динамики биологических процессов, изучение объекта исследования (сети белок белковых взаимодействий).
Составление аналитического обзора по информационным источникам и базам данных по белок-белковым взаимодействиям и экспрессионным данным, форматам представления данных и методам доступа к ним, методам анализа такого типа данных и программному обеспечению.
Выбор и обоснование методик и средств решения поставленной задачи. Освоение программного обеспечения и библиотек для доступа к биоинформационным данным по белок белковым взаимодействиям, экспрессионным данным, а также методов и программного обеспечения по анализу такого типа данных .

Цели

Слайд 3

Выполнить аналитический перевод:
Bajpai AK, Davuluri S, Tiwary K, Narayanan S, Oguru S,

Выполнить аналитический перевод: Bajpai AK, Davuluri S, Tiwary K, Narayanan S, Oguru
Basavaraju K, Dayalan D, Thirumurugan K, Acharya KK. Systematic comparison of the protein-protein interaction databases from a user's perspective. J Biomed Inform. 2020 Mar;103:103380. doi: 10.1016/j.jbi.2020.103380. Epub 2020 Jan 28. PMID: 32001390.
Zahiri J, Emamjomeh A, Bagheri S, Ivazeh A, Mahdevar G, Sepasi Tehrani H, Mirzaie M, Fakheri BA, Mohammad-Noori M. Protein complex prediction: A survey. Genomics. 2020 Jan;112(1):174-183. doi: 10.1016/j.ygeno.2019.01.011. Epub 2019 Jan 17. PMID: 30660789.
Скачать данные по мышам из баз данных STRING, IntAct, mentha, APID, MINT, IID.
Скачать базу CORUM по белковым комплексам.
Скачать в базе IntAct базу по белковым комплексам.
Установить Cytoscape, изучить основные функции.
Установить и научиться применять плагины для Cytoscape по прогнозированию белковых комплексов.

Задачи

Слайд 4

Были исключены из обзора базы данных состоящие из данных полученных программно, с

Были исключены из обзора базы данных состоящие из данных полученных программно, с
использованием систем интеллектуального анализа текста, не содержащие информацию о белок-белковых взаимодействиях у человека, имеющие высокую специфичность применения.

Отбор баз данных

Слайд 5

Базы данных отобранные для детального сравнения

Базы данных отобранные для детального сравнения

Слайд 6

Сравнение оставшихся баз данных производилось по наличию дополнительных функций запросов, охвату “золотого

Сравнение оставшихся баз данных производилось по наличию дополнительных функций запросов, охвату “золотого
стандарта”, количеству взаимодействий и белков содержащихся в базе данных, количеству эксклюзивных взаимодействий и белков для каждой базы данных.

Методы сравнения

Слайд 7

Cytoscape - биоинформатическая платформа с открытым исходным кодом, предназначенная для визуализации сетей молекулярных взаимодействий и

Cytoscape - биоинформатическая платформа с открытым исходным кодом, предназначенная для визуализации сетей
биологических путей с возможностью использования дополнительных данных, таких как функциональная аннотация, информация об уровне экспрессии генов и прочих. Несмотря на то, что исходно Cytoscape был разработан для биологических исследований, сейчас он широко используется для решения различных задач по анализу сетей и их визуализации.

Визуализация и обработка данных

Для визуализации и обработки данных
была выбрана программа Cytoscape.

Слайд 8

Некоторые подмножества взаимодействующих белков в сетях белок-белковых взаимодействий образуют комплексы. Белковые комплексы

Некоторые подмножества взаимодействующих белков в сетях белок-белковых взаимодействий образуют комплексы. Белковые комплексы
являются одной из важнейших функциональных единиц для протекания биологических процессов в клетке. Эти белковые комплексы принимают участие в различных биологических процессах в том числе: регуляции клеточного цикла, дифференцировке, сворачивание белков, трансляции, транскрипции, посттрансляционной модификации, экспрессии генов, ингибирование ферментов и антитело-антигенных взаимодействиях. Существует ряд вычислительных методов для предсказания белковых комплексов по данным о бинарных взаимодействиях белков. Вычислительные методы прогнозирования белковых комплексов можно разделить на три основные категории: сетевые, биологически-контекстно-зависимые и специализированные.

Белковые комплексы

Слайд 9

Для поиска белковых комплексов из вышеперечисленных баз данных были отобраны содержащие информацию

Для поиска белковых комплексов из вышеперечисленных баз данных были отобраны содержащие информацию
о белок белковых взаимодействиях у мышей(STRING, IntAct, mentha, APID, MINT, IID).

Отбор баз данных для поиска белковых комплексов

Слайд 10

ClusterONE
Выбор белка с самой высокой степенью в качестве начальной позиции
Отбор группы белков

ClusterONE Выбор белка с самой высокой степенью в качестве начальной позиции Отбор
с самой высокой “сплоченностью” содердащей выбронный белок
Выбирает следующий белок, рассматривая все белки, которые не были отнесены к найденным досих пор белковым комплексам. 
MCODE
Взвешивание узлов
Прогнозирование комплексов
Добавление/ удаление белков в/из обнаруженных комплексов в соответствии с критерием связности.

Плагины и реализованные в них алгоритмы для предсказания белковых комплексов

Слайд 11

CytoClaster
HC-PIN
Все вершины в сети PPI рассматриваются как одноэлементные кластеры
Вычисляет значение кластеризации каждого

CytoClaster HC-PIN Все вершины в сети PPI рассматриваются как одноэлементные кластеры Вычисляет
ребра и помещает все ребра в очередь в порядке невозрастания в соответствии с их значениями кластеризации. Чем выше значение кластеризации ребра, тем больше вероятность, что две его вершины будут в одном модуле.
Постепенно добавляя ребра из очереди к кластерам, алгоритм собирает все одноэлементные кластеры в λ –модули.
λ -модули могут быть выведены, когда количество его белков не меньше порогового значения s.

Плагины и реализованные в них алгоритмы для предсказания белковых комплексов

Слайд 12

OH-PIN
Вначале множество кластеров C_set пусто.
Для каждого ребра в сети взаимодействия белков создается

OH-PIN Вначале множество кластеров C_set пусто. Для каждого ребра в сети взаимодействия
его B_Cluster, и B_Cluster добавляется в C_set, если B_Cluster еще не включен в C_set, до тех пор, пока не будет включен каждый B_Cluster.
Затем OH-PIN объединяет все сильно перекрывающиеся пары кластеров в C_set исходя из заданного порогового значения перекрытия.
Собирает все кластеры в C_set в λ-модули, постепенно объединяя пары кластеров с максимальным коэффициентом кластеризации.
IPCA
Вычисляет вес каждого ребра, подсчитывая общих соседей двух связанных узлов, и вычисляет вес каждого узла, суммируя веса его инцидентных ребер.
Вершина с наибольшим весом будет рассматриваться как начальный кластер
Расширяет кластер, рекурсивно добавляя вершины из его соседей с точки зрения приоритета узлов. Возможность добавления узла в кластер определяется двумя условиями: вероятностью его взаимодействия и кратчайшим путем между ним и узлами в кластере.

Плагины и реализованные в них алгоритмы для предсказания белковых комплексов

Слайд 13

Cytoscape позволяет интегрировать в платформу собственные плагины. Был изучен ее API, разобран

Cytoscape позволяет интегрировать в платформу собственные плагины. Был изучен ее API, разобран
исходный код плагинов ClusterONE, MCODE. Получены навыки разработки плагинов для Cytoscape.

Разработка плагинов

Имя файла: Отчет-о-прохождении-учебной-практики,-научно-исследовательской-работы.pptx
Количество просмотров: 33
Количество скачиваний: 0