Введение в биоинформатику. Лекция 9

Содержание

Слайд 2

Будущее медицины

Митио Каку
(род. 1947)

Будущее медицины Митио Каку (род. 1947)

Слайд 3

Понятие биоинформатики.
Задачи и методы биоинформатики.
Молекула ДНК.
Основы анализа нуклеиновых последовательностей.

Понятие биоинформатики. Задачи и методы биоинформатики. Молекула ДНК. Основы анализа нуклеиновых последовательностей.

Выравнивание нуклеиновых последовательностей.
Анализ последовательностей с использованием компьютера.

План

Слайд 4

Молекулярная эволюция – это наука, изучающая изменения генетических макромолекул (ДНК, РНК, белков)

Молекулярная эволюция – это наука, изучающая изменения генетических макромолекул (ДНК, РНК, белков)
в процессе эволюции, закономерности и механизмы этих изменений, а также реконструирующая эволюционную историю генов и организмов.
Объекты исследования:
Последовательности нуклеиновых кислот (ДНК и РНК) как носителей генетической информации.
Последовательности белков.
Структура белков.
Геномы организмов.
Основные задачи:
1. Выявление закономерностей эволюции генетических макромолекул.
2. Реконструкция эволюционной истории генов и организмов.

Молекулярная эволюция

Слайд 5

Биоинформатика — совокупность методов и подходов, включающих в себя:
математические методы компьютерного анализа в сравнительной

Биоинформатика — совокупность методов и подходов, включающих в себя: математические методы компьютерного
геномике (геномная биоинформатика);
разработку алгоритмов и программ для предсказания пространственной структуры биополимеров (структурная биоинформатика);
исследование стратегий, соответствующих вычислительных методологий, а также общее управление информационной сложностью биологических систем.

Биоинформатика

Слайд 6

1868 г. - Фридрих Мишер открыл ДНК.
1953 г. – структура ДНК расшифрована

1868 г. - Фридрих Мишер открыл ДНК. 1953 г. – структура ДНК
Francis Crick, James Watson, Maurice Wilkins and Rosalind Franklin.

Молекула ДНК обеспечивает хранение и передачу информации о развитии и функционировании живых органзмов из поколения в поколение.

Молекула ДНК

Слайд 7

Структура:
ДНК состоит из повторяющихся единиц –
нуклеотидов:
A – Adenine;
T – Thymine;
C

Структура: ДНК состоит из повторяющихся единиц – нуклеотидов: A – Adenine; T
– Cytosine;
G – Guanine.
Молекула ДНК состоит из двух цепей, которые соединены через нуклеотиды по принципу комплиментарности:
A – T and C – G.
Пурины – аденин, гуанин.
Пиримидины – тимин, цитозин.

Молекула ДНК

Слайд 8

При воспроизведении генетической информации возникают ошибки.

При воспроизведении генетической информации возникают ошибки.

Слайд 9

Преимущество белого медведя перед бурым при охоте «в снегу».

Преимущество белого медведя перед бурым при охоте «в снегу».

Слайд 10

Один медведь не эволюционирует, эволюционирует ПОПУЛЯЦИЯ!!!

Один медведь не эволюционирует, эволюционирует ПОПУЛЯЦИЯ!!!

Слайд 11

Кто родственник человека???
(участок ДНК, отвечающий за усвоение сахаров)

Кто родственник человека??? (участок ДНК, отвечающий за усвоение сахаров)

Слайд 12

Все живые объекты –
результат
молекулярной эволюции

Все живые объекты – результат молекулярной эволюции

Слайд 13

Проблема анализа большого объема данных

Проблема анализа последовательностей возникла с появлением быстрых методов

Проблема анализа большого объема данных Проблема анализа последовательностей возникла с появлением быстрых
секвенирования.

Объем баз данных первичных последовательностей растет экспоненциально.
По состоянию на август 2014 года база данных GeneBank (NCBI) содержит ~166 млрд. п.о., а база данных UniProt ~17 млрд. а.к.

Что делать с этим колоссальным объемом данных?

Слайд 14

Процедура анализа молекулярной эволюции

Процедура анализа молекулярной эволюции

Слайд 15

Выравнивание - процедура попарного сопоставления остатков в последовательностях, направленное на поиск соответствия

Выравнивание - процедура попарного сопоставления остатков в последовательностях, направленное на поиск соответствия
между ними.
Выравнивание позволяет сопоставить и сравнить последовательности.
Считается, что белки с более чем 45% идентичных остатков в выравнивании, это ОЧЕНЬ похожие белки, более 25% - имеют сходную пространственную укладку, 18-25% - "переходная зона". Менее 18% - сходства, как правило, нет.

Выравнивание последовательностей

Тем не менее миоглобин кашалота и леггемоглобин люпина (15%) действительно гомологи

Слайд 16

Задание последовательности.
Статистический анализ.
Выравнивание последовательностей.

Анализ последовательностей
с использованием компьютера

Задание последовательности. Статистический анализ. Выравнивание последовательностей. Анализ последовательностей с использованием компьютера

Слайд 17

Задание последовательностей
randseq

Seq=randseq(SeqLength)
Seq=randseq(SeqLength, ...'Alphabet', AlphabetValue,...)
randseq(20)
ans =
TAGCTGGCCAAGCGAGCTTG

Задание последовательностей randseq Seq=randseq(SeqLength) Seq=randseq(SeqLength, ...'Alphabet', AlphabetValue,...) randseq(20) ans = TAGCTGGCCAAGCGAGCTTG

Слайд 18

Задание последовательностей
aa2nt

Преобразование аминокислотной последовательности в нуклеотидную. 
nucleo_seq= aa2nt(amino_seq, 'GeneticCode', code_number, …'alphabet', 'alphabet_name'),
Пример:
>> nucl_seq1=aa2nt('LifeSciense','alphabet','rna')
nucl_seq1

Задание последовательностей aa2nt Преобразование аминокислотной последовательности в нуклеотидную. nucleo_seq= aa2nt(amino_seq, 'GeneticCode', code_number,
=
CUCAUUUUUGAGAGUUGCAUUGAGAAUUCUGAA

Слайд 19

Статистический анализ
aacount
amino_s=aacount(amino_seq, 'chart', chart_value),
 >> seq=randseq(25,'alphabet','amino')
>> amino_acid=aacount(seq)
seq =
RCYDTLVRHNVASTWRGQTHYDQNN
amino_acid =
A: 1
R: 3
N: 3
D: 2

Статистический анализ aacount amino_s=aacount(amino_seq, 'chart', chart_value), >> seq=randseq(25,'alphabet','amino') >> amino_acid=aacount(seq) seq =

Слайд 20

Статистический анализ
ntdensity
nucl_dens=ntdensity(nucleotide_seq),
Пример:
>> S=randseq(20)
 S =
TTATGACGTTATTCTACTTT
>> nucl_dens =ntdensity(S)
 nucl_dens =
A: [1x20 double]
C: [1x20

Статистический анализ ntdensity nucl_dens=ntdensity(nucleotide_seq), Пример: >> S=randseq(20) S = TTATGACGTTATTCTACTTT >> nucl_dens
double]
G: [1x20 double]
T: [1x20 double]

Слайд 21

Выравнивание

Выравнивание

Слайд 22

Способы выравнивания
Глобальное выравнивание (последовательности одинаковой длины)
Локальное выравнивание

Способы выравнивания Глобальное выравнивание (последовательности одинаковой длины) Локальное выравнивание

Слайд 24

Выравнивание
Глобальное выравнивание

Алгоритм Нидлмана-Вунша
[score, alignment]=nwalign(seq_1, seq_2, 'showscore', true)
s_1='lifescience';
s_2='sefesici';
[score, alignment]=nwalign(s_1, s_2, 'showscore',true)
 Результат:
score =
0.6667
alignment

Выравнивание Глобальное выравнивание Алгоритм Нидлмана-Вунша [score, alignment]=nwalign(seq_1, seq_2, 'showscore', true) s_1='lifescience'; s_2='sefesici';
=
L I F E S C I E N C E
| | | | |
S E F E S - I - - C I

Слайд 25

Выравнивание
Локальное выравнивание

Алгоритм Смита-Ватермана
[score, alignment]=swalign(seq_1, seq_2, 'showscore', true).
s_1='lifescience';
s_2='sefesici';
[score, alignment]=swalign (s_1, s_2, 'showscore',true)
 Результат:
score

Выравнивание Локальное выравнивание Алгоритм Смита-Ватермана [score, alignment]=swalign(seq_1, seq_2, 'showscore', true). s_1='lifescience'; s_2='sefesici';
=
9.6667
alignment =
F E S – C I
| | | | |
F E S I C I

Слайд 26

Выравнивание
Множественное выравнивание

Более двух последовательностей
aligned_seqs = multialign(sequence_set),
Пример:
>> seqs = strvcat ('CGTTAT', 'TCGTTAC', 'TAGTTGTGC',

Выравнивание Множественное выравнивание Более двух последовательностей aligned_seqs = multialign(sequence_set), Пример: >> seqs
'GAGTTAATG');
>> ma = multialign(seqs)
ma =
C G T T A T - -
T C G T T A - - C
T A G T T G T G C
G A G T T A A T G

Слайд 27

Выравнивание
Множественное выравнивание

Более двух последовательностей
aligned_seqs = multialign(sequence_set),
Пример:
>> showalignment(ma)

Выравнивание Множественное выравнивание Более двух последовательностей aligned_seqs = multialign(sequence_set), Пример: >> showalignment(ma)

Слайд 28

Выравнивание
Множественное выравнивание

Для длинных последовательностей (длиннее 64 символов) нужно использоваться другую форму команды

Выравнивание Множественное выравнивание Для длинных последовательностей (длиннее 64 символов) нужно использоваться другую
showalignment:
showalignment(Alignment, 'Columns', Columns_Value)
где Columns_Value свойства «Columns» является максимальным целым числом символов, отображаемых в одной строке; например, showalignment(Alignment, 'Columns', 64) отображает 64 буквы в одной строке.

Слайд 29

multialignviewer(Alignment)

Выравнивание
Множественное выравнивание

multialignviewer(Alignment) Выравнивание Множественное выравнивание

Слайд 30

Литература

Обязательная
Бутиловский, А.В. Основные методы молекулярной эволюции: Монография / А.В. Бутиловский, Е.В. Барковский,

Литература Обязательная Бутиловский, А.В. Основные методы молекулярной эволюции: Монография / А.В. Бутиловский,
В.Э. Бутиловский, В.В. Давыдов, Е.А. Черноус, В.В. Хрусталев; под общ. ред. проф. Е.В. Бирковского. – Минск, 2009. – 210 с.
Лазарев, Ю. Ф. Начала программирования в среде Matlab: Учебное пособие. / Ю. Ф. Лазарев. - Киев: НТУУ "КПИ", 2003. - 424 с.
Дащенко, О. Ф. Matlab в инженерных и научных расчетах: Монография / О. Ф. Дащенко, В. Х. Кириллов, Л. В. Коломиец, В. Ф. Оробей. – Одесса: Астропринт, 2003. – 214 с.
Дополнительная
Burstein, L. MATLAB® in bioscience and biotechnology. / L. Burstein. - Woodhead Publishing, 2011. – 248 p.
Мироновский, Л.А. Введение в Matlab: Учебное пособие / Л.А. Мироновский, К.Ю. Петрова. СПб: ГУАП., 2005. – 122 с.
Дьяконов, В. Matlab. Обработка сигналов и изображений. Специальный справочник. – СПБ.: Питер, 2002. – 608 с.

Слайд 31

Глаз – продукт слепой эволюции???

Глаз – продукт слепой эволюции???

Слайд 32

«Слепой мир»

МУТАЦИЯ

«Слепой мир» МУТАЦИЯ

Слайд 33

Так видит светочувствительная бактерия

Так видит светочувствительная бактерия

Слайд 34

Бактерии научились избегать
солнечного света

Бактерии научились избегать солнечного света

Слайд 35

Появление светочувствительного пятна
«Отыскивали» солнечный свет

Появление светочувствительного пятна «Отыскивали» солнечный свет

Слайд 36

Плоские черви (чешуйчатое углубление)
Видны очертания

Плоские черви (чешуйчатое углубление) Видны очертания

Слайд 37

Появилось углубление

Появилось углубление

Слайд 38

Сужение отверстие до размеров точки
Покрылось пленкой

Сужение отверстие до размеров точки Покрылось пленкой

Слайд 39

Сужение отверстие до размеров точки
Узкое отверстие пропускает меньше света, но изображение более

Сужение отверстие до размеров точки Узкое отверстие пропускает меньше света, но изображение более четкое
четкое