Слайд 3Катастрофоустойчивость
Катастрофоустойчивость — это способность к восстановлению работы приложений и данных за минимально
короткий период времени после катастрофы. Под катастрофами понимаются не только пожар, наводнение или землетрясение, но также возможные непредвиденные сбои в работе служб, разрушение данных или повреждение всего центра обработки (например, в результате аварий в ходе ремонтных работ, умышленной диверсии или саботажа).
Слайд 4Кластер
Кла́стер (англ. cluster — скопление, кисть, рой) — объединение нескольких однородных элементов, которое может рассматриваться как
самостоятельная единица, обладающая определёнными свойствами.
Слайд 5Катастрофоустойчивая архитектура
Слайд 6Типы кластеров
Локальный кластер
Кампусный кластер
Метрокластер
Континентальный кластер
Слайд 11Катастрофоустойчивый кластер
географическое разнесение узлов;
репликация данных;
несколько независимых источников питания;
высоконадежная сетевая инфраструктура.
Слайд 12Примерная схема катастрофоучстойчивого кластера
Слайд 13На пути к катострофоустойчивости
Архитектура с одним арбитратором
Архитектура с двумя арбитраторами
Слайд 14Арбитраторы
Арбитратор обеспечивает такую же функциональность, как и диск захватов кластера (специальный диск,
при помощи которого обеспечивается недоступность ресурсов дисковой системы для остальных узлов в то время как их использует один из узлов кластера) и вычисляет новый кластер-кворум в случае отказа одного или нескольких узлов.
Слайд 15Кластер-кворум
Кластер-кворум — динамическая величина, вычисляемая всякий раз, когда узел кластера выходит из строя.
Если, например, система использует 10 узлов, и все работают, то кластер-кворум равен 100%. Если в некоторый момент выходят из строя два узла, то кластер-кворум будет равен 80% и т.д. Каждый раз при выходе из строя одного или нескольких узлов, для переустановки размера кластера и его дальнейшей работы необходимо чтобы кластер-кворум был более 50% иначе оставшиеся узлы будут остановлены.
Слайд 16Архитектура с одним арбитратором
Слайд 17Архитектура с двумя арбитраторами
Слайд 19Защита репликацией
устойчивость данных (репликация происходит упорядоченно, поэтому копия может быть доступна немедленно;
впрочем, устойчивые данные не всегда актуальны);
актуальность данных (процесс репликации на удаленную площадку протекает достаточно быстро, поэтому реплицированные данные содержат все изменения, внесенные в основную базу);
возможность восстановления данных (существует множество способов восстановить данные, например, с локальной или удаленной копии, с внешних носителей - оптических дисков или магнитных лент);
минимальную потерю данных.
Слайд 20Автономная репликация
Магнитные ленты
RTO – от суток до недели
RPO – сутки
Очень плохо
для бизнеса(AL 0)
Чаще всего используется в т.н. «теплом резерве»
Слайд 21Оперативная репликация
RTO = минуты
Чаще всего используется в «горячем резерве»
Асинхронная:
RTO = 0
RPO =
1-4 ч.
AL 3
Синхронная:
RTO = 0
RPO = 0
AL 4 :)