Содержание

Слайд 2

О чем я хочу рассказать?

Развитии системы статистики

Проблемах и их решении

О чем я хочу рассказать? Развитии системы статистики Проблемах и их решении

Слайд 3

Зачем нужна система расчета статистики

Зачем нужна система расчета статистики

Слайд 4

Почему нужна система расчета статистики

Много проектов
Много данных
Потребовалось считать статистику регулярно и единообразно

Почему нужна система расчета статистики Много проектов Много данных Потребовалось считать статистику регулярно и единообразно

Слайд 6


Сначала данных и проектов было мало

< 10Gb в сутки

Сначала данных и проектов было мало

Слайд 7

Исходная архитектура
в СУБД складываем только необходимые фрагменты строк из лога
СУБД резервируем
считаем возможности

Исходная архитектура в СУБД складываем только необходимые фрагменты строк из лога СУБД
экстенсивного роста неограниченными
Проблема: конструкция не масштабируется.

Слайд 9


Данных и проектов еще было мало

< 100Gb в сутки

Данных и проектов еще было мало

Слайд 10

Первая попытка масштабирования
кластеризация считающих машин("парсеров")‏
кластеризация СУБД
SAN с использование iscsi
Проблема: все

Первая попытка масштабирования кластеризация считающих машин("парсеров")‏ кластеризация СУБД SAN с использование iscsi
пропало, сеть не может обеспечить нужную производительность :(

Слайд 12

Когда данных стало 200-300Гб в сутки

Когда данных стало 200-300Гб в сутки

Слайд 13

Вторая попытка масштабирования

Пределы экстенсивного роста

Научились эффективно балансировать нагрузку на сеть (а именно

Вторая попытка масштабирования Пределы экстенсивного роста Научились эффективно балансировать нагрузку на сеть
TCP сессии iscsi)‏
Учли особенности работы с кластеризованной СУБД
Проблема: монолитность системы

Слайд 14

Вторая попытка масштабирования

Пределы экстенсивного роста

Вторая попытка масштабирования Пределы экстенсивного роста

Слайд 15

Финальное решение

Финальное решение

Слайд 18

Сейчас ежесуточно статистика обрабатывает 2-3Тб данных

Сейчас ежесуточно статистика обрабатывает 2-3Тб данных

Слайд 20

   
"оптимальность инструмента"‏ расчетов
разделение монолитной системы на обособленные функциональному

"оптимальность инструмента"‏ расчетов разделение монолитной системы на обособленные функциональному признаку подсистемы 11 Пересмотр архитектуры
признаку подсистемы

11

Пересмотр архитектуры

Слайд 21

А будет еще больше…

Рост в 3-4 раза каждый год!

А будет еще больше… Рост в 3-4 раза каждый год!

Слайд 22

Пересмотр архитектуры: почему?

Недостатки старой архитектуры:
- сложности масштабирования
- монолитность системы
Достоинства старой

Пересмотр архитектуры: почему? Недостатки старой архитектуры: - сложности масштабирования - монолитность системы
архитектуры:
- единая точка входа
- SQL-интерфейс
- ну и то что она как-то работает :)

Слайд 23

Пересмотр архитектуры: почему?

Недостатки новой архитектуры:
Необходимость локализации расчетов
Достоинства новой архитектуры

Пересмотр архитектуры: почему? Недостатки новой архитектуры: Необходимость локализации расчетов Достоинства новой архитектуры
Масштабируемость
Надежность
Большая емкость вычислительных и сетевых ресурсов

Слайд 24

Итог:

Нерешаемые проблемы решаются просто
Децентрализация системы сильно упрощает ее обслуживание.

Итог: Нерешаемые проблемы решаются просто Децентрализация системы сильно упрощает ее обслуживание. Децентрализация
Децентрализация системы повышает ее надежность.
(возможно этот слайд нафиг не нужен)‏

Слайд 25

Итог:

Децентрализация системы

Специализация
компонентов

Автономность
компонентов

«Простота»
компонентов

Отказоустойчивость

Производительность

Простота в обслуживании
и высокая эффективность

Итог: Децентрализация системы Специализация компонентов Автономность компонентов «Простота» компонентов Отказоустойчивость Производительность Простота
Имя файла: Яндекс.pptx
Количество просмотров: 4978
Количество скачиваний: 20