Слайд 2 О чем я хочу рассказать?
Развитии системы статистики
Проблемах и их решении
![О чем я хочу рассказать? Развитии системы статистики Проблемах и их решении](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/387807/slide-1.jpg)
Слайд 3 Зачем нужна система расчета статистики
![Зачем нужна система расчета статистики](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/387807/slide-2.jpg)
Слайд 4 Почему нужна система расчета статистики
Много проектов
Много данных
Потребовалось считать статистику регулярно и единообразно
![Почему нужна система расчета статистики Много проектов Много данных Потребовалось считать статистику регулярно и единообразно](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/387807/slide-3.jpg)
Слайд 6
Сначала данных и проектов было мало
< 10Gb в сутки
![Сначала данных и проектов было мало](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/387807/slide-5.jpg)
Слайд 7Исходная архитектура
в СУБД складываем только необходимые фрагменты строк из лога
СУБД резервируем
считаем возможности
![Исходная архитектура в СУБД складываем только необходимые фрагменты строк из лога СУБД](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/387807/slide-6.jpg)
экстенсивного роста неограниченными
Проблема: конструкция не масштабируется.
Слайд 9
Данных и проектов еще было мало
< 100Gb в сутки
![Данных и проектов еще было мало](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/387807/slide-8.jpg)
Слайд 10Первая попытка масштабирования
кластеризация считающих машин("парсеров")
кластеризация СУБД
SAN с использование iscsi
Проблема: все
![Первая попытка масштабирования кластеризация считающих машин("парсеров") кластеризация СУБД SAN с использование iscsi](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/387807/slide-9.jpg)
пропало, сеть не может обеспечить нужную производительность :(
Слайд 12 Когда данных стало 200-300Гб в сутки
![Когда данных стало 200-300Гб в сутки](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/387807/slide-11.jpg)
Слайд 13Вторая попытка масштабирования
Пределы экстенсивного роста
Научились эффективно балансировать нагрузку на сеть (а именно
![Вторая попытка масштабирования Пределы экстенсивного роста Научились эффективно балансировать нагрузку на сеть](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/387807/slide-12.jpg)
TCP сессии iscsi)
Учли особенности работы с кластеризованной СУБД
Проблема: монолитность системы
Слайд 14 Вторая попытка масштабирования
Пределы экстенсивного роста
![Вторая попытка масштабирования Пределы экстенсивного роста](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/387807/slide-13.jpg)
Слайд 18 Сейчас ежесуточно статистика обрабатывает 2-3Тб данных
![Сейчас ежесуточно статистика обрабатывает 2-3Тб данных](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/387807/slide-17.jpg)
Слайд 20
"оптимальность инструмента" расчетов
разделение монолитной системы на обособленные функциональному
!["оптимальность инструмента" расчетов разделение монолитной системы на обособленные функциональному признаку подсистемы 11 Пересмотр архитектуры](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/387807/slide-19.jpg)
признаку подсистемы
11
Пересмотр архитектуры
Слайд 21 А будет еще больше…
Рост в 3-4 раза каждый год!
![А будет еще больше… Рост в 3-4 раза каждый год!](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/387807/slide-20.jpg)
Слайд 22Пересмотр архитектуры: почему?
Недостатки старой архитектуры:
- сложности масштабирования
- монолитность системы
Достоинства старой
![Пересмотр архитектуры: почему? Недостатки старой архитектуры: - сложности масштабирования - монолитность системы](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/387807/slide-21.jpg)
архитектуры:
- единая точка входа
- SQL-интерфейс
- ну и то что она как-то работает :)
Слайд 23Пересмотр архитектуры: почему?
Недостатки новой архитектуры:
Необходимость локализации расчетов
Достоинства новой архитектуры
![Пересмотр архитектуры: почему? Недостатки новой архитектуры: Необходимость локализации расчетов Достоинства новой архитектуры](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/387807/slide-22.jpg)
Масштабируемость
Надежность
Большая емкость вычислительных и сетевых ресурсов
Слайд 24Итог:
Нерешаемые проблемы решаются просто
Децентрализация системы сильно упрощает ее обслуживание.
![Итог: Нерешаемые проблемы решаются просто Децентрализация системы сильно упрощает ее обслуживание. Децентрализация](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/387807/slide-23.jpg)
Децентрализация системы повышает ее надежность.
(возможно этот слайд нафиг не нужен)
Слайд 25 Итог:
Децентрализация системы
Специализация
компонентов
Автономность
компонентов
«Простота»
компонентов
Отказоустойчивость
Производительность
Простота в обслуживании
и высокая эффективность
![Итог: Децентрализация системы Специализация компонентов Автономность компонентов «Простота» компонентов Отказоустойчивость Производительность Простота](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/387807/slide-24.jpg)