Стек технологий Apache Hadoop. Распределённая файловая система HDFS

Февраль 18, 2021

Главная
Разное
Стек технологий Apache Hadoop. Распределённая файловая система HDFS

Содержание

2. Цели Осветить наиболее значимые технологии стека Apache Hadoop для распределённой обработки данных: MapReduce HDFS Hbase ZooKeeper
3. Архитектурные принципы Линейная масштабируемость Надёжность и доступность Ненадёжное (commodity) оборудование Перемещение данных дороже перемещения программ Высокая
4. MapReduce Фреймворк для распределённых вычислений MapReduce job – 2 этапа Map: { } -> { }
5. MapReduce
6. MapReduce
7. HDFS Иерархия каталогов и файлов Файлы поделены на блоки (128 MB) Метаданные отделены от данных NameNode
8. HBase Распределённое ключ-значение хранилище на базе HDFS Таблицы: Строки с уникальными ключами Произвольное количество колонок Колонки
9. ZooKeeper Распределённая служба координации распределённых задач Выборы лидера Распределённые блокировки Координация и уведомления о событиях
10. Pig Платформа для анализа больших наборов данных Pig Latin – SQL-подобный язык Простота кодирования Возможности оптимизации
11. Hive Служит тем же целям, что и Pig Таблицы Типизированные колонки (int, float, string, date, boolean)
12. Avro Система сериализации данных Предоставляет: Компактный бинарный формат Удалённые вызовы процедур (RPC) Простая интеграция с динамическими
13. HDFS. Поставленные цели Очень большой объём распределённых данных 10К узлов, 100М файлов, 10ПБ данных Ненадёжное (commodity)
14. HDFS. Архитектура
15. HDFS. Архитектура Общее пространство имён для всего кластера Согласованность данных Write-once-read-many модель доступа Append-запись всё ещё
16. HDFS. Архитектура
17. HDFS. NameNode Управляет пространством имён Связывает имя файла с набором блоков Связывает блок с набором DN
18. HDFS. NameNode. Метаданные Метаданные для всего кластера хранятся в ОП Типы метаданных Списки файлов Списки блоков
19. HDFS. DataNode Сервер блоков Хранит данные в локальной ФС Хранит метаданные блоков (CRC) Предоставляет данные и
20. HDFS. CheckpointNode Периодически создаёт новый checkpoint образ из checkpoint и journal, загруженных с NN Загружает новый
21. HDFS. Запись Клиент запрашивает у NN список DN-кандидатов на запись Начинает конвейерную запись с ближайшего узла
22. HDFS. Чтение Клиент запрашивает местоположение реплик блока у NN Начинает чтение с ближайшего узла, содержащего реплику
23. HDFS. Расположение реплик Первая реплика помещается на локальном узле Вторая реплика – на узел удалённой стойки
24. HDFS. Balancer Процент используемого дискового пространства на всех DN должен быть одинаков Обычно запускается при добавлении
25. HDFS. Block Scanner Каждая DN периодически запускает BS BS проверяет, что контрольные суммы соответствуют блокам данных
26. HDFS. Интерфейс пользователя Команды пользователя HDFS hadoop fs –mkdir /foodir hadoop fs –cat /foodir/barfile.txt hadoop fs
27. HDFS. Веб-интерфейс
28. HDFS. Использование в Yahoo! 3500 узлов 2 процессора [email protected] (по 4 ядра) Red Hat Enterprise Linux
29. HDFS. Benchmarks Gray Sort benchmark. Сортировка 1 ТБ и 1 ПБ данных. Записи по 100 байт.
31. Скачать презентацию

Цели
Осветить наиболее значимые технологии стека Apache Hadoop для распределённой обработки данных:
MapReduce
HDFS
Hbase
ZooKeeper
Pig
Hive
Avro
Рассмотреть

архитектуру распределённой файловой системы HDFS

Архитектурные принципы
Линейная масштабируемость
Надёжность и доступность
Ненадёжное (commodity) оборудование
Перемещение данных дороже перемещения программ
Высокая производительность

MapReduce
Фреймворк для распределённых вычислений
MapReduce job – 2 этапа
Map: {} -> {}
Reduce: {}

-> {}
Map – предварительная обработка
Reduce – агрегация
Shuffle – сортировка и слияние, невидимый для пользователя переход от Map к Reduce

MapReduce

HDFS
Иерархия каталогов и файлов
Файлы поделены на блоки (128 MB)
Метаданные отделены от данных
NameNode

хранит все метаданные в ОП
DataNode хранит реплики блоков в виде файлов на диске
Блоки дублируются на 3 DataNode

HBase
Распределённое ключ-значение хранилище на базе HDFS
Таблицы:
Строки с уникальными ключами
Произвольное количество колонок
Колонки сгруппированы

в группы колонок
Таблицы разбиты на «регионы»
Горизонтально по строкам
Вертикально по группам колонок

ZooKeeper
Распределённая служба координации распределённых задач
Выборы лидера
Распределённые блокировки
Координация и уведомления о событиях

Pig
Платформа для анализа больших наборов данных
Pig Latin – SQL-подобный язык
Простота кодирования
Возможности оптимизации
Расширяемость
Pig-программы

преобразуются в набор MapReduce заданий (jobs)

Hive
Служит тем же целям, что и Pig
Таблицы
Типизированные колонки (int, float, string, date,

boolean)
Поддержка списков и отображений
Реально данные хранятся в плоских файлах
Хранит метаданные о Hive-таблицах в RDB
Схемы таблиц
Расположение в HDFS

Avro
Система сериализации данных
Предоставляет:
Компактный бинарный формат
Удалённые вызовы процедур (RPC)
Простая интеграция с динамическими языками
Чтение/запись

с использованием схем

HDFS. Поставленные цели
Очень большой объём распределённых данных
10К узлов, 100М файлов, 10ПБ

данных
Ненадёжное (commodity) оборудование
Репликация данных
Обнаружение и восстановление после сбоев
Оптимизация для пакетной обработки
Вычисление перемещается к данным
Большая совокупная пропускная способность

Слайд 14

HDFS. Архитектура

Слайд 15

HDFS. Архитектура
Общее пространство имён для всего кластера
Согласованность данных
Write-once-read-many модель доступа
Append-запись всё ещё

нестабильна
Файлы разбиваются на блоки
Обычно по 128МБ
Каждый блок дублируется на несколько узлов
«Умный» клиент
Может узнать местоположение блоков
Доступ к данным непосредственно через DataNode

Слайд 16

HDFS. Архитектура

Слайд 17

HDFS. NameNode
Управляет пространством имён
Связывает имя файла с набором блоков
Связывает блок с набором

DN
Контролирует процессы репликации
Единственная точка отказа
Лог транзакций (journal) хранится в нескольких местах
Локальный каталог
Каталог в удалённой ФС (NFS/CIFS)

Слайд 18

HDFS. NameNode. Метаданные
Метаданные для всего кластера хранятся в ОП
Типы метаданных
Списки файлов
Списки блоков

для каждого файла
Списки DN для каждого блока
Атрибуты файлов (время создания, количество реплик и т.д.)

Слайд 19

HDFS. DataNode
Сервер блоков
Хранит данные в локальной ФС
Хранит метаданные блоков (CRC)
Предоставляет данные и

метаданные клиентам
Периодически (3 секунды) посылает статусное сообщение (heartbeat) NN
Список всех существующих блоков
Объём занятого/свободного места
Количество активных обменов данными
Конвейерная работа с данными
Передача данных заданным DN

Слайд 20

HDFS. CheckpointNode
Периодически создаёт новый checkpoint образ из checkpoint и journal, загруженных с

NN
Загружает новый checkpoint на NN. Существующий journal урезается

Слайд 21

HDFS. Запись
Клиент запрашивает у NN список DN-кандидатов на запись
Начинает конвейерную запись с

ближайшего узла

Слайд 22

HDFS. Чтение
Клиент запрашивает местоположение реплик блока у NN
Начинает чтение с ближайшего узла,

содержащего реплику блока

Слайд 23

HDFS. Расположение реплик
Первая реплика помещается на локальном узле
Вторая реплика – на узел

удалённой стойки
Третья – на другой узёл той же удалённой стойки
Остальные размещаются случайно
DN содержит не более одной реплики блока
Стойка содержит не более двух реплик блока

Слайд 24

HDFS. Balancer
Процент используемого дискового пространства на всех DN должен быть одинаков
Обычно запускается

при добавлении новой DN
Не мешает основной работе HDFS
При сильной загрузке сети трафик урезается до минимума (1 Мбит/с)

Слайд 25

HDFS. Block Scanner
Каждая DN периодически запускает BS
BS проверяет, что контрольные суммы соответствуют

блокам данных
Если BS находит повреждённый блок, он оповещает об этом NN
NN помечает реплику как испорченную и начинает процесс репликации для блока
По окончании повреждённая реплика готова к удалению

Слайд 26

HDFS. Интерфейс пользователя
Команды пользователя HDFS
hadoop fs –mkdir /foodir
hadoop fs –cat /foodir/barfile.txt
hadoop fs

–ls /foodir
Команды администратора HDFS
hadoop dfsadmin -report
hadoop dfsadmin –safemode enter
Веб-интерфейс
http://namenode:port/dfshealth.jsp

Слайд 27

HDFS. Веб-интерфейс

Слайд 28

HDFS. Использование в Yahoo!
3500 узлов
2 процессора [email protected] (по 4 ядра)
Red Hat Enterprise

HDFS. Использование в Yahoo! 3500 узлов 2 процессора Xeon@2.5GHz (по 4 ядра)

Linux Server Release 5.1
Sun Java JDK 1.6.0_13-b03
4 SATA диска (1 TB каждый)
16GB RAM
1-gigabit Ethernet
NamaNode с 64 GB RAM
3.3 PB данных (9.8 PB с репликами)
1-2 узла выходят из строя каждый день

Слайд 29

HDFS. Benchmarks
Gray Sort benchmark. Сортировка 1 ТБ и 1 ПБ данных. Записи

по
100 байт. При сортировке ТБ количество реплик было сокращено
до одной, при сортировке ПБ - до двух.

NameNode benchmark.
Несколько локальных
клиентских потоков
выполняют одну и ту же
операцию.

Стек технологий Apache Hadoop. Распределённая файловая система HDFS

Содержание

ЦелиОсветить наиболее значимые технологии стека Apache Hadoop для распределённой обработки данных: MapReduceHDFSHbaseZooKeeperPigHiveAvroРассмотреть

MapReduceФреймворк для распределённых вычисленийMapReduce job – 2 этапаMap: {} -> {}Reduce: {}

MapReduce

MapReduce

HDFSИерархия каталогов и файловФайлы поделены на блоки (128 MB)Метаданные отделены от данныхNameNode

HBaseРаспределённое ключ-значение хранилище на базе HDFSТаблицы:Строки с уникальными ключамиПроизвольное количество колонокКолонки сгруппированы

ZooKeeperРаспределённая служба координации распределённых задачВыборы лидераРаспределённые блокировкиКоординация и уведомления о событиях

PigПлатформа для анализа больших наборов данныхPig Latin – SQL-подобный языкПростота кодированияВозможности оптимизацииРасширяемостьPig-программы

HiveСлужит тем же целям, что и PigТаблицыТипизированные колонки (int, float, string, date,

AvroСистема сериализации данныхПредоставляет:Компактный бинарный форматУдалённые вызовы процедур (RPC)Простая интеграция с динамическими языкамиЧтение/запись

HDFS. Поставленные цели Очень большой объём распределённых данных10К узлов, 100М файлов, 10ПБ

HDFS. Архитектура

HDFS. АрхитектураОбщее пространство имён для всего кластераСогласованность данныхWrite-once-read-many модель доступаAppend-запись всё ещё

HDFS. Архитектура

HDFS. NameNodeУправляет пространством имёнСвязывает имя файла с набором блоковСвязывает блок с набором

HDFS. NameNode. МетаданныеМетаданные для всего кластера хранятся в ОПТипы метаданныхСписки файловСписки блоков

HDFS. DataNodeСервер блоковХранит данные в локальной ФСХранит метаданные блоков (CRC)Предоставляет данные и

HDFS. CheckpointNodeПериодически создаёт новый checkpoint образ из checkpoint и journal, загруженных с

HDFS. ЗаписьКлиент запрашивает у NN список DN-кандидатов на записьНачинает конвейерную запись с

HDFS. ЧтениеКлиент запрашивает местоположение реплик блока у NNНачинает чтение с ближайшего узла,

HDFS. Расположение репликПервая реплика помещается на локальном узлеВторая реплика – на узел

HDFS. BalancerПроцент используемого дискового пространства на всех DN должен быть одинаковОбычно запускается

HDFS. Block ScannerКаждая DN периодически запускает BSBS проверяет, что контрольные суммы соответствуют

HDFS. Интерфейс пользователяКоманды пользователя HDFShadoop fs –mkdir /foodirhadoop fs –cat /foodir/barfile.txthadoop fs

HDFS. Веб-интерфейс

HDFS. Использование в Yahoo!3500 узлов2 процессора [email protected] (по 4 ядра)Red Hat Enterprise

HDFS. BenchmarksGray Sort benchmark. Сортировка 1 ТБ и 1 ПБ данных. Записи

Похожие презентации

Цели
Осветить наиболее значимые технологии стека Apache Hadoop для распределённой обработки данных:
MapReduce
HDFS
Hbase
ZooKeeper
Pig
Hive
Avro
Рассмотреть

MapReduce
Фреймворк для распределённых вычислений
MapReduce job – 2 этапа
Map: {} -> {}
Reduce: {}

HDFS
Иерархия каталогов и файлов
Файлы поделены на блоки (128 MB)
Метаданные отделены от данных
NameNode

HBase
Распределённое ключ-значение хранилище на базе HDFS
Таблицы:
Строки с уникальными ключами
Произвольное количество колонок
Колонки сгруппированы

ZooKeeper
Распределённая служба координации распределённых задач
Выборы лидера
Распределённые блокировки
Координация и уведомления о событиях

Pig
Платформа для анализа больших наборов данных
Pig Latin – SQL-подобный язык
Простота кодирования
Возможности оптимизации
Расширяемость
Pig-программы

Hive
Служит тем же целям, что и Pig
Таблицы
Типизированные колонки (int, float, string, date,

Avro
Система сериализации данных
Предоставляет:
Компактный бинарный формат
Удалённые вызовы процедур (RPC)
Простая интеграция с динамическими языками
Чтение/запись

HDFS. Поставленные цели
Очень большой объём распределённых данных
10К узлов, 100М файлов, 10ПБ

HDFS. Архитектура
Общее пространство имён для всего кластера
Согласованность данных
Write-once-read-many модель доступа
Append-запись всё ещё

HDFS. NameNode
Управляет пространством имён
Связывает имя файла с набором блоков
Связывает блок с набором

HDFS. NameNode. Метаданные
Метаданные для всего кластера хранятся в ОП
Типы метаданных
Списки файлов
Списки блоков

HDFS. DataNode
Сервер блоков
Хранит данные в локальной ФС
Хранит метаданные блоков (CRC)
Предоставляет данные и

HDFS. CheckpointNode
Периодически создаёт новый checkpoint образ из checkpoint и journal, загруженных с

HDFS. Запись
Клиент запрашивает у NN список DN-кандидатов на запись
Начинает конвейерную запись с

HDFS. Чтение
Клиент запрашивает местоположение реплик блока у NN
Начинает чтение с ближайшего узла,

HDFS. Расположение реплик
Первая реплика помещается на локальном узле
Вторая реплика – на узел

HDFS. Balancer
Процент используемого дискового пространства на всех DN должен быть одинаков
Обычно запускается

HDFS. Block Scanner
Каждая DN периодически запускает BS
BS проверяет, что контрольные суммы соответствуют

HDFS. Интерфейс пользователя
Команды пользователя HDFS
hadoop fs –mkdir /foodir
hadoop fs –cat /foodir/barfile.txt
hadoop fs

HDFS. Использование в Yahoo!
3500 узлов
2 процессора [email protected] (по 4 ядра)
Red Hat Enterprise

HDFS. Benchmarks
Gray Sort benchmark. Сортировка 1 ТБ и 1 ПБ данных. Записи