Пример использования Hadoop

Содержание

Слайд 2

Необходимые компоненты

Ubuntu 11.10
Hadoop 1.0.1
Java 1.7

Необходимые компоненты Ubuntu 11.10 Hadoop 1.0.1 Java 1.7

Слайд 3

Этап 1. Подготовка

Установка JDK
Создание пользователя
Отключение IPv6

Этап 1. Подготовка Установка JDK Создание пользователя Отключение IPv6

Слайд 4

Этап 2. Установка

Загрузка Hadoop
Распаковка архива
Установка переменной окружения $HADOOP_HOME

Этап 2. Установка Загрузка Hadoop Распаковка архива Установка переменной окружения $HADOOP_HOME

Слайд 5

Этап 3. Настройка HDFS

Создание папки в файловой системе
Редактирование конфигурационных файлов:
- conf/core-site.xml

Этап 3. Настройка HDFS Создание папки в файловой системе Редактирование конфигурационных файлов:
- conf/mapred-site.xml
- conf/hdfs-site.xml
Форматирование HDFS

Слайд 6

Примеры конфигурационных файлов

conf/core-site.xml


hadoop.tmp.dir
/app/hadoop/tmp
Some description.


fs.default.name
hdfs://localhost:54310

Примеры конфигурационных файлов conf/core-site.xml hadoop.tmp.dir /app/hadoop/tmp Some description. fs.default.name hdfs://localhost:54310 Some description
Some description

Слайд 7

Примеры конфигурационных файлов

conf/mapred-site.xml


mapred.job.tracker
localhost:54311
Some description

Примеры конфигурационных файлов conf/mapred-site.xml mapred.job.tracker localhost:54311 Some description

Слайд 8

Примеры конфигурационных файлов

conf/hdfs-site.xml


dfs.replication
1
Some description


Примеры конфигурационных файлов conf/hdfs-site.xml dfs.replication 1 Some description

Слайд 9

Форматирование HDFS

Выполняется с помощью команды namenode
hduser@ubuntu:~$ /usr/local/hadoop/bin/hadoop namenode -format

Форматирование HDFS Выполняется с помощью команды namenode hduser@ubuntu:~$ /usr/local/hadoop/bin/hadoop namenode -format

Слайд 10

Запуск и остановка Hadoop

Запуск
- start-all.sh
Остановка
- stop-all.sh

Запуск и остановка Hadoop Запуск - start-all.sh Остановка - stop-all.sh

Слайд 11

Работа с HDFS

Копирование данных на HDFS
- bin/hadoop dfs -copyFromLocal /tmp/fanatic /user/hduser/fanatic
Вывод

Работа с HDFS Копирование данных на HDFS - bin/hadoop dfs -copyFromLocal /tmp/fanatic
списка файлов
- bin/hadoop dfs -ls /user/hduser
Получение данных с HDFS
- bin/hadoop dfs -getmerge /user/hduser/fan-output /tmp/out

Слайд 12

Запуск Java-задания

Команда запуска задания
- hadoop jar your-job-file-goes-here.jar

Запуск Java-задания Команда запуска задания - hadoop jar your-job-file-goes-here.jar

Слайд 13

Структура задания

Ядро задания
- реализация интерфейсов Mapper и Reducer
Mapper
- формирует пары

Структура задания Ядро задания - реализация интерфейсов Mapper и Reducer Mapper -
ключ/значение
Reducer
- уменьшает набор пар, которые имеют один и тот же ключ в меньший набор значений

Слайд 14

Демонстрация

Демонстрация

Слайд 15

Веб интфейсы Hadoop

http://localhost:50030/ - UI для MapReduce заданий
http://localhost:50060/ - UI для заданий
http://localhost:50070/

Веб интфейсы Hadoop http://localhost:50030/ - UI для MapReduce заданий http://localhost:50060/ - UI
- UI для просмотра статистики HDFS
Имя файла: Пример-использования-Hadoop.pptx
Количество просмотров: 172
Количество скачиваний: 0