Слайд 2Необходимые компоненты
Ubuntu 11.10
Hadoop 1.0.1
Java 1.7
Слайд 3Этап 1. Подготовка
Установка JDK
Создание пользователя
Отключение IPv6
Слайд 4Этап 2. Установка
Загрузка Hadoop
Распаковка архива
Установка переменной окружения $HADOOP_HOME
Слайд 5Этап 3. Настройка HDFS
Создание папки в файловой системе
Редактирование конфигурационных файлов:
- conf/core-site.xml
- conf/mapred-site.xml
- conf/hdfs-site.xml
Форматирование HDFS
Слайд 6Примеры конфигурационных файлов
conf/core-site.xml
hadoop.tmp.dir
/app/hadoop/tmp
Some description.
fs.default.name
hdfs://localhost:54310
Some description
Слайд 7Примеры конфигурационных файлов
conf/mapred-site.xml
mapred.job.tracker
localhost:54311
Some description
Слайд 8Примеры конфигурационных файлов
conf/hdfs-site.xml
dfs.replication
1
Some description
Слайд 9Форматирование HDFS
Выполняется с помощью команды namenode
hduser@ubuntu:~$ /usr/local/hadoop/bin/hadoop namenode -format
Слайд 10Запуск и остановка Hadoop
Запуск
- start-all.sh
Остановка
- stop-all.sh
Слайд 11Работа с HDFS
Копирование данных на HDFS
- bin/hadoop dfs -copyFromLocal /tmp/fanatic /user/hduser/fanatic
Вывод
списка файлов
- bin/hadoop dfs -ls /user/hduser
Получение данных с HDFS
- bin/hadoop dfs -getmerge /user/hduser/fan-output /tmp/out
Слайд 12Запуск Java-задания
Команда запуска задания
- hadoop jar your-job-file-goes-here.jar
Слайд 13Структура задания
Ядро задания
- реализация интерфейсов Mapper и Reducer
Mapper
- формирует пары
ключ/значение
Reducer
- уменьшает набор пар, которые имеют один и тот же ключ в меньший набор значений
Слайд 15Веб интфейсы Hadoop
http://localhost:50030/ - UI для MapReduce заданий
http://localhost:50060/ - UI для заданий
http://localhost:50070/
- UI для просмотра статистики HDFS