Слайд 2Цели проекта
Индексированный поиск по голосовому контенту (транскрипции)
Создание транскрипций для звукового контента (voice)
Хранение
контента
Предоставление публичного доступа к контенту и его транскрипции
Слайд 3Пользователь может:
Загрузить аудио или видео файл (voice)
Искать контент среди своих и публичных
записях.
Слайд 8Application services
Web сервер (apache/nginx)
База данных (mysql)
Запись аудио/видео (Adobe FMS)
Полнотекстовый поиск (sphinx)
Конвертация файлов
(ffmpeg)
Транскрибирование (dragon, nexiwave, human)
Слайд 11Процессы
Загрузка файла
Перемещение на S3
Преобразование в единый формат
Транскрибирование
Индексирование
Показ на сайте
Слайд 12Загрузка на S3
Web UI
Пользователь загрузил файл
Gearman
Задание на загрузку файла
SQS
Загрузка файла на S3
Отправка
задания на конвертацию (SQS)
Слайд 13Конвертация и транскрибирование
SQS
Конвертация файла
Загрузка на S3
Задание на транскрибирование
SQS
Транскрибирование
Задание на преобразование формата транскрипции
SQS
Подготовка
транскрипции
Сохранение транскрипции на S3
Слайд 14Общая схема
SQS
Web сервера
Cервера с ffmpeg
Сервера с dragon
Слайд 16Обновление (ffmpeg, dragon )
Остановка избыточных серверов
Обновление ПО
Создание эталонного AMI
Слайд 17Сервисы от Amazon
EC2
Linux/Windows сервера (Web, ffmpeg, dragon, sphinx)
Cервера «по требованию» (spot instances)
Load
balancer
Создание AMI
EBS
Elastic IP
Слайд 18Сервисы от Amazon
S3
CloudFront
RDS
Слайд 20Материалы
http://www.voicebase.com
http://aws.amazon.com/products/
http://aws.amazon.com/documentation/
http://gearman.org/
http://www.demo.com/alumni/demo2010fall/219504.html