Использование технологий XML и COM для решения задач статистической радиофизики

Содержание

Слайд 2

Содержание

Цель работы
Задача индексации
Вектора признаков
Кепстр
Формирования вектора признаков на основе вейвлет-преобразования
Скрытые Марковские модели
Метод опорных

Содержание Цель работы Задача индексации Вектора признаков Кепстр Формирования вектора признаков на
векторов
Структура ядра системы индексации
Структура ядра системы индексации
Процессоры
Компоненты чтения
Пользовательский интерфейс
Эксперимент
Результаты эксперимента
Заключение

Слайд 3

Цель работы

Целью данной работы является разработка системы индексации аудиопоследовательностей на основе СММ

Цель работы Целью данной работы является разработка системы индексации аудиопоследовательностей на основе
и МОВ. Для достижения поставленной цели необходимо решить следующие задачи:
Изучить общую проблему индексации аудиодокументов и существующие подходы.
Разработать структуру системы Разработать структуру системы индексации аудиопоследовательностей на основе Скрытой Марковской Модели Разработать структуру системы индексации аудиопоследовательностей на основе Скрытой Марковской Модели и Метода Опорных Векторов.
Разработать алгоритм извлечения вектора признаков из аудиосигналов на основе вейвлет преобразования.
Разработать структуру и реализовать систему индексации аудиопоследовательностей на языке С++.
Разработать структуру компонентов системы Разработать структуру компонентов системы и реализовать графический интерфейс системы.
Реализовать базовые компоненты обработки аудиосигналов.

Слайд 4

Задача индексации

Задача индексации

Слайд 5

Вектора признаков

В данной работе использовалось 2 вида векторов признаков:
Вектор признаков кепстральных коэффициентов
Вектор

Вектора признаков В данной работе использовалось 2 вида векторов признаков: Вектор признаков
признаков на основе вейвлет преобразования

Слайд 6

Кепстр

Frame

Window

DFT

Mel
filter bank

Log

DCT

MFCC

Signal

Delta
Coefficients

Delta-Delta
Coefficients

Energy

Кепстр Frame Window DFT Mel filter bank Log DCT MFCC Signal Delta Coefficients Delta-Delta Coefficients Energy

Слайд 7

Формирование вектора признаков на основе вейвлет-преобразования

Формирование вектора признаков на основе вейвлет-преобразования

Слайд 8

Скрытые марковские модели

Скрытая марковская модель – это дважды стохастический случайный процесс в

Скрытые марковские модели Скрытая марковская модель – это дважды стохастический случайный процесс
котором наблюдения являются вероятностной функцией состояния.
СММ характеризуются следующими параметрами:
набор состояний
вариационная матрица переходов
набор событий
матрица вероятностей наблюдения
начальное и конечное состояния
матрица начальных вероятностей
Приближения СММ
1)
2)

Слайд 9

Три фундаментальных проблеммы СММ
Проблема Оценки – при данных модели Ф и последовательности

Три фундаментальных проблеммы СММ Проблема Оценки – при данных модели Ф и
наблюдений , какой будет вероятность появления модели, сгенерировавшей наблюдение?
Прямой алгоритм:
Проблема Декодирования - при данных модели Ф и последовательности наблюдений , какой будет наиболее вероятная последовательность состояний S в модели, сгенерировавшей наблюдения?
Алгоритм Витерби:
Проблема Обучения - при данных модели Ф и последовательности наблюдений, как можно настоит параметры модели так, чтобы максимизировать совместную вероятность ?
Прямой-обратный алгоритм

Слайд 10

Метод опорных векторов

Метод опорных векторов

Слайд 11

Метод опорных векторов

Метод опорных векторов

Слайд 12

Структура системы индексации аудио

Структура системы индексации аудио

Слайд 13

Структура ядра системы индексации

Структура ядра системы индексации

Слайд 14

Процессоры

сlass Processor : public Idispatch
{
public:
virtual HRESULT STDMETHODCALLTYPE loadSettings(const char*settings) = 0;

Процессоры сlass Processor : public Idispatch { public: virtual HRESULT STDMETHODCALLTYPE loadSettings(const
virtual HRESULT STDMETHODCALLTYPE work(DataStruct** data) = 0;
virtual HRESULT STDMETHODCALLTYPE getProcessorId(char** id) = 0;
virtual HRESULT STDMETHODCALLTYPE getSize(int* val) = 0;
virtual HRESULT STDMETHODCALLTYPE getStep(int* val) = 0;
virtual HRESULT STDMETHODCALLTYPE getSettings(char**) = 0;
};

Слайд 15

Компоненты чтения

class ReaderInterface : public IDispatch
{
public:
virtual HRESULT STDMETHODCALLTYPE open(const char*, ResultStruct*)

Компоненты чтения class ReaderInterface : public IDispatch { public: virtual HRESULT STDMETHODCALLTYPE
= 0;
virtual HRESULT STDMETHODCALLTYPE read(DataStruct**, ResultStruct*) = 0;
};

Слайд 16

Пользовательский интерфейс

Пользовательский интерфейс

Слайд 17

Пользовательский интерфейс

Пользовательский интерфейс

Слайд 18

Базовые процессоры

Окна

Бартлетта

Блекмана

Блекмана-Хариса

Хемминга

Хаара

Кайзера

Преобразования

БПФ

Вейвлет

ДКП

МОВ

СММ

Признаки

Кепстр

На вейвлете
Классификаторы

Базовые процессоры Окна Бартлетта Блекмана Блекмана-Хариса Хемминга Хаара Кайзера Преобразования БПФ Вейвлет

Слайд 19

Эксперимент

В рамках данного проекта, на основе созданной системы были проведены 3 эксперимента

Эксперимент В рамках данного проекта, на основе созданной системы были проведены 3
по индексации аудиопоследовательностей:
сегментация речь/музыка/тишина
распознавание эмоций на основе МОВ
определение жанров музыки на основе СММ

Слайд 20

Сценарий эксперимента

Сценарий эксперимента

Слайд 21

Сегментация речь/музыка/тишина

речь

тишина

тишина

музыка

Сегментация речь/музыка/тишина речь тишина тишина музыка

Слайд 22

Сегментация речь/музыка/тишина

Сегментация речь/музыка/тишина

Слайд 23

Распознавание эмоций на основе МОВ

Распознавание эмоций на основе МОВ

Слайд 24

Результаты распознавания эмоций на основе МОВ

Результаты распознавания эмоций на основе МОВ

Слайд 25

Результаты определения жанров музыки на основе СММ

Результаты определения жанров музыки на основе СММ

Слайд 26

Заключение

В рамках данного проекта была выполнена следующая работа:
разработаны структуры системы индексации

Заключение В рамках данного проекта была выполнена следующая работа: разработаны структуры системы
аудиопоследовательностей и ее компонент, позволяющие легко модифицировать параметры системы для конкретной задачи индексации.
разработан интерфейс компонент системы, позволяющий легко подключать к системе компоненты сторонних разработчиков с целью расширения возможностей системы.
реализована система индексации аудиопоследовательностей на языке С++, графический пользовательский интерфейс системы и базовые компоненты индексации аудиопоследовательностей.
На основе разработанной системы проведены эксперименты по разделению аудиопоследовательности на речь/музыку/тишину, распознаванию эмоций в речи, определению жанров музыки.
Имя файла: Использование-технологий-XML-и-COM-для-решения-задач-статистической-радиофизики.pptx
Количество просмотров: 153
Количество скачиваний: 0