Использование ИТ в оценке параметров бинарной выборки

Содержание

Слайд 2

Введение

На практике очень часто возникает потребность оценки каких-либо статистических параметров на основе

Введение На практике очень часто возникает потребность оценки каких-либо статистических параметров на
полученных данных.
На современном этапе существует ряд программных средств от языков программирования до готовых программных пакетов, которые позволяют получить такие статистические оценки.

Слайд 3

Программное обеспечение

Математические пакеты:
Matlab
Mathematica
Mathcad
Maple
Статистические пакеты
Statistica
EViews

Программное обеспечение Математические пакеты: Matlab Mathematica Mathcad Maple Статистические пакеты Statistica EViews

Слайд 4

Пакет Mathematica

Mathematica относится к системам компьютерной алгебры. Центральное место в системах класса

Пакет Mathematica Mathematica относится к системам компьютерной алгебры. Центральное место в системах
Mathematica занимает машинно-независимое ядро математических операций — Kernel. Для ориентации системы на конкретную машинную платформу служит программный интерфейсный процессор Front End.

Kernel

Front End

Слайд 5

Возможности Mathemetica

Аналитические преобразования
Численные расчёты
Теория чисел
Линейная алгебра
Графика и звук

Возможности Mathemetica Аналитические преобразования Численные расчёты Теория чисел Линейная алгебра Графика и звук

Слайд 6

Интерфейс Mathemetica

Интерфейс Mathemetica

Слайд 7

STATISTICA

STATISTICA — пакет для всестороннего статистического анализа, разработанный компанией StatSoft. В пакете

STATISTICA STATISTICA — пакет для всестороннего статистического анализа, разработанный компанией StatSoft. В
STATISTICA реализованы процедуры для анализа данных(data analysis), управления данными (data management), добычи данных (data mining), визуализации данных (data visualization).
Программа вычисляет практически все используемые описательные статистики общего характера. Практически все описательные статистики и графики могут быть построены для данных, категоризованных (сгруппированных) по значениям одной или нескольких группирующих переменных.
Пакет STATISTICA имеет модульную структуру. Каждый модуль содержит уникальные процедуры и методы анализа данных.

Слайд 8

Модули STATISTICA

Base — включает в себя обширный выбор основных статистик, широкий набор

Модули STATISTICA Base — включает в себя обширный выбор основных статистик, широкий
методов для разведочного анализа.
Advanced Linear/Non-Linear Models — предлагает широкий спектр линейных и нелинейных средств моделирования, регрессионный анализ, анализ компонент дисперсий, анализ временных рядов и т. д.
Multivariate Exploratory Techniques — многомерные разведочные технологии анализа STATISTICA предоставляет широкий выбор разведочных технологий
QC — Контроль качества — предоставляет широкий спектр аналитических методов управления качеством, а также контрольные карты презентационного качества.
Neural Networks — (отдельный модуль) единственный в мире программный продукт для нейросетевых исследований, полностью переведенный на русский язык
Data Miner — интеллектуальный анализ данных

Слайд 9

Интерфейс STATISTICA

Интерфейс STATISTICA

Слайд 10

ЕМ-алгоритм

ЕМ-алгоритм — очень общий итеративный алгоритм для МП-оценивания в задачах с неполными

ЕМ-алгоритм ЕМ-алгоритм — очень общий итеративный алгоритм для МП-оценивания в задачах с
данными.
В ЕМ-алгоритме формализована относительно старая идея обработки неполных данных:
заполнение пропусков оценками пропущенных значений
оценивание параметров
повторное оценивание пропущенных значений и параметров и так далее до сходимости процесса.

Слайд 11

ЕМ-алгоритм для смесей

Первая выборка имеет стандартное нормальное распределение. Вторая имеет нормальное распределение

ЕМ-алгоритм для смесей Первая выборка имеет стандартное нормальное распределение. Вторая имеет нормальное
с математическим ожиданием а и дисперсией σ.

Слайд 12

Результаты моделирования

Параметры: a = 2, σ = 0,5, λ = 0,5. Вероятность

Результаты моделирования Параметры: a = 2, σ = 0,5, λ = 0,5.
пропуска: pmis=0,4. Объем выборки N=1000.
С использованием метода максимального правдоподобия и EM-алгоритма были получены следующие оценки.
ММП ЕМ-алгоритм

Слайд 13

Зависимось от количества пропусков

Объем выборки N = 400. Вероятность pmis изменялась от

Зависимось от количества пропусков Объем выборки N = 400. Вероятность pmis изменялась
0 до 0,99 с шагом 0,01.
а σ

Слайд 14

Заключение

Были изучены возможности различных математических пакетов.
В качестве основного инструмента при выполнении поставленной

Заключение Были изучены возможности различных математических пакетов. В качестве основного инструмента при
задачи был выбран пакет Mathematica.
ММП дает неплохие оценки, однако для оценки параметров выборок с пропусками следует использовать EM-алгоритм.
с увеличением количества пропусков точность EM-алгоритма падает, однако не так сильно, как ожидалось.

Слайд 15

Список использованных источников

В. Дьяконов. Mathematica 5/6/7. Полное руководство. Минск, 2009
В. Дьяконов. Mathematica

Список использованных источников В. Дьяконов. Mathematica 5/6/7. Полное руководство. Минск, 2009 В.
5.1/5.2/6 в математических и научно-технических расчетах. Минск, 2008
А. Халафян. Statistica 6. Статистический анализ данных. Минск, 2008
В. Боровиков. STATISTICA. Искусство анализа данных на компьютере. Минск, 2003
Имя файла: Использование-ИТ-в-оценке-параметров-бинарной-выборки.pptx
Количество просмотров: 106
Количество скачиваний: 0