Математическая статистика

Содержание

Слайд 2

Математическая статистика — наука о математических методах систематизации и использования статистиче­ских данных для решения

Математическая статистика — наука о математических методах систематизации и использования статистиче­ских данных
научных и практических задач.
Ма­тематическая статистика тесно примыкает к теории вероятностей и базируется на ее понятиях.
Однако главным в математической статистике является не распределение случайных величин, а ана­лиз статистических данных и выяснение, какому распределению они соответствуют.

Слайд 3

Предположим, что необходимо изучить множество объектов по какому-либо признаку.
Большая совокупность объектов для

Предположим, что необходимо изучить множество объектов по какому-либо признаку. Большая совокупность объектов
исследования, называется генеральной сово­купностью.
Для генеральной совокупности можно оп­ределить генеральную среднюю — среднее арифметическое значение всех величин, составляющих эту совокупность.
Учиты­вая большой объем этой совокупности, можно полагать, что гене­ральная средняя равна математическому ожиданию.

 

Слайд 4

Рассеяние значений изучаемого признака генеральной сово­купности от их генеральной средней оценивают генеральной дис­персией,

Рассеяние значений изучаемого признака генеральной сово­купности от их генеральной средней оценивают генеральной
или генеральным сред­ним квадратическим отклонением.

Слайд 5

Рассеяние значений изучаемого признака генеральной сово­купности от их генеральной средней оценивают генеральной дис­персией,

Рассеяние значений изучаемого признака генеральной сово­купности от их генеральной средней оценивают генеральной
или генеральным сред­ним квадратическим отклонением.
где N — объем генеральной совокупности.

 

Слайд 6

Часто возникает ситуация, при которой изучить всю генеральную совокупность практически невозможно.
Тогда изучают

Часто возникает ситуация, при которой изучить всю генеральную совокупность практически невозможно. Тогда
не всю генеральную совокупность, а только ее часть и по полученным результатам делают вывод о всей генеральной совокупности и ее числовых характеристиках.

Слайд 7

Множество объектов, отобранные из генеральной совокупности, называются выборкой, или выборочной  совокупностью.
Свойство объектов выборки

Множество объектов, отобранные из генеральной совокупности, называются выборкой, или выборочной совокупностью. Свойство
должно соответствовать свойству объектов генеральной совокупности, или, как принято говорить, выборка должна быть представительной (репрезентативной).
Для дальнейшего изучения значений случайной величины служат числовые характеристики выборки.
Эти характеристики вычисляются по статистическим данным, т.е. данным, полученным в результате наблюдений, поэтому их называют статистическими.

Слайд 9

Для дискретной случайной величины X, принимающей конечное число значений, законом распределения в

Для дискретной случайной величины X, принимающей конечное число значений, законом распределения в
теории вероятностей считается таблица.
Необходимые нам характеристики находятся по следующим формулам

 

Слайд 12

Находятся они по тем же формулам, что и их аналоги, но, как

Находятся они по тем же формулам, что и их аналоги, но, как
мы уже упоминали, вероятность меняется на ее приближенное значение – относительную частоту.

 

Слайд 13

Указанные характеристики дают хорошее приближение для математического ожидания и дисперсии изучаемой случайной

Указанные характеристики дают хорошее приближение для математического ожидания и дисперсии изучаемой случайной
величины.
Однако дисперсия имеет небольшую, но постоянную ошибку (говорят является смещенной оценкой).
Чтобы этого избежать, используют следующие исправленные оценки
Эти формулы называют точечными оценками числовых характеристик.

 

Слайд 16

Пусть мы имеем следующий набор данных.
Отметим, что
величина x представляет измерения диаметра

Пусть мы имеем следующий набор данных. Отметим, что величина x представляет измерения
древесного ствола у случайно выбранных деревьев, а
величина y измерения высоты того же дерева в метрах.

Слайд 17

Данные измерений очевидно содержат ошибки.
Сюда входят как ошибки измеряющих, так и

Данные измерений очевидно содержат ошибки. Сюда входят как ошибки измеряющих, так и
вытекающие из ограниченной точности приборов, используемых для измерений.
Мы разбиваем имеющиеся данные на несколько интервалов и на каждом интервале усредняем имеющиеся значения.
Это позволяет частично сгладить возможные ошибки. Процесс усреднения заключается в том, что мы рассматриваем сколько данных попало на интервал, но конкретные данные заменяем на их среднее.

Слайд 20

Завершая усреднение, выберем представителем каждого интервала его середину
и будем считать, что

Завершая усреднение, выберем представителем каждого интервала его середину и будем считать, что
она встретилась столько раз, сколько данных попало на данный интервал.
В результате получим следующий статистический закон распределения (дискретная таблица распределения частот)

 

Слайд 21

По интервальной таблице распределения частот построим гистограмму и полигон частот.

По интервальной таблице распределения частот построим гистограмму и полигон частот.

Слайд 22

Вычисление основных характеристик выборки.
Чтобы завершить предварительную обработку данных, по формулам, указанным выше,

Вычисление основных характеристик выборки. Чтобы завершить предварительную обработку данных, по формулам, указанным
найдем точечные оценки числовых характеристик

 

Слайд 24

По интервальной таблице распределения частот мы построили гистограмму и полигон частот.
Если получившаяся

По интервальной таблице распределения частот мы построили гистограмму и полигон частот. Если
конструкция похожа на «шапочку» как у графика плотности нормального закона мы выдвинем гипотезу о нормальном законе изучаемой случайной величины и, в дальнейшем, проверим это.
Если не похожа, то мы, используя рассмотренный далее критерий, убедимся в необоснованности предположения о нормальном распределении.

Слайд 28

После подсчетов получаем таблицу.

После подсчетов получаем таблицу.

Слайд 31

Результаты вычислений удобно представлять в виде таблицы.

Результаты вычислений удобно представлять в виде таблицы.

Слайд 34

Отыскание интервальных оценок параметров нормального распределения.
Найдём интервальные оценки математического ожидания и среднего

Отыскание интервальных оценок параметров нормального распределения. Найдём интервальные оценки математического ожидания и
квадратического отклонения генеральной совокупности Х.

Слайд 36

Сделаем окончательный вывод.
Проведенные исследования показали, что генеральная совокупность случайной величины x, выражающей

Сделаем окончательный вывод. Проведенные исследования показали, что генеральная совокупность случайной величины x,
диаметры ствола деревьев изучаемого лесного массива из которой взята выборка, распределена по нормальному закону, плотность вероятности которого
Среднее значение диаметра ствола деревьев у основания составляет 29,48 сантиметра, причем с вероятностью 0,95 оно лежит в интервале (28,15 ; 30,81),
Среднее отклонение сантиметра.
В основном (68%) значения диаметра ствола деревьев лежат в интервале (22,78 ; 36,18) сантиметра.

 

 

Слайд 38

КОРРЕЛЯЦИОННЫЙ АНАЛИЗ
Вернемся к исходным данным - двумерной случайной величине (X;Y).

КОРРЕЛЯЦИОННЫЙ АНАЛИЗ Вернемся к исходным данным - двумерной случайной величине (X;Y).

Слайд 39

Для каждой из двух случайных величин X и Y отдельно мы построили

Для каждой из двух случайных величин X и Y отдельно мы построили
интервальные и вариационные ряды, нашли числовые характеристики.

 

 

Слайд 40

Построим интервальную корреляционную таблицу.
По горизонтали отложим интервалы X, а по вертикали по

Построим интервальную корреляционную таблицу. По горизонтали отложим интервалы X, а по вертикали
Y. В ячейки таблицы запишем количество пар (X;Y) , для которых X попадает в интервал (Xi;Xi+1), а Y в интервал (Yi;Yi+1).
Например, первая пара (31,4; 7,64) по X попадает в интервал (29; 33), а по Y в интервал (6,52; 7,82).
Для контроля просуммируем строки и столбцы. Должны получиться интервальные ряды для каждой из двух случайных величин X и Y отдельно.

Слайд 41

Получаем интервальную корреляционную таблицу.

Получаем интервальную корреляционную таблицу.

Слайд 42

Заменив интервалы на их середины, получим вариационную корреляционную таблицу.

Заменив интервалы на их середины, получим вариационную корреляционную таблицу.

Слайд 44

В нашем примере

 

В нашем примере

Слайд 47

Уравнение линейной регрессии X на Y имеет вид

 

 

Уравнение линейной регрессии X на Y имеет вид

Слайд 48

На одних осях координат построим три графика:
корреляционное поле (пары (X;Y) указанные в

На одних осях координат построим три графика: корреляционное поле (пары (X;Y) указанные
задании) – на графике изображаются точками,
график линейной регрессии Y на X – прямая Y(x),
график линейной регрессии X на Y– прямая X(y).