Закон больших чисел и предельные теоремы

Содержание

Слайд 2

Под законом больших чисел (ЗБЧ) в широком смысле понимается общий принцип, согласно

Под законом больших чисел (ЗБЧ) в широком смысле понимается общий принцип, согласно
которому, по формулировке академика Колмогорова А.Н., совокупное действие большого числа случайных факторов приводит (при некоторых весьма общих условиях) к результату, почти не зависящему от случая.
Др. словами, при большом числе случайных величин их средний результат перестает быть случайным и моет быть предсказан с большой степенью определенности.
Под ЗБЧ в узком смысле понимается ряд математических теорем, в каждой из которых для тех или иных условий устанавливается факт приближения средних характеристик большого числа испытаний к некоторым определенным постоянным.

Слайд 3

Неравенство Маркова (лемма Чебышева)

(1)

Вероятность того, что случайная величина Х примет значение больше

Неравенство Маркова (лемма Чебышева) (1) Вероятность того, что случайная величина Х примет
А, меньше или равно частного от деления математического ожидания этой СВ на число А.

Слайд 5

Неравенство Чебышева

(2)

Вероятность того, что случайная величина отклониться от своего математического ожидания на

Неравенство Чебышева (2) Вероятность того, что случайная величина отклониться от своего математического
величину меньше или равна частного от деления дисперсии этой величины на

(3)

Слайд 6

Неравенство Чебышева для некоторых случайных величин

Неравенство Чебышева для некоторых случайных величин

Слайд 7

Пример 2.

(3)

Пример 2. (3)

Слайд 8

Теорема Чебышева

(6)

Опуская доказательство, получаем неравенство

(7)

(6)

(7)

(8)

Теорема Чебышева (6) Опуская доказательство, получаем неравенство (7) (6) (7) (8)

Слайд 9

Хотя мы и не можем предсказать конкретное значение случайной величины, мы можем с

Хотя мы и не можем предсказать конкретное значение случайной величины, мы можем
вероятностью, близкой к единице, определить её среднее арифметическое, чего будет более чем достаточно на практике.

Суть теоремы Чебышева:

Отдельные независимые случайные величины могут принимать значения, далекие от своих математических ожиданий, среднее арифметическое достаточно большого числа случайных величин с большой вероятностью принимает значения, близкие к средней арифметической их математических ожиданий 

Слайд 10

Примеры применения теоремы Чебышева
в реальной жизни

1. Проведение измерений: при достаточно большом количестве

Примеры применения теоремы Чебышева в реальной жизни 1. Проведение измерений: при достаточно
измерений, например, напряжения в сети, можно получить значение, сколько угодно близкое к истинному.
2. Проверка качества. Нет необходимости, например, проверять всю партию однообразных товаров, а достаточно выборочной проверки.
3. Страхование. Рассматривая величину страхового взноса, страховщик обладает определенной информацией о вероятности наступления страховых случаев и возможных потерях клиента от них. По теореме Чебышева найдя среднее арифметическое от этих убытков, страховщик может определить идеальную величину страхового взноса: выгодную для него и привлекательную для клиента.
4. Финансовые рынки. Проведение большого числа финансовых операций с известной средней ожидаемой доходностью лежит в основе диверсификации рисков.

Слайд 12

Теорема Бернулли и теорема Пуассона

Теорема Бернулли и теорема Пуассона

Слайд 13

Теорема Бернулли дает теоретическое обоснование замены неизвестной вероятности события его частостью, или

Теорема Бернулли дает теоретическое обоснование замены неизвестной вероятности события его частостью, или
статической вероятностью, полученной в n повторных независимых испытаниях, проводимых при одном и том же комплексе условий (см. лекция №1).

Важная роль закона больших чисел в теоретическом обоснование методов математической статистики и ее приложений обусловила проведение ряда исследований, направленных на изучение общих условий применимости этого закона к последовательности случайных величин.
Нахождение общих условий, выполнение которых обязательно влечет за собой статистическую устойчивость средних, представляет непреходящую научную ценность исследований в области закона больших чисел.

Слайд 14

Центральная предельная теорема

Центральная предельная теорема

Слайд 16

Теорема позволяет утверждать, что всегда, когда случайная величина образуется в результате сложения

Теорема позволяет утверждать, что всегда, когда случайная величина образуется в результате сложения
большого числа независимых случайных величин, дисперсии которых малы по сравнению с дисперсией суммы, закон распределения этой случайной величины оказывается практически нормальным законом.

(11)

Слайд 17

Математическая статистика

Математическая статистика выделяется из теории вероятностей в самостоятельную область, хотя основные

Математическая статистика Математическая статистика выделяется из теории вероятностей в самостоятельную область, хотя
методы и приемы рассуждений в ней остаются теми же самыми. Причиной этого является специфичность задач математической статистики, являющихся в известной мере обратными к задачам теории вероятностей.

Если в теории вероятностей мы исходным материалом имели вероятностную модель случайного явления и на ее основе рассчитывали возможные реализации данного случайного явления, то в математической статистике мы, наоборот, имеем некоторую реализацию случайного явления и по этой реализации устанавливаем вероятностную модель с целью получения возможности рассчитывать любые другие возможные его реализации, прогнозировать данное явление.

Слайд 18

В качестве реализации случайного явления или случайного события
выступают так называемые статистические данные.

В качестве реализации случайного явления или случайного события выступают так называемые статистические
В большинстве случаев исходные статистические данные — результат наблюдений некоторого признака, являющегося СВ или характеризующегося системой случайных величин

Совокупность всех возможных реализаций исследуемой СВ или системы случайных величин называется генеральной совокупностью (ГС).

Примерами ГС могут служить множество рабочих данного цеха при изучении вопроса о качестве выпускаемой продукции, множество населения страны при исследовании ее трудовых ресурсов и т.д.

Генеральная совокупность

Слайд 19

Пусть требуется изучить некоторую ГС. Для этого можно провести
сплошное обследование. Однако если

Пусть требуется изучить некоторую ГС. Для этого можно провести сплошное обследование. Однако
число объектов ГС велико, то осуществить указанное обследование чрезвычайно сложно. Поэтому для изучения ГС применяется выборочный метод, суть которого состоит в том, что обследованию подвергают не все элементы ГС, а только часть их, случайно выбранную из данной совокупности. Выводы, полученные при исследовании этой части, распространяются на всю ГС.

Множество элементов ГС, случайным образом выбранных из нее, называется выборкой, а число их — объемом выборки.

Очевидно, главное требование к выборке — она должна хорошо представлять ГС, т.е. должна быть репрезентативной.
Выборка будет репрезентативной, если ее выбирать случайным образом и в достаточном объеме.
Основной недостаток выборочного метода – ошибки исследования, называемые ошибками репрезентативности.

Выборка

Слайд 21

Если значения выборки записать в неубывающем порядке, то получим последовательность, называемую вариационным

Если значения выборки записать в неубывающем порядке, то получим последовательность, называемую вариационным
рядом, а x(i) называются вариантами.
Разность между крайними членами вариационного ряда
называется размахом варьирования.

Вариационный ряд может быть дискретный или интервальный.

Вариационный ряд

Слайд 22

Дискретный вариационный ряд — это ряд, в основу построения которого положен признак

Дискретный вариационный ряд — это ряд, в основу построения которого положен признак
с прерывным изменением (число рабочих на предприятии, число детей в семье и т.д.).
Этот признак может принимать только конечное число фиксированных значений.

Очевидно, сумма частот равна объему выборки n.

Слайд 23

Если признак имеет непрерывное изменение, т.е. значения могут отличаться одно от другого

Если признак имеет непрерывное изменение, т.е. значения могут отличаться одно от другого
на сколь угодно малую величину и в определенных границах могут принимать любые значения (заработная плата рабочих, размер среднего душевого денежного дохода, стоимость основных фондов предприятия), то для этого признака нужно строить интервальный вариационный ряд.
Таблица здесь также имеет две графы. В первой указывается значение признака в интервале .от — до, во второй — число выборочных значений, входящих в соответствующий интервал (частоты):

Слайд 24

Построение интервального ряд

Относительной частотой называется величина

где n — объем выборки, а

Построение интервального ряд Относительной частотой называется величина где n — объем выборки,
ni — частота выборочного значения xi

Накопленной частотой называется величина

Показывающая, сколько наблюдалось вариантов со значением признака меньшим x.

Слайд 25

Полигон относительных частот служит для изображения дискретного вариационного ряда.

Гистограмма служит для изображения

Полигон относительных частот служит для изображения дискретного вариационного ряда. Гистограмма служит для изображения интервального вариационного ряда.
интервального вариационного ряда.

Слайд 26

Числовые характеристики выборочного распределения назовем выборочными или эмпирическими характеристиками.

Числовые характеристики выборочного распределения назовем выборочными или эмпирическими характеристиками.

Слайд 27

Средние величины

Средние величины

Слайд 28

Средние величины

Средние величины

Слайд 29

Средние величины

Средние величины

Слайд 30

Показатели вариации

Показатели вариации

Слайд 31

Если выборка представлена в виде интервального вариационного ряда, то для вычисления выборочных

Если выборка представлена в виде интервального вариационного ряда, то для вычисления выборочных
среднего и дисперсии вначале нужно определить середины интервалов а затем находить их по формулам в которые вместо xi подставить xi* .

Слайд 32

Свойства дисперсии

Свойства дисперсии

Слайд 36

Пример 1. Имеются данные о торгах акций некоторого акционерного общества на фондовой

Пример 1. Имеются данные о торгах акций некоторого акционерного общества на фондовой
бирже. Количество проданных акций по курсу продаж распределилось следующим образом:

Найдем оценки среднего и дисперсии курса продаж акции

Решение. В качестве оценок возьмем выборочные среднюю и дисперсию.

Слайд 37

Пример 2. По результатам выборочного исследования рабочих цеха были установлены их квалификационные разряды:

Пример 2. По результатам выборочного исследования рабочих цеха были установлены их квалификационные
4, 5, 6, 4, 4, 2, 3, 5, 4, 4, 5, 2, 3, 3, 4, 5, 5, 2, 3, 6, 5, 4, 6, 4, 3. Требуется:
– составить вариационный ряд и построить полигон частот; – найти относительные частоты и построить эмпирическую функцию распределения.
– найти среднее и дисперсию
Решение.

Слайд 38

Найдём относительные частоты

и накопленные частоты

Найдём относительные частоты и накопленные частоты

Слайд 40

Пример 3. По результатам исследования цены некоторого товара в различных торговых точках

Пример 3. По результатам исследования цены некоторого товара в различных торговых точках
города, получены следующие данные (в некоторых денежных единицах):

Требуется составить вариационный ряд распределения

Решение. Сначала окидываем взглядом предложенные числа и определяем примерный интервал, в который вписываются эти значения. «Навскидку» все значения заключены в пределах от 5 до 11. Далее делим этот интервал на удобные подынтервалы, в данном случае напрашиваются промежутки единичной длины.

Слайд 41

Вычислим размах вариаци:

Теперь его нужно разбить на частичные интервалы. Сколько интервалов рассмотреть? По умолчанию

Вычислим размах вариаци: Теперь его нужно разбить на частичные интервалы. Сколько интервалов
на этот счёт существует формула Стерджеса (см. выше): 

m=5 k=0.96

K можно не округлять и использовать длину 0,96, но удобнее, 1.

И коль скоро мы прибавили 0,04, то по 5 частичным интервалам у нас получается «перебор»:  0,04∙5=0,2. Поэтому от самой малой варианты 5,8 отмеряем влево 0,1 влево (половину «перебора») и к значению 5,7 начинаем прибавлять по 1 , получая тем самым частичные интервалы.

При этом сразу рассчитываем их середины.

Слайд 42

Убеждаемся в том, что самая большая варианта 10,6 вписалась в последний частичный интервал

Убеждаемся в том, что самая большая варианта 10,6 вписалась в последний частичный
и отстоит от его правого конца на 0,1.

Далее подсчитываем частоты по каждому интервалу. Для этого в черновой «таблице» обводим значения, попавшие в тот или иной интервал, подсчитываем их количество и вычёркиваем:

Правило: если варианта попадает на «стык» интервалов, то её следует относить в правый интервал. У нас такая варианта встретилась одна: 8,7 – и её нужно причислить к интервалу (8,7;9,7)

Слайд 43

В результате получаем интервальный вариационный ряд, при этом обязательно убеждаемся в том,

В результате получаем интервальный вариационный ряд, при этом обязательно убеждаемся в том,
что ничего не потеряно (n=30) и рассчитываем относительные частоты по каждому интервалу.

Гистограмма относительных частот – это фигура, состоящая из прямоугольников, ширина которых равна длинам частичных интервалов, а высота – соответствующим относительным частотам:

 Полигон относительных частот – это ломаная, соединяющая соседние точки 

середины интервалов: