Выборочный метод в статистике

Март 8, 2021

Главная
Обществознание
Выборочный метод в статистике

Содержание

2. Выборочным называется такое наблюдение, при котором: а) характеристика всей совокупности единиц дается по некоторой их части;
3. Одно из главных условий выборочного наблюдения заключается в том, что при отборе единиц совокупности для обследования
4. Совокупность явлений, из которой производится выбор части для непосредственного изучения называется генеральной совокупностью (N), отобранная часть
5. Относительные величины применяют для сводной характеристики совокупностей по альтернативному признаку; такая характеристика дается в виде доли
6. Этот сводный показатель для генеральной совокупности называется генеральной долей, или долей в генеральной совокупности (р), а
7. Перед выборочным исследованием может также стоять задача измерения среднего значения варьирующего признака во всей совокупности. В
8. Между характеристиками выборочной совокупности и искомыми характеристиками генеральной совокупности, как правило, существует некоторое расхождение, которое называют
9. Ошибки репрезентативности присущи только несплошным наблюдениям и представляют собой расхождение между величиной полученных по выборке показателей
10. Систематические ошибки могут возникать в связи с особенностями принятой системы отбора и обработки данных наблюдения или
11. Классификация способов отбора единиц из генеральной совокупности. Способы отбора единиц в выборочную совокупность классифицируются по различным
12. По числу одновременно отбираемых единиц различаются индивидуальный, групповой и комбинированный отбор. При индивидуальном отборе выбираются единицы,
13. Методы отбора Для того чтобы выборка была репрезентативной, отбор единиц из генеральной совокупности должен быть соответствующим
14. В практике выборочного наблюдения наиболее широко распространен механический отбор, который представляет собой последовательный отбор единиц через
15. При этом расположение единиц генеральной совокупности в списке (или на месте наблюдения) может быть двояким -
16. В статистической практике также часто применяется районированный (типический, стратифицированный) отбор. Как правило, социально-экономические явления характеризуются большим
17. Для этого общий список единиц генеральной совокупности в целом предварительно разбивается на отдельные списки, каждый из
18. Таким образом, при проведении типической выборки необходимо разбить общий объём выборки "n" между группами и определить
19. 2. Возможен и другой вариант, когда из каждой группы отбирают одинаковое число единиц, т.е. где k
20. Здесь пропорция отбора для групп с большой колеблемостью признака увеличивается, что в свою очередь приводит к
21. В практике выборочного наблюдения применяется гнездовой (серийный, кластерный) отбор. В этом случае в случайном порядке отбираются
22. Особым видом выборочного наблюдения является моментное наблюдение. Суть его состоит в том, что на определенные моменты
23. Рассмотренные способы отбора, осуществляются путём одноступенчатой выборки. Однако можно сформировать выборочную совокупность в два этапа: сначала
24. При многоступенчатом отборе на всех ступенях, кроме последней, осуществляется только отбор, а наблюдение единиц производится только
25. Например, при текущем изучении бюджетов служащих единицей наблюдения является семья, формирование выборочной совокупности производится путём отбора
26. Иногда в целях экономии средств удобно анализировать данные по некоторым интересующим нас признакам на основании изучения
27. При наличии нескольких подвыборок можно говорить о многофазном отборе. Многофазный отбор отличается от многоступенчатого тем, что
28. Многофазным отбором пользуются в тех случаях, когда число единиц, необходимых для определения отдельных показателей с заданной
29. Часто бывает целесообразно взять из изучаемой совокупности две или несколько независящих друг от друга выборок, применяя
30. Все рассмотренные виды отбора (кроме механического) могут быть повторными и бесповторными. Повторный – это такой отбор,
31. Ошибки выборочного наблюдения. Очевидно, что из генеральной совокупности можно сделать большое число одинаковых выборок, по которым
32. Можно предвидеть размеры этих расхождений. Фактические ошибки выборки могут быть оценены посредством сопоставления их со средними
33. При изучении долей признака (относительных показателей) формула средней ошибки имеет вид: где, - средняя ошибка доли;
34. Средние ошибки выражаются в разных физических единицах, они различны по абсолютной величине. В статистике с целью
35. Нас интересует количество баллов набранных студентами факультета на занятиях по предмету Х в семестре. Предмет Х
36. При правильно проведенной выборке в числе отображенных 200 студентов должны оказаться представители всех групп, численностью, соответствующей
37. Рассчитаем среднее число баллов у 2000 студентов. Среднее число баллов по 200 студентам составит:
38. Показатели по выборочной и генеральной совокупности могут совпадать лишь в редчайших случаях. Разница между ними при
39. При расчете относительных показателей ошибки репрезентативности представляют собой разность между долями одного признака в генеральной и
40. Таким образом, доля москвичей в выборочной совокупности составляла 0,45 (90/200), а в генеральной совокупности – 0,47
41. Вычислим дисперсию средней: таким образом Поскольку среди 2000 студентов 940 москвичей, то p=940/2000=0,47, откуда средняя ошибка
42. Значит, если средний балл составил 109 , а средняя ошибка ( ) - 0,85 балла, то
43. Методами математической статистики и теории вероятностей доказано, что генеральная средняя не выйдет за пределы, равные величине
44. Итак, при вероятности 0,6827 (t=1) в 6827 выборках из 10000 фактическая ошибка не превысит 0,85 балла.
45. Это означает, что в 9545 из 10000 выборок средний балл по генеральной совокупности не выйдет за
46. Для величины t и p составлены подробные таблицы соответствующих вероятностей. Приведенные выше формулы относятся к повторному
47. Факторы, определяющие величину предельной ошибки: 1) Вариация (колеблемость) изучаемого признака и p(1-p). Размер ошибки прямо пропорционален
48. 3) Способ отбора единиц в выборочную совокупность (повторный или бесповторный), так как общий объем выборки (n)
49. 4) Численность выборки. Ошибка выборки зависит в большей степени от абсолютной численности выборки и в меньшей
50. Пусть дисперсия в обоих случаях равна 25. Тогда в первом случае при 5 %-ом отборе ошибка
51. Предположим теперь, что численность выборки увеличили до 625 наблюдений при генеральной совокупности в 225000 единиц. В
52. Таким образом, увеличив численность выборки в 2,8 раза при той же численности генеральной совокупности в 225000
53. Любая формула предельной ошибки принципиально позволяет решать задачи трех видов: 1) определить предел возможной ошибки средней
54. 3) определить вероятность того, что в проведенной выборке ошибка будет заключаться в заданных пределах. Решение той
55. Продолжим рассмотрение примера с выборкой 200 студентов из 2000 при условии, что отбор студентов произведен механическим
56. Таким образом, с вероятностью 0,9545 можно утверждать, что по совокупности 2000 студентов средний балл будет находиться
57. Предположим, что предел 1,62 нас не устраивает. Можно подсчитать, какую численность выборки следует взять, чтобы предельная
58. С другой стороны уменьшения предела ошибки с 1,62 до 1 можно добиться уменьшением t и связанной
59. Далее в условиях механического отбора с вероятностью 0,9545 рассчитаем пределы, в каких должна оказаться в генеральной
60. До сих пор при решении задачи на выборку 200 студентов из 2000 в формулах ошибок выборки
61. В математической статистике доказывается, что: В случае выборки большого размера поправочный коэффициент n/(n-1) близок к 1
62. Таким образом, пределы, в которых находится величина показателя по генеральной совокупности устанавливаются следующим образом: сначала находятся
63. Теория средних и предельных ошибок, рассмотренная выше справедлива для обычных выборок достаточно большого объема. Однако такие
64. Формулы для определения предельных ошибок малой выборки для повторного отбора будут такими: Для оценки возможных пределов
65. Организация и практика применения выборочного метода наблюдения. Организация выборочного наблюдения предполагает решение нескольких вопросов: 1. Определение
66. 1. Определение единиц отбора. Единицы для исследования отбираются из определенного круга явлений, составляющих "основу выборки". В
67. 3. Определение численности выборочной совокупности. Как известно в формулах предельных ошибок лишь n, и t выступают
68. Действительно, приступая к выборке необходимо хотя бы ориентировочно знать допустимые пределы, в которых могут находиться возможные
69. Далее расчет численности выборки сталкивается со следующими трудностями: хотя и p(1 - p) или и w(1-w)
70. 1) используется установленная ранее по данным какого-либо предыдущего наблюдения. Однако это целесообразно лишь в случае, когда
71. Так как вероятность при t=3 достигает 0,9973, то считается, что отклонение от в пределах вполне гарантирует
73. Скачать презентацию

Выборочным называется такое наблюдение, при котором:
а) характеристика всей совокупности единиц дается по некоторой

их части;
б) эта часть включает в себя определенное число единиц совокупности отобранных в случайном порядке;
в) характеристика совокупности лежит в известных удовлетворяющих исследователя пределах.

Одно из главных условий выборочного наблюдения заключается в том, что при отборе

единиц совокупности для обследования обеспечивается равная возможность попадания в отобранную часть любой из единиц. Это достигается путём беспристрастного строго случайного отбора, организуемого по схемам предлагаемым математической статистикой.
Другим важным условием является то, что уже при организации выборочного наблюдения устанавливается численность или доля единиц совокупности, которая будет подвергнута обследованию.
Рассмотренные условия позволяют установить границы возможных ошибок и получить практически достоверные данные, поскольку эти ошибки могут быть учтены.

Слайд 4

Совокупность явлений, из которой производится выбор части для непосредственного изучения называется генеральной

совокупностью (N), отобранная часть – выборочной совокупностью (n).
При выборочном наблюдении имеют дело с двумя категориями обобщающих показателей:
- относительными величинами
- средними величинами.

Слайд 5

Относительные величины применяют для сводной характеристики совокупностей по альтернативному признаку; такая характеристика

дается в виде доли тех единиц совокупности, которые обладают интересующим признаком. Например, при изучении демографической структуры населения определяют долю состоящих в браке. Во всех подобных случаях мы будем иметь дело с обобщающим показателем в виде относительной доли единиц, составляющих какую-то часть всей совокупности.

Слайд 6

Этот сводный показатель для генеральной совокупности называется генеральной долей, или долей в

генеральной совокупности (р), а для выборочной совокупности – выборочной долей, или частостью (w).
Задача, таким образом, заключается в том, чтобы на основе выборочной доли дать правильное представление о доле в генеральной совокупности.

Слайд 7

Перед выборочным исследованием может также стоять задача измерения среднего значения варьирующего признака

во всей совокупности. В этом случае среднее значение варьирующего признака во всей совокупности называется генеральной средней ( ), а среднее значение признака у единиц, которые подверглись выборочному наблюдению, - выборочной средней ( ). Здесь задача будет заключаться в том, чтобы на основе выборочной средней дать правильное представление о средней генеральной.

Слайд 8

Между характеристиками выборочной совокупности и искомыми характеристиками генеральной совокупности, как правило, существует

некоторое расхождение, которое называют ошибкой.
Общая величина возможной ошибки выборочной характеристики слагается из ошибок регистрации и ошибок репрезентативности.

Слайд 9

Ошибки репрезентативности присущи только несплошным наблюдениям и представляют собой расхождение между величиной

полученных по выборке показателей и величиной этих показателей, если бы они были получены при сплошном наблюдении, проведенном с той же степенью точности.
Ошибки репрезентативности могут быть
- систематическими
- случайными.

Слайд 10

Систематические ошибки могут возникать в связи с особенностями принятой системы отбора и

обработки данных наблюдения или в связи с нарушением установленных правил отбора.
Возникновение случайных ошибок репрезентативности объясняется недостаточно равномерным представлением в выборочной совокупности различных категорий единиц генеральной совокупности, в силу чего распределение отобранной совокупности единиц не вполне точно воспроизводит распределение единиц генеральной совокупности.

Слайд 11

Классификация способов отбора единиц из генеральной совокупности.
Способы отбора единиц в выборочную совокупность

классифицируются по различным признакам:
число одновременно отбираемых единиц,
метод отбора,
число ступеней отбора,
детализированность программы наблюдения.

Слайд 12

По числу одновременно отбираемых единиц различаются индивидуальный, групповой и комбинированный отбор. При

индивидуальном отборе выбираются единицы, групповом – качественно однородные группы или серии. Комбинированный отбор – сочетание индивидуального и группового.

Слайд 13

Методы отбора
Для того чтобы выборка была репрезентативной, отбор единиц из генеральной

совокупности должен быть соответствующим образом организован.
Исторически и логически первым сложился так называемый собственно-случайный отбор, то есть, отбор единиц из всей генеральной совокупности посредством жеребьевки или какого-либо иного способа (жеребьевки, таблица случайных чисел).

Слайд 14

В практике выборочного наблюдения наиболее широко распространен механический отбор, который представляет собой

последовательный отбор единиц через равные промежутки из определенного расположения их в генеральной совокупности. Промежутки определяются в соответствии с долей отбора (каждая пятая, десятая единица и т.д.). Принцип случайного отбора в механической выборке обеспечивается тем, что единицы генеральной совокупности располагаются в таком порядке, который не оказывает никакого влияния на поведение интересующего нас признака.

Слайд 15

При этом расположение единиц генеральной совокупности в списке (или на месте наблюдения)

может быть двояким
- упорядоченным или
- не упорядоченным относительно изучаемого признака.
Так, если нас интересует успеваемость студентов, то расположение их по алфавиту будет не упорядоченным, так как успеваемость никак не зависит от начальной буквы фамилии.

Слайд 16

В статистической практике также часто применяется районированный (типический, стратифицированный) отбор.
Как правило, социально-экономические

явления характеризуются большим разнообразием и не являются достаточно однородным в отношении изучаемых признаков. При наличии в составе генеральной совокупности различных типов явления с разными уровнями признаков надо так организовать выборку, чтобы обеспечить более равномерное представительство в выборочной совокупности различных частей (типов) явления.

Слайд 17

Для этого общий список единиц генеральной совокупности в целом предварительно разбивается на

отдельные списки, каждый из которых включает единицы, принадлежащие к одной однородной по определенному признаку группе (типу). В качестве типов (районов) могут быть взяты сложившиеся группы – республики, области, предприятия, цеха и т.д. или группы образованные специально (рыночные сегменты). Другими словами, типическая выборка опирается на статистическую группировку – по одному признаку или по комбинации нескольких. Из каждой выделенной группы в случайном порядке отбирается некоторое количество единиц.

Слайд 18

Таким образом, при проведении типической выборки необходимо разбить общий объём выборки "n"

между группами и определить число подлежащих наблюдению единиц в группе.
Это делается тремя способами:
1. наиболее часто применяется так называемое пропорциональное размещение, в этом случае количество отбираемых в выборку единиц пропорционально удельному весу данной группы в генеральной совокупности, при этом число наблюдений по группе определяется по формуле:
где,
ni - число наблюдений из i –й типической группы.
n - общий объём выборки,
Ni - объём i –й типической группы в ген. совокупности,
N - объём генеральной совокупности.

Слайд 19

2. Возможен и другой вариант, когда из каждой группы отбирают одинаковое число единиц,

т.е. где k – число выделенных типических групп. 3. Третий вариант учитывает также и степень вариации признака в различных группах генеральной совокупности, а расчёт объёма выборки из каждой группы производится по формуле:
где - среднее квадратическое отклонение изучаемого признака в i–й группе.

Слайд 20

Здесь пропорция отбора для групп с большой колеблемостью признака увеличивается, что в

свою очередь приводит к соответствующему уменьшению возможной случайной ошибки в определении групповой средней.
Таким образом, при типическом отборе в выборку попадают представители всех типических групп, поэтому вероятность получить большую точность выборки здесь больше, чем при простой случайной выборке.

Слайд 21

В практике выборочного наблюдения применяется гнездовой (серийный, кластерный) отбор.
В этом

случае в случайном порядке отбираются не единицы, а целые гнёзда (серии) единиц совокупности, которые подвергаются сплошному обследованию.
Получающаяся в процессе этого отбора случайная ошибка выборки в подавляющем большинстве случаев больше, чем при любом другом способе отбора.

Слайд 22

Особым видом выборочного наблюдения является моментное наблюдение. Суть его состоит в

том, что на определенные моменты времени фиксируется наличие отдельных элементов изучаемого процесса.
Моментное наблюдение, в частности, применяется для изучения использования рабочего времени. В этих случаях в момент наблюдения фиксируется, находился ли работник (объект) в процессе работы или в простое. Моментное наблюдение охватывает всех работников фирмы (цеха) и в этом смысле является сплошным. Выборочное же оно потому, что охватывает не всё время работы цеха (смены), а лишь моменты, в которые осуществляется контроль.

Слайд 23

Рассмотренные способы отбора, осуществляются путём одноступенчатой выборки.
Однако можно сформировать выборочную совокупность

в два этапа:
сначала в случайном порядке выбираются подлежащие обследованию серии, а
затем из каждой отработанной серии в случайном порядке отбирается определённое количество единиц, подлежащих непосредственному наблюдению. Ошибка такой выборки будет зависеть от ошибки серийного отбора и от ошибки индивидуального отбора, т.е. такой отбор даёт, как правило, менее точные результаты, что объясняется возникновением ошибок репрезентативности на каждой ступени выборки.

Слайд 24

При многоступенчатом отборе на всех ступенях, кроме последней, осуществляется только отбор, а

наблюдение единиц производится только на последней ступени.
При многоступенчатой выборке единицы отбора на первых ступенях обычно представляют собой организационные единства единиц наблюдения и на разных ступенях применяются единицы отбора разных порядков.

Слайд 25

Например, при текущем изучении бюджетов служащих единицей наблюдения является семья, формирование выборочной

совокупности производится путём отбора сначала отраслей, потом предприятий, а затем лиц, работающих на предприятиях (членов семей).
Поэтому число ступеней отбора определяется числом типов единиц отбора, при этом на каждой последующей ступени единица отбора по своим масштабам уменьшаются и только на конечной, единица отбора совпадает с единицей выборочной совокупности.

Слайд 26

Иногда в целях экономии средств удобно анализировать данные по некоторым интересующим нас

признакам на основании изучения всех единиц выборочной совокупности, а по другим признакам – на основании части единиц выборочной совокупности, которые представляют подборку из единиц первоначальной выборки. Этот способ называют двухфазным отбором.

Слайд 27

При наличии нескольких подвыборок можно говорить о многофазном отборе.
Многофазный отбор отличается

от многоступенчатого тем, что при многофазном на каждой фазе пользуются одними и теми же единицами отбора, тогда как при многоступенчатом на разных ступенях применяются единицы отбора разных порядков.

Слайд 28

Многофазным отбором пользуются в тех случаях, когда число единиц, необходимых для определения

отдельных показателей с заданной точностью, весьма различно, как вследствие различий в степени колеблемости взаимосвязанных переменных, так и вследствие того, что для различных показателей требуется разная точность. Ошибки при многофазной выборке рассчитывают на каждой фазе отдельно.

Слайд 29

Часто бывает целесообразно взять из изучаемой совокупности две или несколько независящих друг

от друга выборок, применяя для получения каждой из них один и тот же способ отбора.
Такие выборки называют взаимопроникающими. Их преимущество в том, что они позволяют получить отдельные и независимые оценки тех или иных признаков изучаемой совокупности.

Слайд 30

Все рассмотренные виды отбора (кроме механического) могут быть повторными и бесповторными.
Повторный –

это такой отбор, при котором однажды попавшая в выборку единица генеральной совокупности при последующих испытаниях снова имеет возможность попасть в выборку.
При бесповторном отборе однажды попавшая в выборку единица не участвуют в последующих испытаниях.
При повторном отборе вероятность попасть в выборку для отдельной единицы совокупности в продолжение всего отбора не меняется, при бесповторном – эта вероятность изменяется после выбора каждой единицы.

Слайд 31

Ошибки выборочного наблюдения.
Очевидно, что из генеральной совокупности можно сделать большое число

одинаковых выборок, по которым расхождение фактической средней (или доли) с генеральной средней (или долей) будет случайным, так как каждая из выборок складывается под влиянием случайных факторов.

Слайд 32

Можно предвидеть размеры этих расхождений. Фактические ошибки выборки могут быть оценены посредством

сопоставления их со средними ошибками. Методами теории вероятностей установлено, что средняя ошибка выборки при изучении средних показателей определяется по формуле:
где - средняя ошибка выборки.
- дисперсия признака x (варьирующего) в генеральной совокупности.
n - численность выборочной совокупности

Слайд 33

При изучении долей признака (относительных показателей) формула средней ошибки имеет вид:
где,
-

средняя ошибка доли;
p - доля признака в генеральной совокупности;
p(1 - p) - дисперсия доли изучаемого признака.

Слайд 34

Средние ошибки выражаются в разных физических единицах, они различны по абсолютной величине.

В статистике с целью сравнимости абсолютные величины представляются в относительном виде.
В теории выборки средние ошибки выражаются в известных стандартных единицах t (коэффициент кратности ошибки, коэффициент доверия), зависящий от вероятности с которой можно гарантировать, что предельная ошибка не превысит t – краткую среднюю ошибку.

Слайд 35

Нас интересует количество баллов набранных студентами факультета на занятиях по предмету Х

в семестре. Предмет Х изучает 2000 человек. Выборка - 200 чел.

Слайд 36

При правильно проведенной выборке в числе отображенных 200 студентов должны оказаться представители

всех групп, численностью, соответствующей приблизительно 1/10 численности соответствующих групп в генеральной совокупности.

Слайд 37

Рассчитаем среднее число баллов у 2000 студентов.
Среднее число баллов по 200

студентам составит:

Слайд 38

Показатели по выборочной и генеральной совокупности могут совпадать лишь в редчайших случаях.

Разница между ними при условии, что отбор в выборочную совокупность произведен правильно, и будет случайной ошибкой выборки. В нашем примере фактическая случайная ошибка = 1 балл (109-108).

Слайд 39

При расчете относительных показателей ошибки репрезентативности представляют собой разность между долями одного

признака в генеральной и выборочной совокупностях. Допустим, среди отобранных 200 студентов москвичей оказалось 90 чел., а среди 2000 – 940 чел.

Слайд 40

Таким образом, доля москвичей в выборочной совокупности составляла 0,45 (90/200), а в

генеральной совокупности – 0,47 (940/2000). Разность между 0,45 и 0,47 (0,02) является фактической случайной ошибкой доли.
Теперь воспользуемся приведёнными формулами и исчислим средние ошибки выборки по среднему баллу и доле москвичей среди 2000 студентов.

Слайд 41

Вычислим дисперсию средней:
таким образом
Поскольку среди 2000 студентов 940 москвичей, то p=940/2000=0,47,

откуда средняя ошибка доли будет:

Слайд 42

Значит, если средний балл составил 109 , а средняя ошибка ( )

- 0,85 балла, то средний балл по генеральной совокупности можно ожидать в пределах 109 0,85, то есть от 108,15 до 109,85.

Слайд 43

Методами математической статистики и теории вероятностей доказано, что генеральная средняя не выйдет

за пределы, равные величине одной средней ошибки, не во всех возможных выборках, а лишь в 6827 выборках из 10000, то есть сформулированное положение об ожидаемых пределах можно утверждать лишь с вероятностью 0,6827.
Величина вероятности (p) 0,6827 представляет собой величину интеграла вероятности Лапласа (Ф(t)) при t = 1.
Вероятность p иногда называют доверительной вероятностью, при обследовании общественных явлений её величину обычно принимают в пределах от 0,90 до 0,99.

Слайд 44

Итак, при вероятности 0,6827 (t=1) в 6827 выборках из 10000 фактическая ошибка

не превысит 0,85 балла. По нашей же выборке из 200 студентов фактическая ошибка составила 1 балл, то есть эта выборка входит в число остальных 3173 выборок из 10000. Такая вероятность вряд ли может устроить. Чтобы повысить её, приходится расширять пределы возможных ошибок, увеличивая t. Например, при t=2 генеральная средняя не выйдет уже за пределы, равные двум средним ошибкам; вероятность этого утверждения повышается до 0,9545, а при t=3 вероятность становится 0,9973.

Слайд 45

Это означает, что в 9545 из 10000 выборок средний балл по генеральной

совокупности не выйдет за пределы
109 2 0,85 = 109 1,7,
а в 9973 выборках не выйдет за пределы
3 0,85=109 2,55.
Результаты расчетов уже при вероятности 0,99 (t=2,58) можно считать практически достоверными.
Средняя ошибка, умноженная на принятый коэффициент доверия (t), носит название предельной ошибки выборки .

Слайд 46

Для величины t и p составлены подробные таблицы соответствующих вероятностей. Приведенные выше

формулы относятся к повторному собственно-случайному отбору. При бесповторном отборе в подкоренное выражение вводится дополнительный множитель (1-n/N), где n/N – доля отобранных единиц в генеральной совокупности:
Следовательно для бесповторной выборки формулы предельных ошибок примут вид для средней:
для доли

Слайд 47

Факторы, определяющие величину предельной ошибки:
1) Вариация (колеблемость) изучаемого признака и p(1-p). Размер ошибки

прямо пропорционален величине колеблемости признаков.
2) Вероятность, с которой исследователь желает получить пределы ошибок. Чем выше заданная вероятность, тем больше коэффициент доверия и соответственно больше предельная ошибка выборки.

Слайд 48

3) Способ отбора единиц в выборочную совокупность (повторный или бесповторный), так как общий

объем выборки (n) всегда меньше объема генеральной совокупности (N), то дополнительный множитель (1-n/N) всегда меньше 1. Значит ошибка выборки, при бесповторном отборе всегда будет меньше, чем при повторном отборе. В то же время при сравнительно небольшом проценте выборки этот множитель близок к единице. Например, при 5 % - ой выборке он равен 0,95.

Слайд 49

4) Численность выборки. Ошибка выборки зависит в большей степени от абсолютной численности выборки

и в меньшей – от её относительной доли (процента выборки).
Предположим, что производится 225 наблюдений в первом случае из генеральной совокупности в 4500 единиц и во втором – из генеральной совокупности в 225000 единиц.

Слайд 50

Пусть дисперсия в обоих случаях равна 25. Тогда в первом случае при

5 %-ом отборе ошибка выборки составит:
Во втором случае при 0,1 %-ом отборе ( ) она будет равна:
Хотя во втором случае процент выборки уменьшился в 50 раз, ошибка выборки увеличилась очень незначительно, так как численность выборки не изменилась.

Слайд 51

Предположим теперь, что численность выборки увеличили до 625 наблюдений при генеральной совокупности

в 225000 единиц. В этом случае ошибка выборки будет равна:

Слайд 52

Таким образом, увеличив численность выборки в 2,8 раза при той же численности

генеральной совокупности в 225000 единиц, мы снизили размеры ошибки более чем в 1,6 раза.
Ошибка выборки в этом случае будет также практически в 1,6 раза меньше, чем в первом случае, когда было отобрано 225 единиц из 4500, хотя там применялся 5%-й отбор, а здесь всего лишь около 0,3%-ый.

Слайд 53

Любая формула предельной ошибки принципиально позволяет решать задачи трех видов:
1) определить предел

возможной ошибки средней (доли), т.е. насколько может отклониться показатель выборочной совокупности от показателя в генеральной совокупности;
2) определить необходимую численность выборки, при которой пределы возможной ошибки не превысят некоторой заданной величины;

Слайд 54

3) определить вероятность того, что в проведенной выборке ошибка будет заключаться в

заданных пределах.
Решение той или иной из поставленных задач зависит от того, какие из переменных величин, входящих в формулу, известны, а какие нет. При этом , p, N во всех случаях являются величинами постоянными, так как они заданы действительностью.

Слайд 55

Продолжим рассмотрение примера с выборкой 200 студентов из 2000 при условии, что

отбор студентов произведен механическим способом (то есть он бесповторный). Пусть теперь на основании того, что нам известно надо с вероятностью 0,9545 определить, в каких пределах можно ожидать средний балл для 2000 студентов. Как установлено выше, средний балл в выборке составляет 109. Определить нужно предельную ошибку среднего балла ( )
Известно, что n = 200, N = 2000, =146, t = 2 (при p = 0,9545), тогда

Слайд 56

Таким образом, с вероятностью 0,9545 можно утверждать, что по совокупности 2000 студентов

средний балл будет находиться в пределах
109 1,62.

Слайд 57

Предположим, что предел 1,62 нас не устраивает. Можно подсчитать, какую численность выборки

следует взять, чтобы предельная ошибка не превышала, например, 1 ( , N, t – остаются без изменений). Тогда из формулы находим общий объем выборки (n).

Слайд 58

С другой стороны уменьшения предела ошибки с 1,62 до 1 можно

добиться уменьшением t и связанной с ним вероятности (в этом случае без изменений остаются , n, N). Из формулы теперь находим t.
Вероятность при этой величине t равна 0,7813. Это означает, что из 10000 выборок ошибка не превысит 1 в 7813 из них.

Слайд 59

Далее в условиях механического отбора с вероятностью 0,9545 рассчитаем пределы, в каких

должна оказаться в генеральной совокупности доля москвичей. В выборочной совокупности она составляет 0,45.
Нам известно, что N = 2000, n = 200, p = 0,47, при вероятности 0,9545 (t = 2). Находим предельную ошибку:
Это означает, что доля москвичей в генеральной совокупности находится в пределах 0,450 0,067 (в процентах получится 45% 6,7). Таким образом, с вероятностью 0,9545 можно утверждать, что удельный вес числа москвичей в генеральной совокупности находится в пределах от 38,3 до 51,7 %.

Слайд 60

До сих пор при решении задачи на выборку 200 студентов из 2000

в формулах ошибок выборки показатели вариации брались по генеральной совокупности и p (1 - p)]. В принципе (по теории) это так и должно быть. Однако в процессе расчетов по выборке этими данными статистик не располагает (более того, выборка для того и проводится, чтобы определить показатель по генеральной совокупности). Поэтому на практике вместо показателей вариации генеральной совокупности приходится пользоваться выборочными показателями вариации. Определим их.
Ранее среднюю величину изучаемого признака в выборке мы обозначили через теперь же долю признака в выборке обозначим через w. Тогда показатели вариации в выборочной совокупности получат выражение и а предельные ошибки соответственно и
Численные различия средних и предельных ошибок выборки, рассчитанные по показателям вариации генеральной и выборочной совокупностей незначительны.

Слайд 61

В математической статистике доказывается, что:
В случае выборки большого размера поправочный коэффициент

n/(n-1) близок к 1 и им пренебрегают, и учитывают этот коэффициент лишь в выборках малого размера.
В нашем случае с 200 студентами мы имеем данные о вариации признаков по выборочной совокупности. Вычисленные по этим данным предельные ошибки
составляют:
Следовательно, пределы ошибок, исчисленные по вариации признаков в генеральной и выборочной совокупностях, различаются очень мало:
- по среднему числу посещений разница = 0,02 (1,62 – 1,60)
по доле москвичей - 0,0002 (0,0670 – 0,0668).

Слайд 62

Таким образом, пределы, в которых находится величина показателя по генеральной совокупности устанавливаются

следующим образом: сначала находятся предельные ошибки, а затем эти ошибки прибавляются и вычитаются из выборочного показателя:
Так решаются задачи при собственно-случайном и механическом отборах.

Слайд 63

Теория средних и предельных ошибок, рассмотренная выше справедлива для обычных выборок достаточно

большого объема. Однако такие выборки не всегда возможны и необходимы.
Поэтому наряду с ними приходится пользоваться с так называемыми малыми выборками (n<30).
Первые работы в области теории малой выборки были сделаны английским статистиком В.С. Госсетом в 1908г. (псевдоним – "Стьюдент").

Слайд 64

Формулы для определения предельных ошибок малой выборки для повторного отбора будут такими:

Для оценки возможных пределов ошибки малой выборки пользуются так называемым отношением Стьюдента:
или где
Исчисление ошибок малой выборки по данным формулам может быть удовлетворительным при условии, что распределение изучаемого признака в генеральной совокупности нормально или близко к нему.

Слайд 65

Организация и практика применения выборочного метода наблюдения.
Организация выборочного наблюдения предполагает решение

нескольких вопросов:
1. Определение единиц отбора. 2. Определение вида отбора.
3. Определение численности выборочной совокупности.

Слайд 66

1. Определение единиц отбора.
Единицы для исследования отбираются из определенного круга явлений, составляющих

"основу выборки". В качестве такой "основы" могут выступать списки отдельных лиц, домохозяйств, жилищ, планы городов, карты сельских районов, списки населенных пунктов и т.д. Единица отбора в выборке не должна быть меньше единицы наблюдения. Например, если в качестве единиц наблюдения выступают предприятия, то единицами отбора не могут быть бригады вида отбора.
2. Определение вида отбора.
Главный критерий при этом – величина ошибки и простота организации отбора.

Слайд 67

3. Определение численности выборочной совокупности.
Как известно в формулах предельных ошибок лишь n,

и t выступают переменными величинами. Однако и они по своей природе не одинаковы: и t определяются природой изучаемого явления и задачами, стоящими перед исследованием, и лишь n является собственно неизвестной.

Слайд 68

Действительно, приступая к выборке необходимо хотя бы ориентировочно знать допустимые пределы, в

которых могут находиться возможные ошибки предстоящей выборки, а также степень вероятности, с которой эти пределы должны быть гарантированы. Исходя из требований исследования определяют и величину t: чем более достоверные данные мы хотим получить, тем большую величину t и связанную с ней вероятность необходимо задать. В социально-экономических исследованиях t берут обычно в пределах от 2 до 3, что соответствует вероятности от 0,954 до 0,997.

Слайд 69

Далее расчет численности выборки сталкивается со следующими трудностями: хотя и p(1 -

p) или и w(1-w) заданы действительностью, но к началу выборочного наблюдения они не известны ни по генеральной, ни по выборочной совокупности. Нахождение этих величин при организации выборки является одной из труднейших задач. Как решается эта задача?
Вместо действительных и p(1 - p) в формулах предельных ошибок приходится использовать некие приближенные величины.
(сигма) приближённо можно определить следующими путями:

Слайд 70

1) используется установленная ранее по данным какого-либо предыдущего наблюдения. Однако это целесообразно лишь

в случае, когда за время, прошедшее после предыдущего наблюдения не произошло существенных изменений;
2) математическая статистика доказывает, что средняя (стандартная) ошибка может быть определена из формулы
при t=1
при t=2
при t=3

Слайд 71

Так как вероятность при t=3 достигает 0,9973, то считается, что отклонение от

в пределах вполне гарантирует удовлетворительное решение подавляющего большинства задач ("правило трех сигм"). Следовательно, весь размах (R) между min и max значениями признака может быть принят за
Значит, если известен размах значений признака по изучаемому явлению, то можно принять за 1/6 часть его: =1/6R. Для большей гарантии за 1/5R;
3) практика показывает, что во многих явлениях колебания вариации происходят в промежутке от 25 до 35 %, то есть составляет примерно 1/4-1/3 Поэтому, если в совокупности с нормальной колеблемостью признака известно то условно можно принять за 1/4 или 1/3