Статистический анализ данных. Первые шаги. Лекция 10
Понятие выборки Выборка – это последовательность наблюдений. Это могут быть наблюдения любой природы: некоторой физической величины (температуры, давления, напряжения) или экономические данные (стоимость какого либо объекта или заработная плата), или медицинские и т. д. Наблюдения могут проводиться на одним объектом в последовательные моменты времени или в один момент времени над несколькими объектами. Представим эти наблюдения как массив чисел из n элементов: x1, x2, …, xn n называется объемом или длиной выборки. Значение n может быть весьма велико. Как описать свойства выборки? Составить о ней общее представление? По каким параметрам можно сравнить две выборки, описывающие объекты или явления одинаковой природы? Например, имеются оценки двух студенческих групп по какому-либо предмету. Как понять, какая группа лучше учится? А если оценки не двух групп, а двух факультетов? Характеристики выборки Среднее значение: Это наиболее распространенная характеристика центра выборки. Обычно, когда говорят «средний», подразумевают «типичный», хотя это не всегда правильно. Например, если оценки такие: 3, 5, 3, 5, 3, 5, то среднее равно 4, хотя оценку 4 не получил ни один студент. Еще один пример нетипичности среднего значения – это «средняя по госпиталю температура». Среднее значение является хорошей характеристикой выборки, когда наблюдения более или менее равномерно заполняют интервал от xmin (минимального значения среди наблюдений) до xmax (максимального значения среди наблюдений). Значения xmin и xmax также являются характеристиками выборки.