Элементы теории статистической обработки данных. Основные определения и понятия
Основные определения Переменная – величина, которую можно измерять, контролировать, варьировать в статистических исследованиях. Эмпирические исследования – нахождение зависимостей (корреляций) между некоторыми переменными. исследование корреляций - такой вид исследования, когда зависимости троятся на основании уже имеющихся фактов, или переменных, получаемых в ходе эксперимента, на которые экспериментатор не оказывает воздействия; экспериментальные исследования предполагают варьирование некоторыми переменными и измерение воздействия этих изменений на другие переменные. Зависимые и независимые переменные. Независимыми переменными называются переменные, которые варьируются исследователем, тогда как зависимые переменные - это переменные, которые измеряются или регистрируются. Шкалы измерений. В каждом измерении присутствует некоторая ошибка, определяющая границы "количества информации", которое можно получить в данном измерении в соответствии с измерительной шкалой. Различают следующие типы шкал: номинальная, Типичные примеры номинальных переменных - пол, национальность, цвет, город и т.д. порядковая (ординальная), Типичный пример порядковой переменной - социоэкономический статус семьи. Интервальная, Например, температура, измеренная в градусах Фаренгейта или Цельсия, образует интервальную шкалу. относительная (шкала отношения). Типичными примерами шкал отношений являются измерения времени или пространства. Например, температура по Кельвину образует шкалу отношения, и вы можете не только утверждать, что температура 200 градусов выше, чем 100 градусов, но и что она вдвое выше. Интервальные шкалы (например, шкала Цельсия) не обладают данным свойством шкалы отношения. Связи между переменными. Независимо от типа, две или более переменных связаны (зависимы) между собой, если наблюдаемые значения этих переменных распределены согласованным образом. Другими словами, мы говорим, что переменные зависимы, если их значения систематическим образом согласованы друг с другом в имеющихся у нас наблюдениях. Основные статистические величины Описательные статистики "Истинное" среднее и доверительный интервал. Вероятно, большинство из вас использовало такую важную описательную статистику, как среднее. Среднее - очень информативная мера "центрального положения" наблюдаемой переменной, особенно если сообщается ее доверительный интервал. Доверительный интервал для среднего представляет интервал значений вокруг оценки, где с данным уровнем доверия, находится "истинное" (неизвестное) среднее. Пример. Среднее значение выборки равно 23, а нижняя и верхняя границы доверительного интервала с уровнем p=.95 равны 19 и 27 соответственно. Отсюда следует, что с вероятностью 95% интервал с границами 19 и 27 включает в себя среднее значение. При установлении большего уровня доверия, интервал становится шире, поэтому возрастает вероятность, с которой он "накрывает" неизвестное среднее, и наоборот. Вычисление доверительных интервалов основывается на предположении нормальности наблюдаемых величин. Увеличение разброса наблюдаемых значений уменьшает надежность оценки.