Описательные статистики

Содержание

Слайд 2

МОДА

Мода выборки– это статистика (число) равная варианту выборки,
частота которой наибольшая.

Выборку, в

МОДА Мода выборки– это статистика (число) равная варианту выборки, частота которой наибольшая.
которой только одна варианта имеет наибольшую частоту, называют
унимодальной выборкой.

Примеры моды выборки:

Мода выборки равна 6

Так как 8 – наибольшая частота в данной выборке

Мода выборки Сангвиник

Так как 9 – наибольшая частота в данной выборке

Выборка, в которой только две смежные варианты имеют наибольшую частоту,
также является унимодальной выборкой.

Мода выборки равна 3,5 ((3+4)/2)

Так как 5 – наибольшая частота в двух данных
выборках

Выборка, в которой две несмежные варианты имеют наибольшую частоту, называют бимодальной выборкой.

Моды выборки

Так как 8 – наибольшая частота

В остальных случаях:
МОДЫ - НЕТ

1

2

3

Слайд 3

СРЕДНЕЕ

Среднее выборки (m)– это статистика (число) равная отношению суммы
всех значений варианты

СРЕДНЕЕ Среднее выборки (m)– это статистика (число) равная отношению суммы всех значений
к объёму выборки

Среднее (m) – обозначает условный центр выборки.

Если выборка имеет небольшой объем – то среднее вычисляют по определению.

Пример:

Если выборка имеет большой объем – то среднее вычисляют в Exсel (fx = СРЗНАЧ)

Если составлено распределение частот выборки, то для вычисления среднего используется формула:

Или вычисления также проводят в Excel

Одной характеристики СРЕДНЕЕ недостаточно для описания выборки, так как варианты выборки могут находиться на разных расстояниях от центра выборки

Слайд 4

САНДАРТНОЕ ОТКЛОНЕНИЕ

Стандартное отклонение (s)– это статистика (число) обозначающая
стандартный диапазон изменчивости (рассеяния)

САНДАРТНОЕ ОТКЛОНЕНИЕ Стандартное отклонение (s)– это статистика (число) обозначающая стандартный диапазон изменчивости
вариант от среднего (m)

Стандартным отклонением выборки (хi) объемом n со средним m называют число s, равное квадратному корню отношения суммы квадратов отклонений всех значений варианты от выборочного среднего к n – 1.

Для вычисления в Excel используется функция: (fx = СТАНДОТКЛОН )

Если составлено распределение частот выборки, то для вычисления стандартного отклонения используется формула:

где n – объем выборки;
В = x12n1+x22n2+…+xk2nk
А = x1n1+x2n2+…+xknk

Или вычисления также проводят в Excel

Слайд 5

Статистический вывод

Статистический критерий — строгое математическое ПРАВИЛО, по которому
принимается или отвергается та

Статистический вывод Статистический критерий — строгое математическое ПРАВИЛО, по которому принимается или
или иная статистическая гипотеза

К основным статистическим критериям относятся:
– ϕ-критерий Фишера;
– λ-критерий Колмогорова-Смирнова;
– G-критерий знаков;
– U-критерий Манна-Уитни.

Статистический вывод имеет
вероятностный характер

Слайд 6

ВЫБОРКИ

ВЫБОРКИ бывают:

связанные

несвязанные

множества значений двух свойств,
полученные в одной группе
респондентов

множества значений одного свойства,
полученные

ВЫБОРКИ ВЫБОРКИ бывают: связанные несвязанные множества значений двух свойств, полученные в одной
в двух группах
респондентов

Пример:

Выборки «Мотивация» и «Успешность» для всех студентов являются связанными

Выборка «Общительность» студентов очной формы обучения и выборка «Общительность» студентов заочной формы обучения являются несвязанными

Слайд 7

Принятие решения о Н1 имеет вероятностный характер, поэтому указывается уровень значимости принятия

Принятие решения о Н1 имеет вероятностный характер, поэтому указывается уровень значимости принятия
правильного решения о Н1 (вероятность вывода)

СТАТИСТИЧЕСКИЕ ГИПОТЕЗЫ

Статистическими гипотезами называют ПРЕДПОЛОЖЕНИЯ о статистически значимых различиях выборок.

ВОПРОС?
«Значимо или не значимо отличаются выборки?»

ОТВЕТ 1:
выборки отличаются
не значимо

ОТВЕТ 2:
выборки отличаются
значимо

ГИПОТЕЗА 2:
выборки статистически значимо различаются.
Обозначение – Н1 (различия есть)

ГИПОТЕЗА 1:
выборки статистически значимо не различаются
Обозначение – Н0 (различий нет)

Алгоритм проверки статистических гипотез:

1. Проверяется гипотеза Н0
2. Если Н0 принимается, то Н1 не рассматривается
3. Если Н0 не принимается, тогда принимается Н1

Слайд 8

ВЕРОЯТНОСТЬ ВЫВОДА

Так как сперва проверяется гипотеза Н0, то существует:

Вероятность
ПРАВИЛЬНО ПРИНЯТЬ Н0

Вероятность
ОШИБКИ

ВЕРОЯТНОСТЬ ВЫВОДА Так как сперва проверяется гипотеза Н0, то существует: Вероятность ПРАВИЛЬНО
ПРИНЯТИЯ Н0

(т.е. вероятность того, что
различий НЕТ)

(т.е. вероятность того, что
различия ЕСТЬ)

Обозначения:

p

1-p = α

Вероятность ошибки принятия гипотезы Н0 называется
уровнем статистической значимости (α).

В психологии различают следующую шкалу уровней статистической значимости:

если р > 0,10, т.е.
α < 0,90

Вероятность того, что различия есть < 90%

Статистически незначимый уровень

если 0,05 < р ≤ 0,10, т.е. 0,90 ≤ α < 0,95

Вероятность того, что различия есть > 90%, но < 95%

Невысокий уровень, тенденция

если 0,01 < р ≤ 0,05, т.е. 0,95 ≤ α < 0,99

Вероятность того, что различия есть > 95%, но < 99%

Нормальный
уровень

если р ≤ 0,01, т.е.
α ≥ 0,99

Вероятность того, что различия есть > 99%

Высокий
уровень

Слайд 9

АЛГОРИТМ ПРОВЕРКИ ГИПОТЕЗ

Статистические критерии (правила) представлены в форме алгоритма проверки статистических гипотез

АЛГОРИТМ ПРОВЕРКИ ГИПОТЕЗ Статистические критерии (правила) представлены в форме алгоритма проверки статистических
и содержат таблицы критических значений случайной величины.
Критерии имеют названия, как правило, связанные с именами авторов

ОБЩИЙ АЛГОРИТМ:

1. Выбирается критерий (правило) сравнения

2. Вычисляется статистика (число) для сравниваемых выборок по правилу, соответствующему критерию (примем как С)

3. Находится предельное значение статистики (числа) (Сα) для установленного исследователем уровня значимости α

4. Сравниваются значения С и Сα .

5. Исходя из того, какое значение больше, делается статистический вывод о том, принимается Н0 или принимается Н1

6. Формулируется содержательный вывод: различия есть или различий нет

Слайд 10

ϕ-критерий Фишера

С помощью ϕ -критерия Фишера устанавливается значимость различия долей выраженности одинакового

ϕ-критерий Фишера С помощью ϕ -критерия Фишера устанавливается значимость различия долей выраженности
свойства в двух выборках
или двух разных свойств в одной выборке.

Область применения:

Особенности применения:

1. В каждой из сравниваемых выборок должно быть не менее пяти респондентов.
2. Выборки могут быть связанными или несвязанными.
3. Используется таблица ϕ-критерия Фишера (замены долей выраженности исследуемого свойства на ϕ1 и ϕ2).

Алгоритм ϕ -критерия Фишера:

1. Вычисленные доли (проценты) выраженности одинакового свойства в I и II выборках заменяют на соответствующие им значения ϕ1 и ϕ2 с помощью таблицы ϕ-критерия Фишера.

2. Вычисляют значение ϕ по формуле:

3. Статистический вывод:

Если ϕ < 1,29, то принимается гипотеза Н0.
Если 1,29 ≤ ϕ < 1,64, то принимается гипотеза Н1 (p ≤ 0,10).
Если 1,64 ≤ ϕ < 2,31, то принимается гипотеза Н1 (p ≤ 0,05).
Если 2,31 ≤ ϕ, то принимается гипотеза Н1 (p ≤ 0,01).

Под долей выраженности свойства понимается отношение числа респондентов, имеющих это психическое свойство, к объему выборки
(например: на первом курсе 25% общительных студентов)

Слайд 12

λ-критерий Колмогорова-Смирнова

С помощью λ -критерия Колмогорова-Смирнова устанавливается уровень статистической значимости различий распределений

λ-критерий Колмогорова-Смирнова С помощью λ -критерия Колмогорова-Смирнова устанавливается уровень статистической значимости различий
частот одинакового свойства в двух выборках
или двух разных свойств в одной выборке.

Область применения:

Особенности применения:

1. В каждой из сравниваемых выборок должно быть не менее 50 респондентов.
2. Выборки могут быть связанными или несвязанными.

Алгоритм λ -критерия Колмогорова-Смирнова:

1. Составляют процентильные распределения частот исследуемого свойства для I и II выборок в общей таблице.

2. Вычисляют модуль разности процентильного распределения

4. Статистический вывод:

Если λ < 1,22, то принимается гипотеза Н0.
Если 1,22 ≤ λ < 1,36, то принимается гипотеза Н1 (p ≤ 0,10).
Если 1,36 ≤ λ < 1,63, то принимается гипотеза Н1 (p ≤ 0,05).
Если 1,63 ≤ λ, то принимается гипотеза Н1 (p ≤ 0,01).

где d – наибольшая разность
процентильного распределения;
n1 – число респондентов в выборке I;
n2 – число респондентов в выборке II.

3. Вычисляют λ по формуле:

Слайд 13

G-критерий знаков

С помощью G-критерия знаков устанавливается уровень статистической значимости различий свойства А

G-критерий знаков С помощью G-критерия знаков устанавливается уровень статистической значимости различий свойства
и свойства В у респондентов одной выборки.

Область применения:

Особенности применения:

1. В выборке должно быть не менее пяти респондентов.
2. Выборки свойств А и В должны быть связанными.
3. Свойства А и В должны быть измерены в одной шкале или ранжированы.
4. Используется таблица G-критерия знаков

Алгоритм G-критерия знаков:

1. К протоколу свойств А и В, измеренных в одной шкале или ранжированных, добавляют столбец «Знак А – В» и заполняют его.

2. Вводят обозначения:
а – число «плюсов» в столбце «Знак А – В»;
b – число «минусов» в столбце «Знак А – В»;
n – сумма a и b;
G – число, равное меньшему из чисел а и b.

4. Статистический вывод:

Если G > G0,10, то принимается гипотеза Н0.
Если G0,05< G ≤ G0,10, то принимается гипотеза Н1 (p ≤ 0,10).
Если G0,01< G ≤ G0,05, то принимается гипотеза Н1(p ≤ 0,05).
Если G ≤ G0,01, то принимается гипотеза Н1 (p ≤ 0,01).

3. Находят в таблице G-критерия знаков, в строке n соответствующие значения
G0,10, G0,05 и G0,01.

Слайд 14

Таблица G-критерия знаков

Таблица G-критерия знаков

Слайд 15

U-критерий Манна-Уитни

С помощью U-критерия Манна-Уитни устанавливается уровень статистической значимости различий одного свойства

U-критерий Манна-Уитни С помощью U-критерия Манна-Уитни устанавливается уровень статистической значимости различий одного
у респондентов
двух выборок (I и II).

Область применения:

Особенности применения:

1. В выборке должно быть не менее четырех-пяти респондентов.
2. Выборки одного свойства (I и II) должны быть несвязанными.
3. Используется таблица U-критерия Манна-Уитни.

Алгоритм U-критерия Манна-Уитни:

1. Проводят ранжирование общей выборки, в которую входят сравниваемые выборки (I и II).

2. Находят сумму рангов вариант выборки I и сумму рангов вариант выборки II.

5. Статистический вывод:

Если U > U0,05, то принимается гипотеза Н0.
Если U0,01 < U ≤ U0,05, то принимается гипотеза Н1 (p ≤ 0,05).
Если U ≤ U0,01, то принимается гипотеза Н1 (p ≤ 0,01).

3. Вычислите значение U по формуле: U = n1*n2+ 0,5*nR*(nR +1) – R.
где n1 – объем выборки I;
n2 – объем выборки II; nR – объем выборки, имеющей большую сумму рангов;
R – значение большей суммы рангов.

4. Находят в таблице U-критерия Манна-Уитни на пересечении строки и столбца
n1 и n2 значения U0,05 и U0,01

Слайд 18

Корреляция

Корреляция (англ. correlation) – взаимосвязь, соответствие, взаимозависимость, связь.

Математическим методом выявления силы связей

Корреляция Корреляция (англ. correlation) – взаимосвязь, соответствие, взаимозависимость, связь. Математическим методом выявления
свойств является
анализ корреляции (через коэффициент корреляции).

Корреляционным отношением свойств называют взаимную связь свойств.

Коэффициент корреляции (r)

Коэффициент корреляции – двумерная статистика (характеристика) об
уровне связи (r) и
уровне значимости (p) связи между связанными свойствами.

Способности школьников понимать учителя статистически значимо связаны с их способностями понятно выражать свои мысли (r = 0,56; p < 0,05)

Свойства уровня связи переменных (r):

1. Уровень связи | r | ≤ 1 вычисляется для связанных выборок

Пример:

2. Если r положительное число, то связь свойств прямая, то есть
большему значению одного свойства соответствует большее значение другого.

3. Если r отрицательное число, то связь свойств обратная, то есть
большему значению одного свойства соответствует меньшее значение другого.

4. Если r близко к нулю, то связь свойств отсутствует

Для вычисленного значения r устанавливается
уровень его статистической значимости

Слайд 19

Корреляция

Для определения уровня значимости связи переменных используется
таблица критических значений коэффициентов корреляции

Таблица r-критерия

Корреляция Для определения уровня значимости связи переменных используется таблица критических значений коэффициентов
Спирмена (r-критерия Пирсона)

n – объем выборки; α – уровень значимости

Шкала уровней связи переменных (r)

–1 ≤ r ≤ –0,70 – сильная обратная корреляция.

0,50 ≤ r < 0,70 – средняя прямая корреляция;

0,70 ≤ r ≤ 1 – сильная прямая корреляция;

0,30 ≤ r < 0,50 – умеренная прямая корреляция;

0,20 ≤ r < 0,30 – слабая прямая корреляция;

–0,20 < r < 0,20 – корреляция отсутствует;

–0,30 < r ≤ –0,20 – слабая обратная корреляция;

–0,50 < r ≤ –0,30 – умеренная обратная корреляция;

–0,70 < r ≤ –0,50 – средняя обратная корреляция;

Шкала уровней значимости связи переменных (a)

0,05 < p ≤ 0,10 – связь статистически значимая (тенденция);

0,10 < p – связь статистически не значимая;

0,01 < p ≤ 0,05 – связь статистически значимая (достоверная);

p ≤ 0,01 – связь статистически значимая (высокая).

Слайд 20

r-критерий Спирмена

r-критерий Спирмена является критерием ранговой корреляции, который применяется для переменных (свойств),

r-критерий Спирмена r-критерий Спирмена является критерием ранговой корреляции, который применяется для переменных
измеренных, как правило, в шкале порядка.

Область применения:

Алгоритм r-критерий Спирмена:

1. Заменяют варианты (значения) выборок А и В рангами rA и rB;

2. Вычисляют значение D по формуле:

5. Статистический вывод:

Если |r| < r0,10, то принимается гипотеза Н0.
Если r0,10 ≤ |r| < r0,05, то принимается гипотеза Н1 (r, p ≤ 0,10).
Если r0,05 ≤ |r| < r0,01, то принимается гипотеза Н1 (r, p ≤ 0,05).
Если r0,01 ≤ |r|, то принимается гипотеза Н1 (r, p ≤ 0,01).

 

3. Определяют коэффициент r:

n – объем выборки.

4. Находят в строке «n» таблицы r-критерия Спирмена значения: r0,10; r0,05; r0,01.

Слайд 21

r-критерий Пирсона

r-критерий Пирсона является критерием линейной корреляции, который применяется для переменных (свойств),

r-критерий Пирсона r-критерий Пирсона является критерием линейной корреляции, который применяется для переменных
измеренных в шкале интервалов или шкале отношений.

Область применения:

Алгоритм r-критерий Пирсона :

1. Разместите таблицу выборок А и В в Excel.

2. Курсор поставьте на пустую ячейку таблицы.

В ячейке появится значение r (уровня связи значений выборок А и В)

3. Последовательно выполните операции:
- нажмите клавишу со знаком «fx»;
- в появившемся окне «Мастер функций» в ячейке «Поиск функции» наберите КОРРЕЛ. Нажмите кнопку «Найти» и «ОК»;
- в появившееся окно «Аргументы функции» впишите:
- в строку «Массив 1» – код первой ячейки выборки А: код последней ячейки выборки А;
- в строку «Массив 2» – код первой ячейки выборки В: код последней ячейки выборки В, нажмите «ОК».

4. Находят в строке «n» таблицы r-критерия Пирсона значения: r0,10; r0,05; r0,01.

5. Статистический вывод:

Если |r| < r0,10, то принимается гипотеза Н0.
Если r0,10 ≤ |r| < r0,05, то принимается гипотеза Н1 (r, p ≤ 0,10).
Если r0,05 ≤ |r| < r0,01, то принимается гипотеза Н1 (r, p ≤ 0,05).
Если r0,01 ≤ |r|, то принимается гипотеза Н1 (r, p ≤ 0,01).

Слайд 22

Z-критерий Фишера

Z-критерий Фишера является критерием, который применяется для сравнения коэффициентов корреляции двух

Z-критерий Фишера Z-критерий Фишера является критерием, который применяется для сравнения коэффициентов корреляции
переменных (свойств), полученных на разных выборках.

Область применения:

Алгоритм Z-критерия Фишера:

1. В Excel занесите вычисленные значения r1, n1, r2, n2,
где r1 – коэффициент корреляции переменных в выборке I;
n1 – число респондентов в выборке I;
r2 – коэффициент корреляции переменных в выборке II;
n2 – число респондентов в выборке II.

6. Статистический вывод:

2. Найдите с помощью функции ФИШЕР в Excel значения: Z1 = Z(r1); Z2 = Z(r2).

Есть ли статистически значимые различия связей показателей общительности и академической успеваемости у студентов очной (r = 0,31, р ≤ 0,05) и
заочной (r = 0,63, р ≤ 0,05) форм обучения?

Пример:

3. Вычислите Z по формуле:

4. Найдите с помощью функции НОРМСТРАСП в Excel значение Р(Z)

5. Вычислите уровень значимости α по формуле:

Если α > 0,10, то принимается Н0.
Если α ≤ 0,10, то принимается Н1 (р ≤ α).

Слайд 23

ЗАДАНИЯ

1. Найдите моду выборок по таблицам распределения частот:

2. В таблице представлено

ЗАДАНИЯ 1. Найдите моду выборок по таблицам распределения частот: 2. В таблице
распределение частот оценок студентов по психологии:

- вычислите среднее выборки (m);
- вычислите стандартное отклонение выборки (s).

3. В таблице представлены результаты тестирования школьников по истории в баллах.

- найдите моду выборки;
- вычислите среднее выборки (m);
- вычислите стандартное отклонение выборки (s).

Слайд 24

ЗАДАНИЯ

4. Сформулируйте статистические гипотезы Н0 и Н1 о различиях выборок школьников:
а) оценок

ЗАДАНИЯ 4. Сформулируйте статистические гипотезы Н0 и Н1 о различиях выборок школьников:
по математике мальчиков и девочек;
б) оценок школьников по литературе и по физике.
5. В таблице приведены распределения частот рангов ценности «Работа» у студентов до (I выборка) и после (II выборка) производственной практики.

Установите уровень статистической значимости различий распределений частот рангов ценности «Работа» у студентов до и после производственной практики

6. По данным метеорологов вероятность прогноза погоды на один день равна 95%, на три дня – 90%.
Определите вероятность ошибки прогноза погоды: а) на один день; б) на три дня.

Слайд 25

ЗАДАНИЯ

7. В протоколе приведены самооценки студентов по психологии (А) и самооценки по

ЗАДАНИЯ 7. В протоколе приведены самооценки студентов по психологии (А) и самооценки
математике (В).

Установите уровень статистической значимости различий самооценок по психологии и самооценок по математике у студентов

8.В первой группе, состоящей из 24 студентов, у шести из них выявлен высокий уровень общительности. Во второй группе, состоящей из 28 студентов, у двенадцати выявлен высокий уровень общительности.
Есть ли статистически значимые различия долей студентов одной группы от студентов другой группы, имеющих высокий уровень общительности?
9. В таблице приведены результаты теста «Логические способности», проведенного среди школьников.

Проведите ранжирование вариант выборки.

Имя файла: Описательные-статистики.pptx
Количество просмотров: 48
Количество скачиваний: 0