Описательные статистики

Содержание

Слайд 2

Измерение центральной состоит в выборе одного числа, которое наилучшим образом описывает все

Измерение центральной состоит в выборе одного числа, которое наилучшим образом описывает все
значения признака из набора данных. Такое число называют центром, типическим значением для набора данных, мерой центральной тенденции.
Зачем?
Получим информацию о распределении признака в сжатой форме.
Сможем сравнить между собой два набора данных (две выборки).
Минус: ведет к потере информации по сравнению с распределением частот.

Слайд 3

Мода – наиболее часто встречающееся значение в выборке, наборе данных. Обозначается Мо.
Выборка:

Мода – наиболее часто встречающееся значение в выборке, наборе данных. Обозначается Мо.
5,4 1,2 0,42 1,2 0,48 Мода=1,2

Слайд 4

Для данных, расположенных в таблице частот, мода определяется как значение, имеющее наибольшую

Для данных, расположенных в таблице частот, мода определяется как значение, имеющее наибольшую
частоту.

Таблица частот для числа посетителей гипермаркета

Мо=4

Слайд 5

Одна ли мода?

Если наибольшую частоту имеет два значения выборки,
выборочное распределение называется

Одна ли мода? Если наибольшую частоту имеет два значения выборки, выборочное распределение
бимодальным.

Если наибольшую частоту имеет более двух значений
выборки, выборочное распределение называется
мультимодальным.

Если ни одно из значений не повторяется, мода отсутствует.

Слайд 6

Вариационный ряд

Вариационный ряд - упорядоченные данные, расположенные в
порядке возрастания значения признака

Вариационный ряд Вариационный ряд - упорядоченные данные, расположенные в порядке возрастания значения признака

Слайд 7

Медиана
Если n нечетно, то медиана – это серединный элемент
вариационного ряда, т.е. элемент,

Медиана Если n нечетно, то медиана – это серединный элемент вариационного ряда,
стоящий на (n+1)/2
месте.
Так если n=5, то мода стоит на (5+1)/2=3 месте.
Если n четно, то серединного элемента нет. В этом случае
медиана – среднее арифметическое элементов с номерами n/2
и (n/2+1).
Так если n=6, то медиана – это среднее арифметическое 3-го и
4-го элементов.

Слайд 9

Медиана
В Excel для вычисления медианы есть функция
МЕДИАНА.

Медиана В Excel для вычисления медианы есть функция МЕДИАНА.

Слайд 10

Среднее значение

Выборочное среднее будем называть среднее арифметическое
выборки, то есть сумму всех

Среднее значение Выборочное среднее будем называть среднее арифметическое выборки, то есть сумму
значений выборки, деленную на
ее объем.

Слайд 12

Пример. Покупателей гипермаркета попросили ответить на вопрос сколько денег в среднем они

Пример. Покупателей гипермаркета попросили ответить на вопрос сколько денег в среднем они
тратят при одном посещении гипермаркета. Было опрошено 1000 человек. Найти оценку математического ожидания случайной величины X – количества денег, которые тратит покупатель при посещении гипермаркета.

рубля

=СРЗНАЧ(A1:A1000)

Слайд 18

Для вычисления квартилей в Excel используется
функция КВАРТИЛЬ(диапазон данных;номер квартиля)

Номер квартиля –

Для вычисления квартилей в Excel используется функция КВАРТИЛЬ(диапазон данных;номер квартиля) Номер квартиля – это 1,2,3
это 1,2,3

Слайд 19

Выборочная дисперсия

называется среднеквадратичным отклонением
или стандартным отклонением

Среднеквадратичное отклонение показывает насколько
в

Выборочная дисперсия называется среднеквадратичным отклонением или стандартным отклонением Среднеквадратичное отклонение показывает насколько
среднем значения признака отклоняются от среднего
по выборке

Слайд 21

Пример. Покупателей гипермаркета попросили ответить на вопрос сколько денег в среднем они

Пример. Покупателей гипермаркета попросили ответить на вопрос сколько денег в среднем они
тратят при одном посещении гипермаркета. Было опрошено 1000 человек. Найти оценку дисперсии случайной величины X – количества денег, которые тратит покупатель при посещении гипермаркета.

Слайд 22

Расчет дисперсии

Расчет дисперсии

Слайд 23

Расчет дисперсии

Расчет дисперсии

Слайд 24

Расчет дисперсии

Расчет дисперсии

Слайд 25

=ДИСП(A1:A1000)

Также для вычисления дисперсии можно использовать функцию

=ДИСП(A1:A1000) Также для вычисления дисперсии можно использовать функцию

Слайд 26

Среднее отклонение потраченной суммы от среднего
значения 1086 рублей равно 575 рублей.

Среднее отклонение потраченной суммы от среднего значения 1086 рублей равно 575 рублей.

Слайд 27

В файле flat представлены данные о ценах на
однокомнатные квартиры (тыс. USD), выставлявшихся

В файле flat представлены данные о ценах на однокомнатные квартиры (тыс. USD),

на продажу в Москве.

1. Вычислите среднее с помощью функции СРЗНАЧ

Слайд 28

2. Постройте вариационный ряд выборки и вычислите
по нему медиану.

Отсортируем Выборку

2. Постройте вариационный ряд выборки и вычислите по нему медиану. Отсортируем Выборку
– это и есть вариационный ряд

Слайд 29

2. Постройте вариационный ряд выборки и вычислите
по нему медиану.

Отсортируем Выборку

2. Постройте вариационный ряд выборки и вычислите по нему медиану. Отсортируем Выборку
– это и есть вариационный ряд

n=69 – нечетно, медиану
ищем под номером (69+1)/2=35

Слайд 30

2. Постройте вариационный ряд выборки и вычислите
по нему медиану.

Отсортируем Выборку

2. Постройте вариационный ряд выборки и вычислите по нему медиану. Отсортируем Выборку
– это и есть вариационный ряд

n=69 – нечетно, медиану
ищем под номером (69+1)/2=35

Половина квартир в выборке имеет цену ниже 37 тысяч $
и половина – выше этого значения

Слайд 31

3. Вычислить медиану с помощью функции МЕДИАНА,
сравните результаты.

3. Вычислить медиану с помощью функции МЕДИАНА, сравните результаты.

Слайд 32

4. Вычислите размах выборки (см. формулу выше).

4. Вычислите размах выборки (см. формулу выше).

Слайд 33

5. Вычислить дисперсию с помощью функции ДИСП
и по формуле дисперсии. См.

5. Вычислить дисперсию с помощью функции ДИСП и по формуле дисперсии. См. формулу выше в слайдах
формулу выше в слайдах

Слайд 34

5. Вычислить дисперсию с помощью функции ДИСП
и по формуле дисперсии.

5. Вычислить дисперсию с помощью функции ДИСП и по формуле дисперсии.

Слайд 35

6. Вычислить стандартное отклонение с помощью
функции СТАНДОТКЛОН и по формуле стандартного

6. Вычислить стандартное отклонение с помощью функции СТАНДОТКЛОН и по формуле стандартного отклонения.

отклонения.

Слайд 36

7. Вычислить нижний и верхний квартиль с
помощью функции КВАРТИЛЬ.
В качестве

7. Вычислить нижний и верхний квартиль с помощью функции КВАРТИЛЬ. В качестве
второго аргумента функции указать 1
для нижнего квартиля и 3 для верхнего. А какая величина
будет вычислена, если указать в качестве второго
аргумента 2?
8. Дайте экономическую интерпретацию квартилям.

25% квартир в выборке дешевле 33 тыс.$
25% квартир в выборке дороже 43 тыс.$