Представление числовых данных

Содержание

Слайд 2

Статистическая обработка данных.

Ребята, мы переходим к изучению нового раздела, связанного с вопросами

Статистическая обработка данных. Ребята, мы переходим к изучению нового раздела, связанного с
обработки данных различных экспериментов и элементов теории вероятности.
Теория вероятности и математическая статистика находят свое применение практически во всех областях жизни.
Так же заметим, что, частично, мы уже изучали данный раздел раньше, так что некоторые моменты вы можете помнить.

Слайд 3

Статистическая обработка данных.

Давайте рассмотрим какой-нибудь пример, где нам может пригодиться обработка информации.

Статистическая обработка данных. Давайте рассмотрим какой-нибудь пример, где нам может пригодиться обработка

Пусть у нас есть десять футболистов, основной состав некоторой команды.
Наши футболисты пробивают по десять пенальти и результаты каждого записываются.

После окончания у нас есть некоторый набор результатов, на первый взгляд просто набор чисел, но что можно сделать с этими числами? Какую пользу они нам могут принести?

Слайд 4

Статистическая обработка данных.


В первую очередь надо как то сгруппировать и

Статистическая обработка данных. В первую очередь надо как то сгруппировать и упорядочить
упорядочить нашу информацию. Группировать информацию можно различными способами, все зависит от требуемой задачи. В нашем случае мы можем сгруппировать по фамилии игрока или по номеру игрока команды.

Слайд 5

Статистическая обработка данных.

Рассмотрим, как нашу таблицу можно представить графически. В виде

Статистическая обработка данных. Рассмотрим, как нашу таблицу можно представить графически. В виде
графиков представим первую таблицу.
На обычной координатной плоскости, по оси абсцисс отложим номер игрока, а по оси ординат - количество забитых голов.

Полученная кривая называется многоугольником распределения.

Слайд 6

Статистическая обработка данных.

Теперь давайте построим гистограмму: она позволяет так же наглядно

Статистическая обработка данных. Теперь давайте построим гистограмму: она позволяет так же наглядно
наблюдать за значениями нашего ряда распределений. Мы строим прямоугольники с “центром” в значениях нашего ряда. Получаются такие прыгающие столбики.

Слайд 7

Статистическая обработка данных.

Нам осталось построить еще один тип диаграммы – круговую

Статистическая обработка данных. Нам осталось построить еще один тип диаграммы – круговую
диаграмму. Представим, что наш круг занимает все - 100% забитых голов (55 голов), тогда игрок с номером два займет 3/55 площади круга, игроки с номерами 5 и 6 займут 1/11 часть круга, так как 5/55=1/11.
Давайте построим для всех игроков круговую диаграмму.

Слайд 8

Статистическая обработка данных.
Ну вот, мы с вами научились немного обрабатывать данные.
Давайте

Статистическая обработка данных. Ну вот, мы с вами научились немного обрабатывать данные.
напишем небольшой алгоритм первичной обработки данных:
1) Упорядочить и сгруппировать данные.
2) Составить таблицу распределения данных.
3) Графическое представление данных. В зависимости от задачи построить один из графиков распределения:
Многоугольник распределения, Гистограмму или Круговую диаграмму.

Слайд 9

Статистическая обработка данных.

Но на этом обработка информации не заканчивается, для нашего ряда

Статистическая обработка данных. Но на этом обработка информации не заканчивается, для нашего
распределения можно найти многие числовые характеристики. Давайте рассмотрим их.
Первая числовая характеристика это объем выборки, в нашем случае он равен десяти, так как мы рассматривали десять футболистов.
Размах измерения – разница между наибольшим и наименьшим значениями выборки. Больше всего голов забил игрок под номером 10 – 8 голов. Меньше всего, игрок под номером 2 – 3 гола. Тогда размах нашего измерения: 8-3=5.
Самое популярное или наиболее часто встречаемое значение называется модой выборки. В нашем примере мода равна 10 – игрок забивший наибольшее количество голов. В реальности тренер команды мог назначить этого игрока штатным пенальтистом.

Слайд 10

Статистическая обработка данных.

Среднее значение выборки. Суммируя все результаты и поделив на

Статистическая обработка данных. Среднее значение выборки. Суммируя все результаты и поделив на
оббьем выборки можно получить среднее значение. Для подсчета среднего значения удобнее использовать данные второй построенной таблицы.
Округлив до целых, получим, что в среднем игроки забивали по шесть голов. Тренер команды мог бы запомнить данное значение, и через некоторое время провести еще раз такой эксперимент и проверить растут ли показатели команды или нет.

Слайд 11

Статистическая обработка данных.

Варианта измерения – каждое число встретившиеся в результате измерения. В

Статистическая обработка данных. Варианта измерения – каждое число встретившиеся в результате измерения.
нашем случае для первой таблицы – количество забитых голов, для второй – количество игроков забивших гол.
Медиана измерения – среднее варианта встречающиеся в выборке. Она делит нашу выборку пополам. Для второй выборки медиана равняется 5, так как это значение делит наш ряд ровно пополам. Если число вариант четно, как в первой выборке, то берутся два средних значения и делятся пополам: (6+7)/2=6,5.
Кратность или абсолютная частота варианты – то сколько раз встречается конкретная варианта. Для второй таблица кратность 0 равна 0, кратность 4 равна двум, кратность 8 равна единице.

Слайд 12

Статистическая обработка данных.

При составлении таблицы, не всегда получается, что варианты расположены через

Статистическая обработка данных. При составлении таблицы, не всегда получается, что варианты расположены
равные промежутки.
Варианта измерения может принимать фактически любые значения и положительные и отрицательные.
Кратность варианты всегда больше нуля, если кратность равна нулю то фактически в нашем эксперимента данное значение не встретилось, поэтому вторую таблицу распределения целесообразней записать в таком виде:

Слайд 13

Статистическая обработка данных.

Варианта измерения – каждое число встретившиеся в результате измерения. В

Статистическая обработка данных. Варианта измерения – каждое число встретившиеся в результате измерения.
нашем случае для первой таблицы – количество забитых голов, для второй – количество игроков забивших гол.
Медиана измерения – среднее варианта встречающиеся в выборке. Она делит нашу выборку пополам. Для второй выборки медиана равняется 5, так как это значение делит наш ряд ровно пополам. Если число вариант четно, как в первой выборке, то берутся два средних значения и делятся пополам: (6+7)/2=6,5.
Кратность или абсолютная частота варианты – то сколько раз встречается конкретная варианта. Для второй таблица кратность 0 равна 0, кратность 4 равна двум, кратность 8 равна единице.

Слайд 14

Статистическая обработка данных.

Частота варианты– числовая характеристика, показывающая часть или долю которую составляет

Статистическая обработка данных. Частота варианты– числовая характеристика, показывающая часть или долю которую
варианта от всей выборки, которая равна:
Перепишем нашу вторую таблицу с учетом частот и объема выборки:

Сумма всех частот всегда равна 1, а сумма частот в процентах всегда равна 100%.

Слайд 15

Статистическая обработка данных.

Вернемся к среднему значению, данная числовая характеристика часто является очень

Статистическая обработка данных. Вернемся к среднему значению, данная числовая характеристика часто является
полезной.
Но не во всех задачах имеет смысл ее вычислять.
В нашем примере эта числовая характеристика показывала, сколько в среднем забивает команда. Со временем можно делать выводы об эффективности или неэффективности методов тренировки. Если среднее значение забитых голов растет, то видимо и тренировка эффективна, если не растет, а даже падает то видимо, методы тренировки неэффективны.

Слайд 16

Статистическая обработка данных.

Еще одна важная числовая характеристика – Дисперсия, или разброс значений

Статистическая обработка данных. Еще одна важная числовая характеристика – Дисперсия, или разброс
вокруг среднего значения. Чем меньше дисперсия, тем плотнее результаты эксперимента сосредоточены около своего среднего значения.
Подсчет дисперсии довольно таки трудоемкая операция, опишем алгоритм поиска дисперсии.

Слайд 17

Статистическая обработка данных.

Давайте вычислим дисперсию для нашего примера:
1. Вспомним, среднее значение у

Статистическая обработка данных. Давайте вычислим дисперсию для нашего примера: 1. Вспомним, среднее
нас равнялось 5.5
2. Вычислим каждое отклонение и квадрат отклонения
3. Вычислим дисперсию

Слайд 18

Статистическая обработка данных.

Методы математической статистики позволяют обрабатывать практически любые данные, главное подходить

Статистическая обработка данных. Методы математической статистики позволяют обрабатывать практически любые данные, главное
к обработке данных обдуманно и исходя из здравого смысла.