Разделы презентаций
Введение в компьютерный и интеллектуальный анализ данных (ВКИАД). Типы статистических данных и способы их первичной обработки
Слайды презентации Открыть в PDF
Описание слайда:
33Ряды динамики Ряды динамики – статистические данные , отображающие развитие во времени изучаемого явления. Их также называют динамическими рядами , временными рядами . Год 2009 2010 2011 2012 2013 2014 201 5 Произво дство 30,1 34,9 44,3 27,0 31,0 34,5 47,0 Пример. Пример. Производство изделий «А» в 2009-2015гг.Производство изделий «А» в 2009-2015гг.
Описание слайда:
34Вариационный ряд Если ряд распределения построен по количественному признаку, то такой ряд называют вариационным. Построить вариационный ряд - значит упорядочит ь количественное распределение единиц совокупности по значениям признака, а затем подсчитать числа единиц совокупности с этими значениями (построить групповую таблицу).
Описание слайда:
35 Пример вариационных рядов Пример 1. В магазине продана мужская обувь следующих размеров: 38, 41, 41, 38, 43, 39, 39, 42, 42, 39, 42, 39, 40, 40, 40, 39, 39. Дискретный вариационный ряд: 2 6 3Кол-во пар 38-39 40-41 42-43Размеры обуви 8 5 43Кол-во парРазмер обуви 38 1414039 32 Интервальный вариационный ряд: 4342
Описание слайда:
39 Применение группировки (шаг 1) Пример 2. Построить интервальный вариационный ряд распределения по первичным данным о размере прибыли 20 коммерческих банков за год (млрд. руб.) 3.7 4.3 6.7 5.6 5.1 8.1 4.6 5.7 6.4 5.9 5.2 6.2 6.3 7.2 7.9 5.8 4.9 7.6 7.0 6.9 1. Упорядочиваем ряд: 3.7 3 . 7 4.6 4.9 5.1 5.2 5.6 5.7 5.8 5.9 6.2 6.3 6.4 6.7 6.9 7.0 7.2 7.6 7.9 8.1 РЕШЕНИЕ (6 шагов)
Описание слайда:
41 Применение группировки (шаги 5-6) 6. Подсчитаем количество вариант, попавших в каждый интервал, и запишем в таблицу: [3.7;4.6), [4.6;5.5), [5.5;6.4), [6.4;7.3), [7.3;8.2]5 . Вычисляем границы интервалов: X i ( размер прибыли ) [3.7;4.6) [4.6;5.5) [5.5;6.4) [6.4;7.3) [7.3;8.2 ] m i (кол- во банков) 2 4 6 5 3
Описание слайда:
Масса кролика, кгЧ а с то таГистограмма – графическое представление частотного распределения, разбитого по интервалам, где высота столбика отражает ЧАСТОТУ Частотное распределение переменной (Плотность распределения вероятностей ?) Частота – то, сколько раз встретилось данное значение переменной Интервалы должны быть одного размера.
Описание слайда:
Медиана (квартиль?) Медиана – значение, которое делит распределение пополам ( его площадь в т.ч .): половина значений больше медианы, половина – не больше . 1,0 3,2 3,2 5,7 9 ,56 ,0 7 ,1 7,9 10,4 11,0 Медиана Имеет смысл не только для количественных переменных, но и для ранговых ! ( не для качественных ).3,2
Описание слайда:
Интерквартильный размах Квартили ( quartiles ) делят распределение на четыре части так, что в каждой из них оказывается поровну значений (2-я квартиль = медиана). 1-я квартиль = 25% процентиль 3-я квартиль = 75% процентиль Интерквартильный размах – разность между третьей и первой квартилями.
Описание слайда:
Мода Мода — это варианта, которая имеет наибольшую частоту. Она соответствует определенному значению признака. Соглашения о существовании моды: Если все варианты наблюдаются с одинаковой частотой, то говорят, что вариационный ряд не имеет моды . Если две или более соседние варианты имеют наибольшие частоты, равные между собой, то мода равна средней арифметической этих вариант. Если равные варианты, имеющие наибольшие частоты, расположены не по соседству , то принято говорить, что признак имеет две и более моды (бимодальный, полимодальный признаки и т.д.)
Описание слайда:
Пример: «Середина» распределения Мода, медиана и среднее СОВПАДАЮТ для симметричного унимодального распределения К появлению перекоса чувствительнее всего среднее значениеЗАРПЛА ТА, $ ЧАСТО ТА 14 000 1 14 000 1 14 000 1 19 000 1 20 000 1 200 000 1 = 14 000 = 46 833= 16 500 14 000 46 833 16 500