Общие сведения о надстройке Пакет анализа и статистических функциях MS Excel. Лекция 1

Содержание

Слайд 3

Тема 1.1. Общие сведения о надстройке «Пакет анализа» и статистических функциях MS

Тема 1.1. Общие сведения о надстройке «Пакет анализа» и статистических функциях MS
Excel
Обзор существующих программных средств обработки информации. Сводка и группировка данных с использованием электронных таблиц MS Excel. Работа с мастером функций. Методы компьютерной обработки статистических данных. Технология работы в режиме «Анализ данных». Применение пакета MS Excel при статистической обработке данных. Диалоговое окно режима «Описательная статистика».
Тема 1.2. Статистические функции, связанные с режимами «Гистограмма», «Ранг», «Описательная статистика»
Функции описательной статистики: СРЗНАЧ, СРГАРМ, СРГЕОМ, МЕДИАНА, МОДА, КВАРТИЛЬ, ПЕРСЕНТИЛЬ, СТАНДОТКЛОН, ДИСП, КВАДРОТКЛ, СРОТКЛ, СТАНДОТКЛОНА, СТАНДОТКЛОНП, ЭКСЦЕСС, СКОС, МИН, МЕДИАНА, МАКС, МАКСА, НАИБОЛЬШИЙ, НАИМЕНЬШИЙ.
Гистограмма, алгоритм ее построения. Выборка. Технология формирования выборки из генеральной совокупности. Определение ранга числа в списке чисел с помощью функции ”РАНГ”.
Использование встроенных статистических функций, связанных с режимом с режимом «Описательная статистика», при анализе данных таможенной статистики.

Слайд 4

Каждые два года объем данных, которыми обладает человечество, увеличивается в десять раз!
ЧТО

Каждые два года объем данных, которыми обладает человечество, увеличивается в десять раз!
НУЖНО ДЕЛАТЬ, ЧТОБЫ ДАННЫЕ
ПРИНОСИЛИ ПОЛЬЗУ?

Слайд 5

Анализ данных – процесс обнаружения в имеющихся данных ранее неизвестных, нетривиальных, практически

Анализ данных – процесс обнаружения в имеющихся данных ранее неизвестных, нетривиальных, практически
полезных, доступных интерпретации данных, необходимых для принятия решений в различных сферах деятельности.

Слайд 6

Важное замечание:
Анализ данных концентрируется на практическом применении статистических методов не только для

Важное замечание: Анализ данных концентрируется на практическом применении статистических методов не только
того, чтобы делать выводы описательного характера (описательная и дескриптивная статистика), но и для того, чтобы предсказывать будущее изучаемых объектов (предиктивная аналитика) и давать рекомендации по принятию решений (предписывающая или прескриптивная аналитика).

Слайд 7

Описательная (дескриптивная) статистика

это раздел статистической науки, в рамках которого изучаются наиболее распространенные

Описательная (дескриптивная) статистика это раздел статистической науки, в рамках которого изучаются наиболее
методы обработки статистических данных, включающие в себя их группировку, табличное и графическое представление, количественное описание с помощью основных статистических показателей (средние величины, меры рассеяния, характеристики формы распределения и другие).

Слайд 8

Данные о росте студентов учебной группы (см)

Данные о росте студентов учебной группы (см)

Слайд 9

Вставка – статистическая гистограмма

Вставка – статистическая гистограмма

Слайд 10

Правая кнопка мыши на оси абсцисс – формат оси – длина интервала

Правая кнопка мыши на оси абсцисс – формат оси – длина интервала 3 см (справа).
3 см (справа).

Слайд 11

Уменьшение длины интервала до 1,5 см

Уменьшение длины интервала до 1,5 см

Слайд 12

Вопрос:

Какие знаете правила, используемые для определения длины интервала группирования?
Формула Стерджеса
Правило Скотта
Правило Фридмана-Диакониса

Вопрос: Какие знаете правила, используемые для определения длины интервала группирования? Формула Стерджеса Правило Скотта Правило Фридмана-Диакониса

Слайд 13

Что же делать?

На практике лучше всего попробовать несколько вариантов и выбрать из

Что же делать? На практике лучше всего попробовать несколько вариантов и выбрать
них тот, при котором гистограмма выглядит наиболее «гладкой»

Слайд 14

Альтернативный вариант:

Данные-анализ данных-гистограмма
Гистограмма. Используется для вычисления выборочных и интегральных частот попадания данных

Альтернативный вариант: Данные-анализ данных-гистограмма Гистограмма. Используется для вычисления выборочных и интегральных частот
в указанные интервалы значений. При этом рассчитываются числа попаданий для заданного диапазона ячеек.

Слайд 15

Элементы диалогового окна «Гистограмма» включают в себя:

Входной диапазон: ссылка на диапазон, содержащий

Элементы диалогового окна «Гистограмма» включают в себя: Входной диапазон: ссылка на диапазон,
анализируемые данные.
Интервал карманов (необязательный): диапазон ячеек и необязательный набор граничных значений, определяющих отрезки (карманы). Эти значения должны быть введены в возрастающем порядке. В Microsoft Excel вычисляется число попаданий данных между текущим началом отрезка и соседним большим по порядку, если такой есть. Включаются значения на нижней границе отрезка и не включаются значения на верхней границе.
Парето (отсортированная диаграмма): если установлен флажок, то данные будут представлены в порядке убывания частоты. Если флажок снят, то данные в выходном диапазоне выводятся в порядке возрастания отрезков.
Интегральный процент: если установлен флажок, то будут вычислены и графически отмечены накопленные частости.
Вывод графика: если установлен флажок, то автоматически создается встроенная диаграмма - гистограмма.

Слайд 17

Описательная статистика

дает ответы на вопросы о том, что общего есть в анализируемых

Описательная статистика дает ответы на вопросы о том, что общего есть в
данных и какие в них есть различия.
другими словами, это расчет определенных статистических показателей для:
-измерения центра распределения
-измерения разброса данных

Слайд 18

Описательная статистика в MS EXCEL

Следует отметить, что в MS Excel реализованы статистические

Описательная статистика в MS EXCEL Следует отметить, что в MS Excel реализованы
функции, вычисляемые только по простым формулам.
В частности, функции СРЗНАЧ(), СРГАРМ(), СРГЕОМ() возвращают среднее значение (среднее арифметическое, гармоническое, геометрическое, соответственно) аргументов. Например, если диапазон C5:C10 содержит числа, формула =СРЗНАЧ(C5:C10) возвращает среднюю арифметическую простую этих чисел.
Структурные средние медиану и моду вычисляют с помощью функций МЕДИАНА(), МОДА(), аргументами которых должны являться числовые массивы. Функции КВАРТИЛЬ(), ПРОЦЕНТИЛЬ () возвращает k-ю квартиль и процентиль для значений диапазона, соответственно.

Слайд 19

Описательная статистика в MS EXCEL

Функции ДИСП.Г(), ДИСП.В(), СРОТКЛ() возвращают генеральную дисперсию, исправленную

Описательная статистика в MS EXCEL Функции ДИСП.Г(), ДИСП.В(), СРОТКЛ() возвращают генеральную дисперсию,
дисперсию и среднее абсолютное линейное отклонение значений аргументов, соответственно. Логические значения и текст игнорируются. Функция КВАДРОТКЛ() возвращает сумму квадратов отклонений точек данных от их среднего. Для вычисления выборочного и исправленного среднеквадратического отклонения применяются функции СТАНДОТКЛОН.Г() и СТАНДОТКЛОН.В(), соответственно. Аргументами функций должны являться числовые массивы, логические значения и текст игнорируются.
Несмещенные статистические оценки коэффициентов асимметрии и эксцесса возвращают функции ЭКСЦЕСС() и СКОС(), соответственно.
Минимальное и максимальное значения из числового массива позволяют выделить функции МИН() и МАКС(), соответственно. Наряду с указанными функциями имеется возможность определить k-ое по величине значение из множества данных с помощью функции НАИБОЛЬШИЙ(), аргументами которой являются массив данных и значение k. Аналогично определяется функция НАИМЕНЬШИЙ().

Слайд 20

ОПИСАТЕЛЬНАЯ СТАТИСТИКА В НАДСТРОЙКЕ «АНАЛИЗ ДАННЫХ»

Описательная статистика.
Это средство анализа служит для

ОПИСАТЕЛЬНАЯ СТАТИСТИКА В НАДСТРОЙКЕ «АНАЛИЗ ДАННЫХ» Описательная статистика. Это средство анализа служит
создания одномерного статистического отчета, содержащего информацию о центральной тенденции и изменчивости входных данных

Слайд 21

Элементы диалогового окна «Описательная статистика»:

Входной диапазон: ссылка на диапазон, содержащий анализируемые данные,

Элементы диалогового окна «Описательная статистика»: Входной диапазон: ссылка на диапазон, содержащий анализируемые
состоящие не менее чем из двух смежных диапазонов данных, данные в которых расположены по строкам или столбцам.
Группирование: в зависимости от расположения данных во входном диапазоне, следует установить переключатель в положение «По столбцам» или «По строкам».

Слайд 22

Элементы диалогового окна «Описательная статистика» (продолжение):

Уровень надежности: для того чтобы в выходную

Элементы диалогового окна «Описательная статистика» (продолжение): Уровень надежности: для того чтобы в
таблицу включить строку для уровня надежности, необходимо установить соответствующий флажок и ввести в поле требуемое значение надежности интервальных оценок.
Выходной диапазон: необходимо ввести ссылку на левую верхнюю ячейку выходного диапазона. Этот инструмент анализа выводит два столбца сведений для каждого набора данных, в которых левый столбец содержит названия описательных статистик; а правый – их значения.

Слайд 23

Элементы диалогового окна «Описательная статистика» (окончание):

Итоговая статистика: необходимо установить флажок для вывода

Элементы диалогового окна «Описательная статистика» (окончание): Итоговая статистика: необходимо установить флажок для
значений следующих описательных статистик:
Среднее, Стандартная ошибка (среднего),
Медиана, Мода,
Стандартное отклонение, Дисперсия выборки,
Эксцесс, Асимметричность,
Интервал,
Минимум, Максимум,
Сумма, Счет,
Уровень надежности.