Анализ данных с применением библиотек Python

Слайд 2

Подключаем или создаем среду разработки python

Подключаем или создаем среду разработки python

Слайд 3

Старый файл с данными

Старый файл с данными

Слайд 4

Новый файл python

Новый файл python

Слайд 6

Внешние модули

Модули надо установить в текущее окружение
Подключить к программе
Среда PyCharm предлагает СНАЧАЛА

Внешние модули Модули надо установить в текущее окружение Подключить к программе Среда
подключить модуль
Затем, если его нет в окружении – докачать через Интернет и установить
После скачивания среда тратит время на анализ модуля, это требует времени

Слайд 11

Добавьте (загрузите модули при необходимости)

numpy as np
scipy as sci
pandas as pd
Библиотека печати
import

Добавьте (загрузите модули при необходимости) numpy as np scipy as sci pandas
matplotlib.pyplot as plt

Слайд 12

Чтение данных

Чтение данных

Слайд 13

Что неверно?

Разделитель – точка с запятой
Десятичная точка – запятая
Лучше так
data = pd.read_csv("data1.csv",sep=";",decimal=",")

Что неверно? Разделитель – точка с запятой Десятичная точка – запятая Лучше так data = pd.read_csv("data1.csv",sep=";",decimal=",")

Слайд 18

Такая структура, как фрейм данных pandas является близким аналогом фрейма из языка

Такая структура, как фрейм данных pandas является близким аналогом фрейма из языка
R
В частности, он сам «знает» что и как надо напечатать
Фрейм состоит из переменных (колонок), и строк
Существуют механизмы выбора отдельных колонок или их множества
Существуют инструменты отбора данных в колонках (например по условию)
Потенциально существует возможность поменять местами строки и столбцы (транспонировать таблицу)

Слайд 25

Расчет отдельных показателей

print("Stat")
print("average".center(64,"="))
print(data.median())
print("variance".center(64,"="))
print(data.var())
print("std dev".center(64,"="))
print(data.std())

Расчет отдельных показателей print("Stat") print("average".center(64,"=")) print(data.median()) print("variance".center(64,"=")) print(data.var()) print("std dev".center(64,"=")) print(data.std())

Слайд 26

Специальная таблица под статистику

stat = pd.DataFrame()
stat["Avg"] = data.mean()
stat["Median"] = data.median()
stat["Variance"] = data.var()
stat["Std

Специальная таблица под статистику stat = pd.DataFrame() stat["Avg"] = data.mean() stat["Median"] =
dev"] = data.std()
print(stat)
print(stat.T)