Содержание
- 2. Dataset Исследование проводилось над датасетом, описывающим сорта различных вин. Таблица состоит из 150930 строк и 10
- 3. Описание набора данных COUNTRY(КАТЕГОРИАЛЬНАЯ НОМИНАЛЬНАЯ ПЕРЕМЕННАЯ) – СТРАНА, ИЗ КОТОРОЙ РОДОМ ВИНО DESCRIPTION(ОПИСАНИЕ) - НЕСКОЛЬКО ФРАЗ
- 4. Описание столбцов Типы данных в столбцах Количество пустых значений в столбцах
- 5. Сортировка Для того, чтобы нам было удобнее работать с данными, отсортируем вина от лучших к худшим(согласно
- 6. Рассмотрим цены за бутылку вина и проверим, преобладает ли количество сортов вин, цена которых больше 50$
- 7. Построим гистограмму для того, чтобы проанализировать, в каких странах производится наибольшее количество вин В США производится
- 8. Построим график, чтобы определить, какой рейтинг сортов вин преобладает в нашем датасете У большинства вин рейтинг
- 9. Выведем срез таблицы с 5 по 15 строку и транспонируем его
- 10. Построим круговую диаграмму для того, чтобы определить, какой вид вин преобладает в нашем датасете: с рейтингом
- 11. Создадим сводную таблицу, в которой будет отражено, сколько сортов вин производится в каждой из стран Наименьшее
- 12. В данной сводной таблице отразим количество видов вин, создаваемых в винодельне того или иного винодельческого района
- 13. В данном графике отразим, сколько сортов вин производится в том или ином винодельческом регионе(стоит отметить, что
- 14. Создадим сводную таблицу, в которой будет отражено количество видов вин определенной цены, производимых из того или
- 15. Выводы У БОЛЬШИНСТВА ВИН ЦЕНА ЗА БУТЫЛКУ МЕНЕЕ 50$ В США ПРОИЗВОДИТСЯ НАИБОЛЬШЕЕ КОЛИЧЕСТВО ВИДОВ ВИН.
- 17. Скачать презентацию