Основные понятия машинного обучения и анализа данных

Содержание

Слайд 4

Говорят, что компьютерная программа обучается на основе опыта E по отношению к

Говорят, что компьютерная программа обучается на основе опыта E по отношению к
некоторому классу задач T и меры качества P, если качество решения задач из T, измеренное на основе P, улучшается с приобретением опыта E.

Слайд 5

Области применения ML

Распознавание речи.
Компьютерное зрение.
Компьютерная лингвистика и обработка естественных языков.
Медицинская диагностика.
Техническая диагностика.
Рубрикация

Области применения ML Распознавание речи. Компьютерное зрение. Компьютерная лингвистика и обработка естественных
текстов.
Интеллектуальные игры.

Слайд 6

Главные вопросы ML

Какое количество и какой информации необходимо для обучения?
Какие данные лучше

Главные вопросы ML Какое количество и какой информации необходимо для обучения? Какие
выбирать для обучения и почему?
Какой алгоритм решает поставленную задачу наилучшим образом?
Как свести какую-либо задач обучения к аппроксимации или оптимизации некоторой функции?

Слайд 7

Основные понятия

Признак (feature)
Объект (object)
Чистые данные (tidy data)
Набор данных (dataset)
Модель
Шкала

Основные понятия Признак (feature) Объект (object) Чистые данные (tidy data) Набор данных (dataset) Модель Шкала

Слайд 8

Определение чистых данных (tidy data)

Каждая переменная соответствует колонке
Каждое измерение соответствует строке
Каждая таблица\файл

Определение чистых данных (tidy data) Каждая переменная соответствует колонке Каждое измерение соответствует
содержит данные об одном виде наблюдений\экспериментов

Слайд 9

Обзор данных (data exploration)

Отсутствующие данные
Значения вне разумного диапазона
Ошибки в единицах измерения (шкалах)
Ошибки

Обзор данных (data exploration) Отсутствующие данные Значения вне разумного диапазона Ошибки в
в подписях переменных (колонок)
Ошибки в классах переменных

Слайд 10

Предварительная обработка данных

Создание новых переменных
Слияние наборов данных
Трансформация переменных
Удаление несогласованных данных

Предварительная обработка данных Создание новых переменных Слияние наборов данных Трансформация переменных Удаление несогласованных данных

Слайд 11

Этапы анализа данных

Определить вопрос
Определение идеального набора данных
Определение доступного набора данных
Получение данных
Очистка данных
Исследовательский

Этапы анализа данных Определить вопрос Определение идеального набора данных Определение доступного набора
анализ данных
Статистическое моделирование
Интерпретация результатов
Проверка результатов
Описание результатов
Создание воспроизводимого кода

Слайд 12

Этапы процесса машинного обучения

Получение данных
Трансформация данных
Очистка данных
Визуализация данных
EDA
Выбор модели
Обучение модели
Верификация результата

Этапы процесса машинного обучения Получение данных Трансформация данных Очистка данных Визуализация данных

Слайд 13

Основные типы шкал

Бинарные (Пол, наличие боли в спине, в сознании ли пациент).
Номинальные

Основные типы шкал Бинарные (Пол, наличие боли в спине, в сознании ли
(Тип боли: колющая, режущая, ноющая).
Порядковые (Общее состояние больного: удовлетворительное, средней тяжести, тяжелое, крайне тяжелое).
Количественные (Температура тела, пульс, артериальное давление).

Слайд 14

Основные форматы хранения наборов данных

CSV
XML
JSON
XLSX
DB

Основные форматы хранения наборов данных CSV XML JSON XLSX DB

Слайд 15

Главные задачи машинного обучения

Обучение с учителем (supervised learning)
Регрессия
Классификация
Обучение без учителя (unsupervised learning)
Понижение

Главные задачи машинного обучения Обучение с учителем (supervised learning) Регрессия Классификация Обучение
размерности
Обнаружение аномалий
Кластеризация
Рекомендательные системы
Обучение с подкреплением (reinforecement learning)
Основой машинного обучения является оптимизация некоторой функции ошибки
Имя файла: Основные-понятия-машинного-обучения-и-анализа-данных.pptx
Количество просмотров: 59
Количество скачиваний: 5