Слайд 4Говорят, что компьютерная программа обучается на основе опыта E по отношению к
![Говорят, что компьютерная программа обучается на основе опыта E по отношению к](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/856280/slide-3.jpg)
некоторому классу задач T и меры качества P, если качество решения задач из T, измеренное на основе P, улучшается с приобретением опыта E.
Слайд 5Области применения ML
Распознавание речи.
Компьютерное зрение.
Компьютерная лингвистика и обработка естественных языков.
Медицинская диагностика.
Техническая диагностика.
Рубрикация
![Области применения ML Распознавание речи. Компьютерное зрение. Компьютерная лингвистика и обработка естественных](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/856280/slide-4.jpg)
текстов.
Интеллектуальные игры.
Слайд 6Главные вопросы ML
Какое количество и какой информации необходимо для обучения?
Какие данные лучше
![Главные вопросы ML Какое количество и какой информации необходимо для обучения? Какие](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/856280/slide-5.jpg)
выбирать для обучения и почему?
Какой алгоритм решает поставленную задачу наилучшим образом?
Как свести какую-либо задач обучения к аппроксимации или оптимизации некоторой функции?
Слайд 7Основные понятия
Признак (feature)
Объект (object)
Чистые данные (tidy data)
Набор данных (dataset)
Модель
Шкала
![Основные понятия Признак (feature) Объект (object) Чистые данные (tidy data) Набор данных (dataset) Модель Шкала](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/856280/slide-6.jpg)
Слайд 8Определение чистых данных (tidy data)
Каждая переменная соответствует колонке
Каждое измерение соответствует строке
Каждая таблица\файл
![Определение чистых данных (tidy data) Каждая переменная соответствует колонке Каждое измерение соответствует](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/856280/slide-7.jpg)
содержит данные об одном виде наблюдений\экспериментов
Слайд 9Обзор данных (data exploration)
Отсутствующие данные
Значения вне разумного диапазона
Ошибки в единицах измерения (шкалах)
Ошибки
![Обзор данных (data exploration) Отсутствующие данные Значения вне разумного диапазона Ошибки в](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/856280/slide-8.jpg)
в подписях переменных (колонок)
Ошибки в классах переменных
Слайд 10Предварительная обработка данных
Создание новых переменных
Слияние наборов данных
Трансформация переменных
Удаление несогласованных данных
![Предварительная обработка данных Создание новых переменных Слияние наборов данных Трансформация переменных Удаление несогласованных данных](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/856280/slide-9.jpg)
Слайд 11Этапы анализа данных
Определить вопрос
Определение идеального набора данных
Определение доступного набора данных
Получение данных
Очистка данных
Исследовательский
![Этапы анализа данных Определить вопрос Определение идеального набора данных Определение доступного набора](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/856280/slide-10.jpg)
анализ данных
Статистическое моделирование
Интерпретация результатов
Проверка результатов
Описание результатов
Создание воспроизводимого кода
Слайд 12Этапы процесса машинного обучения
Получение данных
Трансформация данных
Очистка данных
Визуализация данных
EDA
Выбор модели
Обучение модели
Верификация результата
![Этапы процесса машинного обучения Получение данных Трансформация данных Очистка данных Визуализация данных](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/856280/slide-11.jpg)
Слайд 13Основные типы шкал
Бинарные (Пол, наличие боли в спине, в сознании ли пациент).
Номинальные
![Основные типы шкал Бинарные (Пол, наличие боли в спине, в сознании ли](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/856280/slide-12.jpg)
(Тип боли: колющая, режущая, ноющая).
Порядковые (Общее состояние больного: удовлетворительное, средней тяжести, тяжелое, крайне тяжелое).
Количественные (Температура тела, пульс, артериальное давление).
Слайд 14Основные форматы хранения наборов данных
CSV
XML
JSON
XLSX
DB
![Основные форматы хранения наборов данных CSV XML JSON XLSX DB](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/856280/slide-13.jpg)
Слайд 15Главные задачи машинного обучения
Обучение с учителем (supervised learning)
Регрессия
Классификация
Обучение без учителя (unsupervised learning)
Понижение
![Главные задачи машинного обучения Обучение с учителем (supervised learning) Регрессия Классификация Обучение](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/856280/slide-14.jpg)
размерности
Обнаружение аномалий
Кластеризация
Рекомендательные системы
Обучение с подкреплением (reinforecement learning)
Основой машинного обучения является оптимизация некоторой функции ошибки