Машинное обучение: начало

Содержание

Слайд 2

Знакомство: Куралёнок Игорь

Руководитель группы модернизации поиска. Яндекс.
+7(921)9031911

Знакомство: Куралёнок Игорь Руководитель группы модернизации поиска. Яндекс. +7(921)9031911

Слайд 3

Что почитать?

Википедия (лучше en)
T. Hastie, R. Tibshirani, J. Friedman “The

Что почитать? Википедия (лучше en) T. Hastie, R. Tibshirani, J. Friedman “The
elements of Statistical Learning”
T. Mitchell “Machine Learning”
Труды конференций: ICML, KDD, NIPS, CIKM,…
Журналы: JMLR, JML, JIS, NC
Видео курс: www.ml-class.org

Слайд 4

Какие у нас цели?

Уметь сформулировать задачу в терминах ML
Найти подходящий

Какие у нас цели? Уметь сформулировать задачу в терминах ML Найти подходящий
класс решающих алгоритмов по формулировке
Ориентироваться в области и знать «где посмотреть» существующие решения
Понимать границы применимости

Слайд 5

Что нужно, чтобы понять?

ТВ и МС
Линейная алгебра
Язык программирования

Что нужно, чтобы понять? ТВ и МС Линейная алгебра Язык программирования

Слайд 6

Как отчитываться?

К концу обучения сделать 15 минутную презентацию по применению ML

Как отчитываться? К концу обучения сделать 15 минутную презентацию по применению ML
в вашей любимой задаче.
Задачки на Octave
Ошибки к лекциях и в слайдам :)

Слайд 7

Машинное обучение: определения

Tom M. Mitchell: A computer program is said to learn

Машинное обучение: определения Tom M. Mitchell: A computer program is said to
from experience E with respect to some class of tasks T and performance measure P, if its performance at tasks in T, as measured by P, improves with experience E.

Webster: machine learning - The ability of a machine to improve its performance based on previous results.

Ru.Wikipedia: Машинное обучение — обширный подраздел искусственного интеллекта, изучающий методы построения алгоритмов, способных обучаться.

Слайд 8

Немного истории

50-60 базы знаний, полнотекстовый поиск, распознавание образов, нейронные сети
70-е

Немного истории 50-60 базы знаний, полнотекстовый поиск, распознавание образов, нейронные сети 70-е
символьный вывод, Quinlan ID3 деревья, разумные практические результаты, VC-оценки
80-е первые конференции, много практического применения, активное применение кластеризации в анализе
90-е повторное семплирование в ML, SVM, применение в IR, ML != DM, LASSO, bagging, boosting, CF валидация
00-е Compressed sensing, развитие ансамблей,…

Слайд 9

Основные понятия

Область работы
Опыт = Data Set = DS
Целевая функция

Основные понятия Область работы Опыт = Data Set = DS Целевая функция = Target Решающая функция
= Target
Решающая функция

Слайд 10

Какое бывает обучение

Делить можно по:
способу генерации DS;
виду целевой функции;

Какое бывает обучение Делить можно по: способу генерации DS; виду целевой функции; классу решающих функций;
классу решающих функций;

Слайд 11

Деление по способу формирования DS/U

Transductive
Обычное
Активное
Стохастическая оптимизация
Бюджетное
Бандиты

Деление по способу формирования DS/U Transductive Обычное Активное Стохастическая оптимизация Бюджетное Бандиты
Необычное
Online learning
Reinforcement learning

Слайд 12

Transductive learning

Фиксируем множество примеров
Фиксируем рабочее множество
Обучаемся на всех/доступных примерах

Transductive learning Фиксируем множество примеров Фиксируем рабочее множество Обучаемся на всех/доступных примерах

Слайд 13

Обычное обучение

Фиксируем множество примеров
Определяем генеральную совокупность
Обучаемся на доступных примерах

Обычное обучение Фиксируем множество примеров Определяем генеральную совокупность Обучаемся на доступных примерах

Слайд 14

Активное обучение

Фиксируем множество примеров
Определяем генеральную совокупность
Обучаемся на доступных примерах

Активное обучение Фиксируем множество примеров Определяем генеральную совокупность Обучаемся на доступных примерах
Пополняем множество примеров по просьбе алгоритма и переходим к п. 3

Слайд 15

Активное обучение

Стохастическая оптимизация:
Бюджетное
Бандиты

Активное обучение Стохастическая оптимизация: Бюджетное Бандиты

Слайд 16

Деление по целевой функции

С учителем
Классификация
Аппроксимация (экстраполяция)
Metric learning
Последовательности

Деление по целевой функции С учителем Классификация Аппроксимация (экстраполяция) Metric learning Последовательности
Без учителя
Кластеризация
Уменьшение размерности
Representation Learning
Смешанные
Кластеризация с условиями
Все те же, что и с учителем
Transfer learning

Слайд 17

Обучение с учителем
Классификация
Аппроксимация (экстраполяция)
Metric learning = Классификация
Последовательности

Обучение с учителем Классификация Аппроксимация (экстраполяция) Metric learning = Классификация Последовательности

Слайд 18

Другое обучение

Без учителя
Кластеризация
Уменьшение размерности
Representation Learning
Смешанные
Кластеризация с

Другое обучение Без учителя Кластеризация Уменьшение размерности Representation Learning Смешанные Кластеризация с
условиями
Все те же, что и с учителем
Transfer learning

Слайд 19

Деление по решающей функции

Линейные решения
Графы
Нейронные сети (ANN)
Параметрические семейства

Деление по решающей функции Линейные решения Графы Нейронные сети (ANN) Параметрические семейства
функций
Instance based learning
Предикаты
Ансамбли

Слайд 20

Деление по решающей функции (1)

Линейные решения
Линейная регрессия, логистическая регрессия

Деление по решающей функции (1) Линейные решения Линейная регрессия, логистическая регрессия Скрытый
Скрытый дискриминантный анализ (LDA/QDA*)
LASSO
SVM
LSI*

Слайд 21

Деление по решающей функции (2)

Графы
Деревья решений
Байесовы сети
Conditional Random

Деление по решающей функции (2) Графы Деревья решений Байесовы сети Conditional Random
Fields
Нейронные сети (ANN)
Персептронные сети
Сети Хопфилда
Машины Больцмана
Сети Кохоннена

Слайд 22

Деление по решающей функции (3)

Параметрические семейства функций
Сэмплирование
Генетические алгоритмы
PLSI/LDA/прочие

Деление по решающей функции (3) Параметрические семейства функций Сэмплирование Генетические алгоритмы PLSI/LDA/прочие
модели с распределениями (им нет числа)
Instance based learning
kNN

Слайд 23

Деление по решающей функции (4)

Предикаты
Логические выражения
Регулярки/NFA/DFA
Ансамбли
Просто

Деление по решающей функции (4) Предикаты Логические выражения Регулярки/NFA/DFA Ансамбли Просто ансамбли Bagging Boosting BagBoo/BooBag
ансамбли
Bagging
Boosting
BagBoo/BooBag

Слайд 24

ОТСЕБЯТЕНА

Машинное Обучение: Начало

ОТСЕБЯТЕНА Машинное Обучение: Начало

Слайд 25

Дедуктивные/индуктивные методы

Дедуктивные/индуктивные методы

Слайд 26

Data Mining vs. Machine Learning

Data Mining vs. Machine Learning

Слайд 27

Artificial Intelligence vs. Machine Learning

Artificial Intelligence vs. Machine Learning
Имя файла: Машинное-обучение:-начало.pptx
Количество просмотров: 807
Количество скачиваний: 5