Содержание
- 2. Немного «фраз» «Гораздо легче что-то измерить, чем понять, что именно вы измеряете.» — Джон Уильям Салливан
- 3. Постановка в случае учителя Ожидание хотим считать по всей ген. совокупности Функцию обучаем на X =>
- 4. Какая нужна выборка Интересно получить выборку, несмещенную (смещенную не более чем …) по результатам процедуры обучения:
- 5. Как это выглядит на практике?
- 6. Как это выглядит на практике?
- 7. Как это выглядит на практике?
- 8. Виды ошибок обучения
- 9. Виды ошибок обучения Переобучение, переподгонка (overtraining, overfitting) — нежелательное явление, возникающее при решении задач обучения по
- 10. Наш первый метод
- 11. Пример По материалам machinelearning.ru
- 12. Пример По материалам machinelearning.ru
- 13. Пример По материалам machinelearning.ru
- 14. Задача Дано: Найти оптимальные p и a
- 15. Постановка в случае учителя Ожидание хотим считать по всей ген. совокупности Функцию обучаем на X =>
- 16. Схема тестирования
- 17. Overfit on validation
- 18. Как не оверфитнуться? White box: Выбор решающего семейства при фиксированном объеме данных: VC оценки Оценка вероятности
- 19. Теория Вапника-Червоненкиса Владимир Наумович Вапник, Алексей Яковлевич Червоненкис Задача минимизации эмпирического риска VC-оценка (классификация):
- 20. Вероятность переобучения Воронцов Константин Вячеславович (machinelearning.ru, ШАД в Москве) Вводим слабую вероятностную аксиоматику Оцениваем вероятность переобучения:
- 21. PAC-Bayes bounds Результат алгоритма – распределение над семейством Решающая функция –среднее выборки этого распределения
- 22. Изменение процедуры подбора Игры с шагом: а давайте не будем точно решать задачку Поменяем Lossь так,
- 23. Cross-validation Рандомно поделим множество X на несколько кусочков Обучимся на одной части Проверим на оставшихся Повторим
- 24. Виды cross-validation 2-fold k-fold Random sub-sampling (e.g. bootstrapping) Leave-one-out (LOOCV)
- 25. Как принять решение по результатам CFV? Wilcoxon signed rank test для проверки на равенство Знак по
- 26. На чем тестировать? Реальные данные Поиск: РОМИП, TREC, Яндекс.ИМАТ, Yahoo LTRCh Pascal Challenge InnoCentive Искусственные данные
- 27. ОТСЕБЯТЕНА Машинное Обучение: качество
- 29. Скачать презентацию