Обучение без учителя

Февраль 20, 2021

Главная
Разное
Обучение без учителя

Содержание

2. Пример После проведения социологического исследования, как выявить группы людей сходных мнений? Есть большая база данных изображений,
3. Обучение без учителя Пусть, имеется набор наблюдений: Требуется некоторым образом сделать суждения о наблюдаемых данных Трудно
4. Обучение без учителя Кластеризация Разбиение наблюдений на некоторые группы, с максимально близкими наблюдениями внутри групп и
5. Обучение без учителя Кластеризация К-средних Смесь нормальных распределений … Понижение размерности Метод главных компонент SOM …
6. Отличие от классификации Множество ответов неизвестно Нет четкой меры качества решений Задачи поставлены крайне нечетко
7. Кластеризация Постановка задачи (1) Пусть, имеется набор наблюдений: Требуется разбить на некоторые непересекающиеся подмножества (группы, кластеры),
8. Кластеризация Постановка задачи (2) Пусть, так же, имеется некоторая мера , характеризующая «схожесть» между объектами Тогда,
9. Кластеризация Модель кластеров Под моделью кластеров будем понимать некоторое параметрическое семейство отображений из исходного пространства в
10. Алгоритм К-средних Кто хочет рассказать как он работает? Случайным образом выбрать k средних mj j=1,…,k; Для
11. Иллюстрация
12. Алгоритм К-средних Мера схожести Евклидово расстояние в пространстве Х Модель кластеров Пространство поиска - центры масс
13. Алгоритм К-средних Однопараметрический Требует знания только о количестве кластеров Рандомизирован Зависит от начального приближения Не учитывает
14. EM алгоритм Общая идеология Пусть есть вектор неизвестных величин и параметрическая модель с так же неизвестным
15. EM алгоритм Общая идеология Возьмем некоторые начальные приближения Итеративно t =1… делаем два шага: Expect: согласно
16. Кластеризация смесью нормальных распределений Будем считать, что наблюдения сгенерированы смесью нормальных распределений, то есть: Пусть k
17. Кластеризация смесью нормальных распределений Возьмем некоторые (случайные) начальные приближения Итеративно для t =1… : E: согласно
18. Иллюстрация
19. Кластеризация смесью нормальных распределений Плюсы Более полная модель кластеров (больше итоговой информации) Более качественная аппроксимация Эффективная
20. Иллюстрация
21. Понижение размерности наблюдаемых данных Зачастую, наблюдаемые данные могут обладать высокой размерностью, но в действительности быть функцией
22. Метод главных компонент Пусть имеется набор наблюдений Будем строить новый базис в пространстве , таким образом
23. Метод главных компонент Расчет базиса Сдвинем все данные таким образом, чтобы их выборочное среднее равнялось нулю
24. Метод главных компонент Расчет базиса Векторами нового базиса будут являться собственные вектора ковариационной матрицы Собственные числа
25. Иллюстрация Убирая базисные вектора с малыми значениями мы можем сократить размерность без существенной потери информации *Вопрос:
26. Случай нормального распределения Расстояние от центра распределения в новой системе координат равно: Так называемое расстояние Махалонобиса
27. Метод главных компонент Связь с линейной аппроксимацией Если рассмотреть систему проекций данных на первые главных компонент,
28. Метод главных компонент Следует применять: Данные распределены нормально и требуется привести их к более удобной форме
29. Самоорганизующиеся карты SOM (Карты Кохенена) Основная идея вписать в данные сетку низкой размерности, и анализировать ее,
30. SOM (Карты Кохенена) Модель сетки Матрица узлов Соседство - 4 или 8 связность Каждому узлу соответствует
31. SOM (Карты Кохенена) Алгоритм построения Проинициализируем случайными значениями Далее, в случайном порядке будем предъявлять наблюдения и
32. SOM (Карты Кохенена) Иллюстрация: исходные данные
33. SOM (Карты Кохенена) Иллюстрация: сетка
34. SOM (Карты Кохенена) Иллюстрация: проекции на матрицу
35. SOM (Карты Кохенена) Практическое использование Данные представляют некоторую поверхность, требуется сократить размерность Хорошо подходят для последующей
36. Задание №2 Каждому будут выданы Данные (3 набора) Алгоритмы классификации, реализованные в MatLab Требуется Для каждого
37. Содержание отчета Применявшиеся методы Список Алгоритм, по которому оценивались алгоритмы и выбирались параметры Результаты в виде
39. Скачать презентацию

Пример
После проведения социологического исследования, как выявить группы людей сходных мнений?
Есть большая база

данных изображений, требуется разделить их на группы
Сегментация

Обучение без учителя
Пусть, имеется набор наблюдений:
Требуется некоторым образом сделать суждения о наблюдаемых

данных

Трудно придумать более общую постановку, неправда ли?

Обучение без учителя
Кластеризация
Разбиение наблюдений на некоторые группы, с максимально близкими наблюдениями внутри

групп и максимально далекими между
Понижение размерности
Понижение размерности наблюдений с сохранением описательной силы
Анализ плотности распределения
Получить аппроксимацию плотности распределения вероятности наблюдений или поиск их особых точек

Слайд 5

Обучение без учителя
Кластеризация
К-средних
Смесь нормальных распределений
…
Понижение размерности
Метод главных компонент
SOM
…
Анализ плотности распределения
Аппроксимация плотности распределения

через обучение с учителем
Сдвиг среднего для поиска экстремумов плотности распределения
…

Слайд 6

Отличие от классификации
Множество ответов неизвестно
Нет четкой меры качества решений
Задачи поставлены крайне нечетко

Слайд 7

Кластеризация Постановка задачи (1)
Пусть, имеется набор наблюдений:
Требуется разбить на некоторые непересекающиеся подмножества (группы,

кластеры), таким образом, что объекты внутри одной группы соотносились сильнее чем объекты из разных групп

Слайд 8

Кластеризация Постановка задачи (2)
Пусть, так же, имеется некоторая мера , характеризующая «схожесть» между

объектами
Тогда, требуется найти некоторое разбиение:
Такое, что минимизируется
И максимизируется

Слайд 9

Кластеризация Модель кластеров
Под моделью кластеров будем понимать некоторое параметрическое семейство отображений из исходного

пространства в множество индексов кластеров
Множество параметров, пространством поиска
Нахождения параметров - кластеризацией

Слайд 10

Алгоритм К-средних
Кто хочет рассказать как он работает?
Случайным образом выбрать k средних mj

j=1,…,k;
Для каждого xi i=1,…,p подсчитать расстояние до каждого из mj j=1,…,k,
Отнести (приписать) xi к кластеру j’, расстояние до mj’ минимально;
Пересчитать средние mj j=1,…,k по всем кластерам;
Повторять шаги 2, 3 пока кластеры не перестанут изменяться;

Слайд 11

Иллюстрация

Слайд 12

Алгоритм К-средних
Мера схожести
Евклидово расстояние в пространстве Х
Модель кластеров
Пространство поиска - центры

масс

Слайд 13

Алгоритм К-средних
Однопараметрический
Требует знания только о количестве кластеров
Рандомизирован
Зависит от начального приближения
Не учитывает строения

самих кластеров

Слайд 14

EM алгоритм Общая идеология
Пусть есть вектор неизвестных величин
и параметрическая модель с так же

неизвестным параметром(ами)
Пусть возможно рассчитать правдоподобие
Наша задача подобрать такие и , чтобы правдоподобие было максимальным

Слайд 15

EM алгоритм Общая идеология
Возьмем некоторые начальные приближения
Итеративно t =1… делаем два шага:
Expect:

согласно текущему значению высчитываем наиболее вероятные значения
Maximize: согласно текущем значениям высчитываем новое значение максимизирующее функцию правдоподобия
Остановимся когда правдоподобие стабилизируется

Слайд 16

Кластеризация смесью нормальных распределений
Будем считать, что наблюдения сгенерированы смесью нормальных распределений, то

есть:
Пусть k известно заранее, будем осуществлять кластеризацию ЕМ алгоритмом

- Индексы кластеров наблюдений

Слайд 17

Кластеризация смесью нормальных распределений
Возьмем некоторые (случайные) начальные приближения
Итеративно для t =1… :
E:

согласно текущему значению высчитываем наиболее вероятные значения индексов кластеров для наблюдений из
M: согласно текущем значениям индексов пересчитаем параметры распределений (методом максимального правдоподобия)

Слайд 18

Иллюстрация

Слайд 19

Кластеризация смесью нормальных распределений
Плюсы
Более полная модель кластеров (больше итоговой информации)
Более качественная аппроксимация
Эффективная

оценка качества кластеризации (правдоподобие)

Минусы
Все равно некоторая ограниченная модель со строгой «геометрией»
Чувствительность к размерности и нормализации данных

Слайд 20

Иллюстрация

Слайд 21

Понижение размерности наблюдаемых данных
Зачастую, наблюдаемые данные могут обладать высокой размерностью, но в

действительности быть функцией всего нескольких скрытых (латентных) переменных
Задачей понижения размерности является некоторое преобразование исходного пространства в пространство более низкой размерности без существенной потери информативности данных

Слайд 22

Метод главных компонент
Пусть имеется набор наблюдений
Будем строить новый базис в пространстве ,

таким образом что:
Центр координат совпадает с мат. ожиданием наблюдений (выборочным средним)
Первый вектор направлен таким образом, что дисперсия вдоль него была максимальной
Каждый последующий вектор ортогонален предыдущим и направлен по направлению максимальной дисперсии

Слайд 23

Метод главных компонент Расчет базиса
Сдвинем все данные таким образом, чтобы их выборочное среднее

равнялось нулю
Рассчитаем ковариационную матрицу:

Ковариация двух сл. величин

Выборочное среднее

Слайд 24

Метод главных компонент Расчет базиса
Векторами нового базиса будут являться собственные вектора ковариационной матрицы
Собственные

числа – значениями дисперсии наблюдений вдоль них

Слайд 25

Иллюстрация
Убирая базисные вектора с малыми значениями мы можем сократить размерность без существенной

потери информации

*Вопрос: Почему это так?

Слайд 26

Случай нормального распределения
Расстояние от центра распределения в новой системе координат равно:
Так называемое

расстояние Махалонобиса
Пропорционально правдоподобию наблюдения

Слайд 27

Метод главных компонент Связь с линейной аппроксимацией
Если рассмотреть систему проекций данных на первые

главных компонент, то мы получим систему наилучших линейных приближений данных (в смысле среднеквадратичного отклонения)

Слайд 28

Метод главных компонент
Следует применять:
Данные распределены нормально и требуется привести их к более

удобной форме
Или предполагается, что данные содержатся в линейном многообразии исходного пространства и требуется выделить лишь его и сократить размерность
НЕ следует применять:
Распределение данных произвольно и далеко от нормального
Данные нелинейные

Слайд 29

Самоорганизующиеся карты SOM (Карты Кохенена)
Основная идея
вписать в данные сетку низкой размерности, и анализировать

ее, вместо самих данных

Слайд 30

SOM (Карты Кохенена) Модель сетки
Матрица узлов
Соседство - 4 или 8 связность
Каждому узлу соответствует

точка в исходном пространстве

Слайд 31

SOM (Карты Кохенена) Алгоритм построения
Проинициализируем случайными значениями
Далее, в случайном порядке будем предъявлять

наблюдения и для каждого:
Вычисляем ближайший узел
Выберем множество соседей узла, такое что расстояние на сетке между ними меньше r
Для некоторого множества соседей узла, включая сам узел, изменяем их положения согласно:
Повторяем процедуру уменьшая r и пока сеть не стабилизируется

Слайд 32

SOM (Карты Кохенена) Иллюстрация: исходные данные

Слайд 33

SOM (Карты Кохенена) Иллюстрация: сетка

Слайд 34

SOM (Карты Кохенена) Иллюстрация: проекции на матрицу

Слайд 35

SOM (Карты Кохенена) Практическое использование
Данные представляют некоторую поверхность, требуется сократить размерность
Хорошо подходят

для последующей кластеризации
Могут работать «online»
В случае слишком сложных данных не информативны

Слайд 36

Задание №2
Каждому будут выданы
Данные (3 набора)
Алгоритмы классификации, реализованные в MatLab
Требуется
Для каждого

из наборов натренировать наилучший возможный классификатор (из выданных вам)
Написать отчет (по форме лежащий на сайте) описывающий каким образом вы выбирали классификатор и настроили параметры
Оценка складывается из:
Аккуратности и полноты отчета
Результатов работы Вами присланного классификатора на наших данных (часть выборки мы дали Вам, часть оставили себе)

Слайд 37

Содержание отчета
Применявшиеся методы
Список
Алгоритм, по которому оценивались алгоритмы и выбирались параметры
Результаты в виде
Графиков
Таблиц
Выводы

(кратко!)
Какой классификатор был выбран в итоге
Почему именно этот классификатор

Обучение без учителя

Содержание

ПримерПосле проведения социологического исследования, как выявить группы людей сходных мнений?Есть большая база

Обучение без учителяПусть, имеется набор наблюдений:Требуется некоторым образом сделать суждения о наблюдаемых

Обучение без учителяКластеризацияРазбиение наблюдений на некоторые группы, с максимально близкими наблюдениями внутри

Отличие от классификацииМножество ответов неизвестноНет четкой меры качества решенийЗадачи поставлены крайне нечетко

Кластеризация Постановка задачи (1)Пусть, имеется набор наблюдений:Требуется разбить на некоторые непересекающиеся подмножества (группы,

Кластеризация Постановка задачи (2)Пусть, так же, имеется некоторая мера , характеризующая «схожесть» между

Кластеризация Модель кластеровПод моделью кластеров будем понимать некоторое параметрическое семейство отображений из исходного

Алгоритм К-среднихКто хочет рассказать как он работает?Случайным образом выбрать k средних mj

Иллюстрация

Алгоритм К-среднихМера схожестиЕвклидово расстояние в пространстве Х Модель кластеровПространство поиска - центры

Алгоритм К-среднихОднопараметрическийТребует знания только о количестве кластеровРандомизированЗависит от начального приближенияНе учитывает строения

EM алгоритм Общая идеологияПусть есть вектор неизвестных величини параметрическая модель с так же

EM алгоритм Общая идеологияВозьмем некоторые начальные приближения Итеративно t =1… делаем два шага:Expect:

Кластеризация смесью нормальных распределенийБудем считать, что наблюдения сгенерированы смесью нормальных распределений, то

Кластеризация смесью нормальных распределенийВозьмем некоторые (случайные) начальные приближенияИтеративно для t =1… :E:

Иллюстрация

Кластеризация смесью нормальных распределенийПлюсыБолее полная модель кластеров (больше итоговой информации)Более качественная аппроксимацияЭффективная

Иллюстрация

Понижение размерности наблюдаемых данныхЗачастую, наблюдаемые данные могут обладать высокой размерностью, но в

Метод главных компонентПусть имеется набор наблюденийБудем строить новый базис в пространстве ,

Метод главных компонент Расчет базисаСдвинем все данные таким образом, чтобы их выборочное среднее

Метод главных компонент Расчет базисаВекторами нового базиса будут являться собственные вектора ковариационной матрицыСобственные

ИллюстрацияУбирая базисные вектора с малыми значениями мы можем сократить размерность без существенной

Случай нормального распределенияРасстояние от центра распределения в новой системе координат равно:Так называемое

Метод главных компонент Связь с линейной аппроксимациейЕсли рассмотреть систему проекций данных на первые

Метод главных компонентСледует применять:Данные распределены нормально и требуется привести их к более

Самоорганизующиеся карты SOM (Карты Кохенена)Основная идеявписать в данные сетку низкой размерности, и анализировать

SOM (Карты Кохенена) Модель сеткиМатрица узловСоседство - 4 или 8 связностьКаждому узлу соответствует

SOM (Карты Кохенена) Алгоритм построенияПроинициализируем случайными значениямиДалее, в случайном порядке будем предъявлять

SOM (Карты Кохенена) Иллюстрация: исходные данные

SOM (Карты Кохенена) Иллюстрация: сетка

SOM (Карты Кохенена) Иллюстрация: проекции на матрицу

SOM (Карты Кохенена) Практическое использованиеДанные представляют некоторую поверхность, требуется сократить размерностьХорошо подходят

Задание №2Каждому будут выданы Данные (3 набора)Алгоритмы классификации, реализованные в MatLabТребуетсяДля каждого

Содержание отчетаПрименявшиеся методыСписокАлгоритм, по которому оценивались алгоритмы и выбирались параметрыРезультаты в видеГрафиковТаблицВыводы

Похожие презентации

Пример
После проведения социологического исследования, как выявить группы людей сходных мнений?
Есть большая база

Обучение без учителя
Пусть, имеется набор наблюдений:
Требуется некоторым образом сделать суждения о наблюдаемых

Обучение без учителя
Кластеризация
Разбиение наблюдений на некоторые группы, с максимально близкими наблюдениями внутри

Отличие от классификации
Множество ответов неизвестно
Нет четкой меры качества решений
Задачи поставлены крайне нечетко

Кластеризация Постановка задачи (1)
Пусть, имеется набор наблюдений:
Требуется разбить на некоторые непересекающиеся подмножества (группы,

Кластеризация Постановка задачи (2)
Пусть, так же, имеется некоторая мера , характеризующая «схожесть» между

Кластеризация Модель кластеров
Под моделью кластеров будем понимать некоторое параметрическое семейство отображений из исходного

Алгоритм К-средних
Кто хочет рассказать как он работает?
Случайным образом выбрать k средних mj

Алгоритм К-средних
Мера схожести
Евклидово расстояние в пространстве Х
Модель кластеров
Пространство поиска - центры

Алгоритм К-средних
Однопараметрический
Требует знания только о количестве кластеров
Рандомизирован
Зависит от начального приближения
Не учитывает строения

EM алгоритм Общая идеология
Пусть есть вектор неизвестных величин
и параметрическая модель с так же

EM алгоритм Общая идеология
Возьмем некоторые начальные приближения
Итеративно t =1… делаем два шага:
Expect:

Кластеризация смесью нормальных распределений
Будем считать, что наблюдения сгенерированы смесью нормальных распределений, то

Кластеризация смесью нормальных распределений
Возьмем некоторые (случайные) начальные приближения
Итеративно для t =1… :
E:

Кластеризация смесью нормальных распределений
Плюсы
Более полная модель кластеров (больше итоговой информации)
Более качественная аппроксимация
Эффективная

Понижение размерности наблюдаемых данных
Зачастую, наблюдаемые данные могут обладать высокой размерностью, но в

Метод главных компонент
Пусть имеется набор наблюдений
Будем строить новый базис в пространстве ,

Метод главных компонент Расчет базиса
Сдвинем все данные таким образом, чтобы их выборочное среднее

Метод главных компонент Расчет базиса
Векторами нового базиса будут являться собственные вектора ковариационной матрицы
Собственные

Иллюстрация
Убирая базисные вектора с малыми значениями мы можем сократить размерность без существенной

Случай нормального распределения
Расстояние от центра распределения в новой системе координат равно:
Так называемое

Метод главных компонент Связь с линейной аппроксимацией
Если рассмотреть систему проекций данных на первые

Метод главных компонент
Следует применять:
Данные распределены нормально и требуется привести их к более

Самоорганизующиеся карты SOM (Карты Кохенена)
Основная идея
вписать в данные сетку низкой размерности, и анализировать

SOM (Карты Кохенена) Модель сетки
Матрица узлов
Соседство - 4 или 8 связность
Каждому узлу соответствует

SOM (Карты Кохенена) Алгоритм построения
Проинициализируем случайными значениями
Далее, в случайном порядке будем предъявлять

SOM (Карты Кохенена) Практическое использование
Данные представляют некоторую поверхность, требуется сократить размерность
Хорошо подходят

Задание №2
Каждому будут выданы
Данные (3 набора)
Алгоритмы классификации, реализованные в MatLab
Требуется
Для каждого

Содержание отчета
Применявшиеся методы
Список
Алгоритм, по которому оценивались алгоритмы и выбирались параметры
Результаты в виде
Графиков
Таблиц
Выводы