Содержание
- 2. Постморфологический анализ =предсинтаксический анализ Предназначен для устранения морфологической омонимии (многозначности) слов Выбор правильной леммы Уточнение морфологических
 - 3. Набор состояний: Процесс движется от одного состояния к другому, порождая последовательность состояний : Свойство марковской цепи:
 - 4. Два состояния : ‘Rain’ и ‘Dry’ Вероятности переходов: P(‘Rain’|‘Rain’)=0.3 , P(‘Dry’|‘Rain’)=0.7 , P(‘Rain’|‘Dry’)=0.2, P(‘Dry’|‘Dry’)=0.8 Исходные вероятности:
 - 5. По свойству марковской цепи, вероятность последовательности состояний может быть найдена по формуле Предположим, мы хотим подсчитать
 - 6. Скрытые марковские модели Множество состояний: Процесс движется от состояния к состоянию : Выполняется свойство марковской цепи:
 - 7. Dry 0.6 0.6 0.4 0.4 Пример скрытой марковской модели
 - 8. Два состояния: ‘Низкое’ and ‘Высокое’ атм. давление. Два наблюдения: ‘Дождь’ and ‘Сухо’. Вероятности перехода: P(‘Low’|‘Low’)=0.3 ,
 - 9. Хотим вычислить вероятность последовательности, {‘Dry’,’Rain’}. Рассмотрим все возможные скрытые состояния: P({‘Dry’,’Rain’} ) = P({‘Dry’,’Rain’} , {‘Low’,’Low’})
 - 10. Почему важно рассмотрение HMM в автоматической обработке текста Непосредственно имеем дело с неоднозначными словами и конструкциями
 - 11. Что такое HMM? Графическая модель Кружки – это состояния Стрелки обозначают вероятностные зависимости между состояниями
 - 12. Что такое HMM? Зеленые кружки – это скрытые состояния Зависят только от предыдущего состояния
 - 13. Что такое HMM? Фиолетовые кружки – это наблюдаемые состояния Зависят только от соответствующих скрытых состояний
 - 14. HMM формализм {S, K, Π, Α, Β} S : {s1…sN } - значения скрытых состояний K
 - 15. HMM формализм {S, K, Π, Α, Β} Π = {πι} - вероятности начальных состояний A =
 - 16. Вывод HMM Вычислить вероятность последовательности наблюдаемых состояний (Evaluation) Имея последовательность наблюдаемых состояний, вычислить наиболее вероятную последовательность
 - 17. o1 ot ot-1 ot+1 Имея последовательность наблюдаемых состояний и модель, вычислить вероятность последовательности наблюдаемых состояний Оценка
 - 18. Оценка (Evaluation) Сложность O (NT), где N – число возможных вариантов состояний
 - 19. Форвардная процедура Метод динамического программирования Определим переменную: Смысл переменной α: вероятность наблюдений o1, …ot и при
 - 20. Форвардная процедура
 - 21. Форвардная процедура
 - 22. Вычисление вероятности последовательности наблюдаемых событий Можем эффективно вычислять αT(I)=P(o1, o2,…oT, xT=i|μ) Как вычислить P(o1, o2,…oT |μ)?
 - 23. Вычисление вероятности последовательности наблюдаемых событий Можем эффективно вычислять αT(i)=P(o1, o2,…oT, xT=i|μ) Как вычислить P(o1, o2,…oT |μ)
 - 24. Форвардный алгоритм: пример
 - 25. Форвардный алгоритм Найти вероятность последовательности: s r r s r (s- sun, r – rain)
 - 28. Декодирование Вычислить вероятность последовательности наблюдаемых состояний (Evaluation) Имея последовательность наблюдаемых состояний, вычислить наиболее вероятную последовательность скрытых
 - 29. Декодирование: Best State Sequence Найти множество состояний, которые наилучшим образом объясняют последовательность видимых состояний Viterbi algorithm
 - 30. oT o1 ot ot-1 ot+1 Алгоритм Витерби Последовательность состояний, которая максимизирует вероятность увидеть заданную последовательность видимых
 - 31. Алгоритм Витерби Рекурсивное вычисление x1 xt-1 xt xt+1
 - 32. Алгоритм Витерби Вычисляем наиболее вероятную последовательность состояний, двигаясь назад x1 xt-1 xt xt+1 xT
 - 39. Тот же пример для алгоритма Витерби
 - 40. Пример: Алгоритм Витерби
 - 41. Пример. Алгоритм Витерби
 - 42. Применение HMM к POS-tagging POS-tagging – морфологическая разметка HMM tagger: выбирает наиболее вероятную последовательность тегов для
 - 43. Пример: морфологическая неоднозначность
 - 44. Откуда взять данные? Из корпуса с морфологической разметкой Русский язык: Корпус русского языка Открытый корпус (opencorpora.org)
 - 45. Фрагмент морфологической разметки в Национальном корпусе русского языка Я сидел на барском сиденье, дышал горячим ветром,
 - 46. Данные для примера
 - 59. Лексические вероятности: уточнение Мы считали p(w|t) Но Слово могло отсутствовать в корпусе или отсутствовать в заданной
 - 60. Лексические вероятности ~ p(t) – априорная вероятность метки p(t|w) – вероятность метки для данного слова Можно
 - 61. Словарь и лексические вероятности Можно считать, что все словарные метки слова w входят в корпус α
 - 62. Анализ статистических алгоритмов снятия морфологической омонимии в русском языке Егор Лакомкин Иван Пузыревский Дарья Рыжова (2013)
 - 63. Разрешение морфологической неоднозначности в текстах на английском языке Методы: Как правило, статистические алгоритмы на основе марковских
 - 64. Особенности английского языка Бедная морфология морфологическая разметка фактически сводится к POS-теггингу Фиксированный порядок слов можно опираться
 - 65. Задача исследования: Проверить экспериментально, применимы ли статистические алгоритмы, основанные на марковских моделях, к задаче морфологической дизамбигуации
 - 66. Алгоритмы Набор скрытых величин Y (состояний модели = наборов грамматических тегов); составляют марковскую цепь первого порядка
 - 67. HMM Обучение: Сбор статистик по корпусу: P(yi|yj) – матрица переходов P(xk|yi) – вероятности наблюдений сущ прил
 - 68. Задача алгоритмов: Вычисление наиболее вероятной последовательности скрытых величин
 - 69. Деление выборки на обучающую и тестирующую: Кросс-валидация (5 фолдов): Деление выборки на 5 частей: 4 обучающие
 - 70. Оценка качества Определение верхней и нижней границы: Верхняя граница: процент случаев, когда среди гипотез Mystem’а есть
 - 71. Результаты
 - 72. Выводы работы POS-теггинг – на приличном уровне, Разрешение неоднозначности по расширенным тегам – довольно низкий уровень
 - 73. Проблемы HMM Метки рассматриваются как единое целое, невозможно извлечь отдельные признаки В русском языке: тег –
 - 74. Как можно изменить процесс расчета переходов между состояниями? HMM: учитываются два фактора в простой комбинации Для
 - 76. Скачать презентацию
 









































































 Міжнародні відносини в 1920-х рр
 СТАТИЧЕСКИ ОПРЕДЕЛИМЫЕ СИСТЕМЫС СТРОИТЕЛЬНАЯ МЕХАНИКА 
 11г 22.09
 Презентация на тему Первая медицинская помощь при кровотечении 
 История и развитие логарифмов
 САНАТОРНО-КУРОРТНОЕ ЛЕЧЕНИЕ 
 Burza na jeziorze
 Развитие педагогическогопотенциала как фактора обновления качества образования»
 Основные модели и требования к инжиниринговым центрам 	Круглый стол «Современные инжиниринговые центры в России» 	ИННОПРОМ-12 	Куз
 21
 «Театр, который нас развивает»
 Земля, Луна, Космонавтика
 Бородинское поле
 Фото-композиция с использованием эффекта боке
 Числовые неравенства и их свойства
 Кроссворд по информатике по теме "Программное обеспечение компьютера" ВНИМАНИЕ!!! Все ответы на данный кроссворд должны быть зап
 Миссия и цели. - презентация
 ИНФАТЕК КАДРЫ
 Горячая Линия качества «Защити свой Бренд»
 В мечтах. Задумался
  
 Presentation Title Your company information 
 Мороженое. Бизнес-проект
 Современный русский язык - один из богатейших языков мира
 English painters
 Вертикаль власти Выборы президента РФ
 Открытый урок: учить и учиться
 Экспресс-разбор заданий вторых частей (плюс требования к оформлению)
 Развитие_ценообразования