Содержание
- 2. Regular expressions A formal language for specifying text strings How can we search for any of
- 4. Формальные языки (ФЯ) RE описывают регулярные языки в теории формальных языков. ФЯ состоит из слов, порождённых
- 5. Константы, являющиеся RE над конечным алфавитом Σ (пустое множество) ∅ (пустая строка) ε — множество, содержащее
- 6. Операции, генерирующие RE 1 над конечным алфавитом Σ R, S — это RE (сцепление, конкатенация) RS
- 7. Операции, генерирующие RE 2 (замыкание Клини, звезда Клини) R* минимальное надмножество множества R, которое содержит ε
- 8. Области применения RE поиск по шаблону замена (pattern substitution) chatbot (тест Тьюринга) токенизация
- 9. Regular Expressions: Disjunctions Letters inside square brackets [] Ranges [A-Z]
- 10. Regular Expressions: Negation in Disjunction Negations [^Ss] Carat means negation only when first in []
- 11. Regular Expressions: More Disjunction Woodchucks is another name for groundhog! The pipe | for disjunction
- 12. Regular Expressions: ? * + . Stephen C Kleene Kleene *, Kleene +
- 13. Regular Expressions: Anchors ^ $
- 14. Токенизация (две стратегии разбиения на слова) Пробелы? Слова? Какие символы?
- 15. Разбиваем на слова (VIM): (1) ищем границы слов Но он не умер. Открыв слегка глаза, он
- 16. VIM Vi, Vim and Emacs
- 17. Miessler D. The Differences Between Vi, Vim, and Emacs.https://danielmiessler.com/blog/differences-vi-vim-emacs/
- 18. Miessler D. The Differences Between Vi, Vim, and Emacs.https://danielmiessler.com/blog/differences-vi-vim-emacs/
- 19. Vim, Emacs Bill Joy 1976 Unix modularity work like a language =>? intuitive installed nearly everywhere
- 20. Just memorize this vi / vim cheat sheet and you're ready for lightning-quick editing.
- 21. http://www.viemu.com/vi-vim-cheat-sheet.gif
- 22. Разбиваем на слова (VIM): (1) ищем границы слов [.!?]
- 23. Разбиваем на слова (VIM) [.!?]
- 24. Токенизация Пробелы, но не всегда: Saint Petersburg всё равно (частица) ? Слова? Поздравляю с 8 марта
- 25. Токенизация Пробелы, но не всегда: Saint Petersburg всё равно (частица) ? Слова? Поздравляю с 8 марта
- 26. Разбиваем на слова: (2) ищем сами слова
- 27. The detailed elaborations on the development of even a short program form a long story, indicating
- 28. Разбиваем на слова (2): ищем сами слова ищем слова program и programming, поиск по двум словам,
- 29. Жадные (ленивые) квантификаторы: ? * + .
- 30. Разбиваем на слова: ищем сами слова The detailed elaborations on the development of even a short
- 31. Разбить текст на предложения Но он не умер. открыв слегка глаза, он увидел себя сидящим на
- 34. Example Find me all instances of the word “the” in a text. the Misses capitalized examples
- 35. Errors The process we just went through was based on fixing two kinds of errors Matching
- 36. Errors cont. In NLP we are always dealing with these kinds of errors. Reducing the error
- 37. Summary Regular expressions play a surprisingly large role Sophisticated sequences of regular expressions are often the
- 38. Литература Фридл, Дж. Регулярные выражения. — СПб.: «Питер», 2001. — 352 с. (Mastering Regular Expressions) Miessler
- 39. Ссылки http://vimregex.com
- 41. Скачать презентацию