«Зачем», «что» и «как» в исследовании коллокаций. Вопросы и возможные ответы Размышления на тему Елены Ягуновой & Co [email protected]
Содержание
- 2. место доклада в миниконференции В рамках мини-конференции «Коллокации и сочетаемостные особенности: методы исследования» мой доклад взаимосвязан
- 3. Что -1 (у других) чаще всего – коллокации как несвободные сочетания, не относящиеся к идиомам: ключевое
- 4. Что -2 (у нас) Коллокации: неслучайное сочетание двух и более лексических единиц, характерное как для языка
- 5. Зачем??? Исследование характеристик единиц языка, и/или характеристик текстов и их структурных составляющих
- 6. Что-1? Зачем-1 рассматриваются большие массивы текстов изучаются характеристики языка, исследуемые единицы можно перечислить в виде закрытого
- 7. Что-1? Зачем-1 (примеры) Корпусной словарь неоднословных лексических единиц (оборотов) http://ruscorpora.ru/obgrams.html При каждом обороте указано количество употреблений
- 8. Корпусной словарь неоднословных лексических единиц (оборотов). Плюсы и минусы Есть закрытый список коллокаций (по словарям), требуется
- 9. Что-1? Зачем-1 (примеры) на http://dict.ruslang.ru/ Г. И. Кустова СЛОВАРЬ РУССКОЙ ИДИОМАТИКИ (выход на запрос в НКРЯ)
- 10. Пример алфавитного списка всех сочетаний слов со значением высокой степени абсолютная анархия абсолютная бездарность абсолютная безопасность
- 11. Что-1? Зачем-1 (примеры) О. Л. Бирюк, В. Ю. Гусев, Е. Ю. Калинина СЛОВАРЬ ГЛАГОЛЬНОЙ СОЧЕТАЕМОСТИ НЕПРЕДМЕТНЫХ
- 12. Пример списка (параметры не выбраны), выход на запрос в НКРЯ (не) ведать стыда действие (не) видеть
- 13. особенности этого подхода Заданность списка анализируемых коллокаций (частичная или по параметрам) Отношение к текстовым коллекциям работает
- 14. Что-2? Зачем-2 рассматриваются большие массивы текстов тексты разных функциональных стилей и предметных областей, список потенциальных коллокаций
- 15. разные ФС текстов и различие списков коллокаций http://corpus.leeds.ac.uk/ruscorpora.html A query to Russian corpora Выбор: Russian National
- 16. разные ФС текстов, разные стат. меры и различие списков коллокаций A query to Russian corpora Collocation
- 17. Зачем-2 и Что-2 и Как-2? Если коллокации не заданы списком, если коллокации не заданы правилами, то
- 18. Текст и коллокации текст есть структурированная последовательность единиц разных уровней, Коллокации как сложносоставные подструктуры текста –
- 19. Текстовые коллекции и коллокации Мы не привязаны к заданной коллекции или Корпусу На коллекциях разных текстов
- 20. Что мы можем получить, на разных коллекциях-корпусах? Варьируя коллекции, мы можем организовать систему вложенных друг в
- 21. Что мы можем получить, на разных коллокциях-корпусах? Например, вложенные друг в друга: научные тексты, лингвистические научные
- 22. Что мы можем получить, используя разные статистические меры (напр., MI, t-score, LL), а может где-то и
- 23. используя разные параметры, Мы получаем разные типы коллокаций = типы структурных составляющих текста: неоднословных номинаций в
- 24. используя разные параметры, (продолжение) Мы получаем еще другие типы коллокаций = типы структурных составляющих текста: составные
- 25. статистические меры (напр., MI vs. t-score)-1 Новостные тексты (напр., на материале lenta.ru за 2009) мера MI
- 26. статистические меры (напр., MI vs. t-score)-2 Научные тексты (напр., на материале «Диалог 2003-2009» и «Корпусная лингвистика»
- 27. Таблица 1. Биграммы (MI-score), выделяющиеся и для лексем, и для словоформ. Материал конференции «Диалог» (из доклада
- 28. Биграммы (MI-score), выделяющиеся и для лексем, и для словоформ. Табл. 1 и 2а. Пояснения Пороги для
- 29. Таблица 2а. Терминологические биграммы (MI-score), выделяющиеся и для лексем, и для словоформ. Материал конференции «Корпусная лингвистика»
- 30. Биграммы (MI-score), выделяющиеся и для лексем, и для словоформ. Почему мы выбрали этот список? В список
- 31. Статистические меры (напр., MI vs. t-score)-3. Дельта. Порог Новостные тексты (напр., на материале lenta.ru), в которых
- 32. Выделении основных тем новостной коллекции. Мера. Дельта. Порог Гипотеза об иерархии используемых мер (с учетом дельт
- 33. Дополнительная проверка гипотезы. Дельта. Порог Еще раз про гипотезу: t-score Дельта нужда для увеличения тематической однородности
- 34. зачем? что? как? Сейчас мы не ставим перед собой задачу практически востребованного метода напр., извлечения всех
- 35. Зачем-2 и Что-2 и Как-2? продолжение… на будущее что задано для списка потенциальных коллокаций ?? не
- 36. Литература Бирюк О. Л., Гусев В. Ю., Калинина Е. Ю. Словарь глагольной сочетаемости непредметных имен русского
- 37. Литература (продолжение) Пивоварова Л.М., Ягунова Е.В. Извлечение и классификация терминологических коллокаций на материале лингвистических научных текстов.
- 39. Скачать презентацию