RuSSIR 2008Russian Summer School in Information Retrieval

Февраль 12, 2021

Главная
Разное
RuSSIR 2008Russian Summer School in Information Retrieval

Содержание

2. Немного истории Идея проведения RuSSIR’ов принадлежит Павлу Браславскому Школы проводятся совместно с РОМИП Школы поддерживаются и
3. Немного статистики Таганрогский технологический институт Южного федерального университета 4 полных курса, 1 краткий и 1 лекция
4. Курс Text Mining, Information and Fact Extraction Marie-Francine Moens (Katholieke Universiteit Leuven), Belgium
5. Text Mining, Information and Fact Extraction Цель: извлечение конкретных фактов из текста на естественном языке Лексическая
6. Text Mining, Information and Fact Extraction Методы классификации: SVM, Байес, принцип максимальной энтропии Контекстно-зависимая классификация: Hidden
7. Курс Поиск изображений по содержанию Наталья Васильева (HP Labs) Санкт-Петербург, Россия
8. Поиск изображений по содержанию Задачи Image Retrieval: поиск изображений, похожих на заданный пример, поиск по заданной
9. Поиск изображений по содержанию 3) Уровни свойств изображения Цвет(цветовые пространства, гистограммы) Текстура(статистические свойства, фильтры, вэйвлеты) Форма(методы
10. Поиск изображений по содержанию 4) Сегментация 5) Многомерное индексирование Деревья(R, Quad, VP и тд)‏ Locality Sensitive
11. Data Structures in IR Максим Губин (Ask.com, США) Курс
12. Data Structures in IR Индексация, структуры хранения данных, методы сжатия, распараллеливание Поиск, слияние списков, отсечение, кэширование,
13. Курс Hands-on Natural Language Processing for Information Access Applications Horacio Saggion (University of Sheffield)
14. Natural Language Processing for Information Access Извлечение информации из текста выявление именованных сущностей поиск связей между
15. Natural Language Processing for Information Access Question Answering получение ответа на запрос, сформулированный на естественном языке
16. Короткий курс IR in Social Media Alexey Maykov, Microsoft LiveLabs Чем отличается Social Media от обычных
17. Лекция. Темы дня в блогах: Как это работает Антон Волнухин Андрей Мищенко Что такое «темы дня»
18. Конференция молодых ученых Константин Артемьев Метод вероятностного морфологического анализа для задач полнотекстового индексированного поиска Александр Сибиряков
19. Конференция молодых ученых
20. Неформальное Welcome Party
21. Неформальное Футбольный матч 12 – 0 в пользу студентов!
22. Неформальное RuSSIR Party
23. Неформальное Мафия по ночам
24. Неформальное Последствия мафии
25. А на самом деле:
27. Скачать презентацию

Немного истории
Идея проведения RuSSIR’ов принадлежит Павлу Браславскому
Школы проводятся совместно с РОМИП
Школы

поддерживаются и спонсируются разными компаниями

RuSSIR 2007 был первым и проходил в Екатеринбурге 5-12 сентября 2007

Немного статистики
Таганрогский технологический институт Южного федерального университета
4 полных курса, 1 краткий

и 1 лекция
Конференция молодых ученых (7 докладов)‏
9 иностранных слушателей
Все курсы по-английски
10 часов занятий в день (с перерывами)‏
Всего 106 человек

Курс
Text Mining, Information and Fact Extraction
Marie-Francine Moens (Katholieke Universiteit Leuven), Belgium

Text Mining, Information and Fact Extraction
Цель: извлечение конкретных фактов из текста на

естественном языке
Лексическая обработка: извлечение языковых свойств, токенизация, стемминг, POS-разметка, парсинг предложений

В курсе делается широкий обзор методов машинного обучения и их применения к задаче информации из текстовых данных.

Text Mining, Information and Fact Extraction
Методы классификации: SVM, Байес, принцип максимальной энтропии
Контекстно-зависимая

классификация: Hidden Markov Models, Conditional Random Field, Probabilistic Latent Semantic Analisys, Latent Dirichlet Allocation
Приложения

Курс
Поиск изображений по содержанию
Наталья Васильева (HP Labs) Санкт-Петербург, Россия

Поиск изображений по содержанию
Задачи Image Retrieval: поиск изображений, похожих на заданный пример,

поиск по заданной цветовой гамме, примерной форме и т.д.
2) Проблемы Image Retrieval:
большой разрыв между представлением и семантикой(а интересно именно семантическое содержание)
cубъективность восприятия изображений
трудность визуализации

Слайд 9

Поиск изображений по содержанию
3) Уровни свойств изображения
Цвет(цветовые пространства, гистограммы)
Текстура(статистические свойства, фильтры, вэйвлеты)
Форма(методы

выделения границы, кодирование формы)
Семантический(применение fusion-методов)

Слайд 10

Поиск изображений по содержанию
4) Сегментация
5) Многомерное индексирование
Деревья(R, Quad, VP и тд)‏

Locality Sensitive Hashing
6) Приложения
IBM QBICK - search by image content
Virage
Visual SEEk

Слайд 11

Data Structures in IR
Максим Губин (Ask.com, США)
Курс

Слайд 12

Data Structures in IR
Индексация, структуры хранения данных, методы сжатия, распараллеливание
Поиск, слияние списков,

отсечение, кэширование, построение кластера
Языковая модель, PageRank

Последовательно излагается процесс проектирования поисковой системы. На примерах возникающих проблем показывается применение классических структур данных и алгоритмов: Huffman and LZ coding, Map-Reduce, Bloom filter

Слайд 13

Курс
Hands-on Natural Language Processing for Information Access Applications
Horacio Saggion (University of Sheffield)

Слайд 14

Natural Language Processing for Information Access
Извлечение информации из текста
выявление именованных сущностей
поиск связей

между сущностями
определение значения сущностей
Обзор технологий и средств анализа естественного языка на примере системы GATE

Слайд 15

Natural Language Processing for Information Access
Question Answering
получение ответа на запрос, сформулированный на

естественном языке
3 типа вопросов: факт, перечисление, определение
индексация, анализ запроса, получение ответа
Text Summarization
выжимка из текста смысловой сути
sentence summarization, article summarization, corpus summarization
методы оценки результатов

Слайд 16

Короткий курс
IR in Social Media
Alexey Maykov, Microsoft LiveLabs
Чем отличается Social Media от

обычных СМИ?
Обзор, применение и архитектура SM
Сбор данных в SM, различные методы
Обработка и анализ этих данных

Слайд 17

Лекция. Темы дня в блогах: Как это работает
Антон Волнухин
Андрей Мищенко
Что такое «темы

дня» в яндекс.блогах?
Как формируются «темы дня»?
Особенности формирования

Слайд 18

Конференция молодых ученых
Константин Артемьев
Метод вероятностного морфологического анализа для задач полнотекстового индексированного поиска
Александр

Сибиряков Извлечение мнений о товарах из форумов и блогов с учетом тональности
Евгений Рабчевский Применение лексико-синтаксических шаблонов для автоматизации процесса построения онтологий
Ольга Пустыльникова Автоматическая классификация текстов на основе их структурных признаков. Какую информацию о тексте отражает структура?
Алексей Владыкин Автоматический метод оценки тематической содержательности документов
Мстислав Масленников Самозагрузка правил для извлечения информации из текстов на естественном языке.
Ольга Шамина Автоматический поиск научных статей в сети Интернет

RuSSIR 2008Russian Summer School in Information Retrieval

Содержание

Немного историиИдея проведения RuSSIR’ов принадлежит Павлу Браславскому Школы проводятся совместно с РОМИП Школы

Немного статистикиТаганрогский технологический институт Южного федерального университета 4 полных курса, 1 краткий

КурсText Mining, Information and Fact Extraction Marie-Francine Moens (Katholieke Universiteit Leuven), Belgium

Text Mining, Information and Fact ExtractionЦель: извлечение конкретных фактов из текста на

Text Mining, Information and Fact ExtractionМетоды классификации: SVM, Байес, принцип максимальной энтропииКонтекстно-зависимая

КурсПоиск изображений по содержаниюНаталья Васильева (HP Labs) Санкт-Петербург, Россия

Поиск изображений по содержаниюЗадачи Image Retrieval: поиск изображений, похожих на заданный пример,

Поиск изображений по содержанию4) Сегментация5) Многомерное индексирование Деревья(R, Quad, VP и тд)‏

Data Structures in IR Максим Губин (Ask.com, США)Курс

Data Structures in IRИндексация, структуры хранения данных, методы сжатия, распараллеливаниеПоиск, слияние списков,

КурсHands-on Natural Language Processing for Information Access ApplicationsHoracio Saggion (University of Sheffield)

Natural Language Processing for Information AccessИзвлечение информации из текставыявление именованных сущностейпоиск связей

Natural Language Processing for Information AccessQuestion Answeringполучение ответа на запрос, сформулированный на

Короткий курсIR in Social MediaAlexey Maykov, Microsoft LiveLabsЧем отличается Social Media от

Лекция. Темы дня в блогах: Как это работаетАнтон ВолнухинАндрей МищенкоЧто такое «темы

Конференция молодых ученыхКонстантин Артемьев Метод вероятностного морфологического анализа для задач полнотекстового индексированного поискаАлександр

Конференция молодых ученых

Неформальное Welcome Party

Неформальное Футбольный матч12 – 0 в пользу студентов!

Неформальное RuSSIR Party

Неформальное Мафия по ночам

Неформальное Последствия мафии

А на самом деле:

Похожие презентации