Информационные технологии в обработке текстов. Автоматическое чтение текста

Содержание

Слайд 2

Система автоматического чтения текста (OCR- система — Optical Character Recognition).
— это

Система автоматического чтения текста (OCR- система — Optical Character Recognition). — это
компьютерная программа, позволяющая преобразовать текст с бумажного носителя в электронный текстовый файл, который может быть прочитан средствами обработки текстов.

Слайд 3

Сканер

Сканер
работает по принципу фотоаппарата, позволяя ПК «увидеть» текст. Для

Сканер Сканер работает по принципу фотоаппарата, позволяя ПК «увидеть» текст. Для того
того чтобы «понять» его содержание, т.е. перевести графическое (точечное) изображение символов в пригодную для дальнейшей обработки (редактирования, реферирования, перевода и т.д.) текстовую форму, необходима система автоматического чтения текста

Слайд 4

FineReader компании «ABBYY Software House»

CuneiForm фирмы «Congitive Technologies»
OCR- системы, созданные российскими

FineReader компании «ABBYY Software House» CuneiForm фирмы «Congitive Technologies» OCR- системы, созданные российскими разработчиками
разработчиками

Слайд 5

возможности систем автоматического чтения текста огромны:

возможности систем автоматического чтения текста огромны:

Слайд 7

АВТОМАТИЧЕСКОЕ РЕФЕРИРОВАНИЕ И АННОТИРОВАНИЕ ТЕКСТА

АВТОМАТИЧЕСКОЕ РЕФЕРИРОВАНИЕ И АННОТИРОВАНИЕ ТЕКСТА

Слайд 8

Реферат — связный текст, который кратко выражает не только тему или предмет

Реферат — связный текст, который кратко выражает не только тему или предмет
какого-либо документа, но и цель, применяемые методы, основные результаты описанного исследования или разработки.
Процесс составления реферата называется реферированием

Аннотация — краткое изложение содержания докумен­та, дающее общее представление о его теме.
Процесс составления аннотации называется аннотированием.

Слайд 9

Реферирование и аннотирование текста являются довольно сложными и трудными видами интеллектуальной деятельности

Реферирование и аннотирование текста являются довольно сложными и трудными видами интеллектуальной деятельности и занимают много времени.
и занимают много времени.

Слайд 10

Выход есть!!!

Выход есть!!!

Слайд 11

Автоматическое реферирование и аннотирование

Автоматическое реферирование и аннотирование

Слайд 12

текст делится на фрагменты (абзацы, аспекты и т.п.)., в нем выделяют

текст делится на фрагменты (абзацы, аспекты и т.п.)., в нем выделяют основные
основные смысловые единицы (пред­ложения, словосочетания, слова), составляется план аннотации (реферата)

референт определяет тематическую направленость текста и пытается понять и осмыслить документ в целом

выделенные ранее смысловые единицы (их комбинации или преобразования) располагаются в единый вторичный текст в соответствии с планом реферата или аннотации.

Этапы построения человеком реферата (аннотации)

Подготови-
тельный

Аналити
ческий

Построение аннотации (реферата)

Слайд 13

Компьютер должен уметь выполнять те же действия, которые осуществляет человек:

Компьютер должен уметь выполнять те же действия, которые осуществляет человек:

Слайд 15

Смысловые еденицы реферата:

Смысловые еденицы реферата:

Слайд 16

Смысловые еденицы аннотации:

Смысловые еденицы аннотации:

Слайд 17

ключевым предложением считается предложение, входящее в заголовок, подзаголовок, начало или конец

ключевым предложением считается предложение, входящее в заголовок, подзаголовок, начало или конец какой-то
какой-то части текста или всего текста. и содержат информацию о целях, методах, выводах и результатах исследования. Важность тех или иных предложений с указанной точки зрения определяется экспертами путем изучения семантической структуры первичных документов определенного типа.

1) ключевыми словами считаются такие знаменательные слова текста, которые с учетом всех синонимов встречаются в тексте наибольшее число раз;
2) ключевым предложением считается предложение текста, которое:
а) имеет несколько ключевых слов;
б) содержит ключевые слова на небольшом расстоянии друг от друга.

опираются на исследование структуры и семантики текстов. Существует несколько вариантов этих методов, но цель их одна — выделить из конкретного текста предложения с наибольшим функциональным весом.

Методы автоматического реферирования

Статисти-
ческие

Позицион-
ные

Логико-
семантические

Имя файла: Информационные-технологии-в-обработке-текстов.-Автоматическое-чтение-текста.pptx
Количество просмотров: 26
Количество скачиваний: 0