Слайд 2Постановка задачи
Рассмотрена задача извлечения полнотекстового содержания и метаданных из книг электронной библиотеки
![Постановка задачи Рассмотрена задача извлечения полнотекстового содержания и метаданных из книг электронной](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/381283/slide-1.jpg)
в форматах PDF, PostScript (PS), DJVU, CHM и HTML; разработка системы автоматизированной пакетной обработки электронных единиц хранения библиотеки в этих форматах с целью выделения следующих элементов информации:
1. полный текст документа без управляющих и форматных символов;
2. название документа;
3. список авторов;
4. количество страниц;
5. год издания;
6. язык документа;
Слайд 3Пример метаданных электронной книги
![Пример метаданных электронной книги](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/381283/slide-2.jpg)
Слайд 4Блок-схема системы извлечения метаданных
![Блок-схема системы извлечения метаданных](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/381283/slide-3.jpg)
Слайд 5Блок-схема «Анализатора языка»
![Блок-схема «Анализатора языка»](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/381283/slide-4.jpg)
Слайд 6Блок-схема обработки
иноязычных книг
![Блок-схема обработки иноязычных книг](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/381283/slide-5.jpg)
Слайд 7Пример отклика сайта isbndb.com на запрос
![Пример отклика сайта isbndb.com на запрос](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/381283/slide-6.jpg)
Слайд 8Блок-схема
«Выборки метаданных»
![Блок-схема «Выборки метаданных»](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/381283/slide-7.jpg)
Слайд 9Элемент текста с метаданными
в русскоязычной книге
![Элемент текста с метаданными в русскоязычной книге](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/381283/slide-8.jpg)
Слайд 10Пример текстового
вывода программы
![Пример текстового вывода программы](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/381283/slide-9.jpg)