Электронные цифровые архивы : долговременное сохранение данных и обеспечение их аутентичности. Модель сохранения данных OAIS (ISO 1472

Содержание

Слайд 2

Электронные цифровые архивы : долговременное сохранение данных и обеспечение их аутентичности.

Информационный

Электронные цифровые архивы : долговременное сохранение данных и обеспечение их аутентичности. Информационный
мир
Требования к цифровым архивам
Проект CASPAR и участие IBM
Стандарты в области долговременного сохранения данных:
международные
отечественные;
Применение в образовании
Функциональная архитектура;
Примеры реализации;

Слайд 3


2

Ситуация в мире

 2 Ситуация в мире

Слайд 4

Расширяющаяся цифровая вселенная
В 2006 г. объем оцифрованной информации – созданной и

Расширяющаяся цифровая вселенная В 2006 г. объем оцифрованной информации – созданной и
сохраненной для дальнейшего воспроизведения, составил 161 экзабайт (161 миллиард гигабайт) – объем, примерно в 3 миллиона раз превышающий объем всех написанных за историю человечества книг!
До конца 2010 г. этот объем увеличится в 6 раз и составит 998 экзабайт.
IDC (2007) The Expanding Digital Universe

Слайд 5

Основные требования к цифровым архивам

Централизация;
Структурность;
Гарантированная сохранность данных;
Гибкость ;
Универсальность;
Масштабируемость;
Соответствие (международным) стандартам сохранения

Основные требования к цифровым архивам Централизация; Структурность; Гарантированная сохранность данных; Гибкость ;
данных и создания электронных цифровых фондов;
Эффективная модель управления;
Производительность;
«Читабельность» объектов сохранения в течение всего срока сохранения.

Слайд 6

CASPAR – сохранение культурного, художественного и научного наследия.

CASPAR (Cultural, Artistic, and Scientific

CASPAR – сохранение культурного, художественного и научного наследия. CASPAR (Cultural, Artistic, and
knowledge for Preservation, Access and Retrieval)
международный проект ЕС и UNESCO, основной целью которого является разработка стандартов и механизмов долговременного (неограниченного) срока сохранения культурного, научного и художественного наследия мира.
Preservation DataStore – инновационная система хранения данных, в основе которой - модель OAIS (ISO:14721:2002). Разрабатывается IBM.
http://www.casparpreserves.eu/

Слайд 7

Открытая система архивной информации - OAIS

Простое хранение цифровой копии – нонсенс.
Как обеспечить

Открытая система архивной информации - OAIS Простое хранение цифровой копии – нонсенс.
воспроизводимость и понимаемость в будущем?
Описательные метаданные.
Определение фокусной аудитории и принятых в этой аудитории форматов.
...

Представление объектов архивного хранения
(Archival Information Package) в соответствии со стандартом OAIS (ISO:14721:2002)

Представление информации в строго заданных параметрах воспроизведения, подходящих для передачи и обмена, интерпретации или дальнейшей обработки

Слайд 8

Digital Media в Образовании Главная особенность информационного общества XXI века

Главная особенность информационного

Digital Media в Образовании Главная особенность информационного общества XXI века Главная особенность
общества XXI века – это экономика, основанная на знаниях.
Принципиально важно научить людей не столько конкретным текущим знаниям, а сколько умению:
извлекать и привлекать знания из информационных источников (Интернета, СМИ, библиотек, баз данных и других источников и хранилищ информации);
хранить, систематизировать и обрабатывать знания;
создавать новые знания в электронном виде ( т. е. создавать свой новый контент знаний);
далее — продавать (коммерциализировать) свои и привлеченные знания.

Слайд 9

ИТ поддержка основных образовательных процессов

ИТ поддержка основных образовательных процессов

Слайд 10


4

Общая архитектура

 4 Общая архитектура

Слайд 11

Автоматизированная ленточная библиотека архивного хранения (Центральный архив)

Универсальный дисковый массив
(Главный индекс Хранилища, Буфер активных

Автоматизированная ленточная библиотека архивного хранения (Центральный архив) Универсальный дисковый массив (Главный индекс
документов, данные критичных приложений)

Операционный зал

Централизованные ИТ-сервисы

Универсальный сервер (Управление Хранилищем, обеспечение производственных служб)

Резервный ЦОД

Функциональные подразделения

Основной ЦОД

Общая архитектура электронно-цифрового архива

Централизованные ИТ-сервисы

Слайд 12


5

Примеры реализации

 5 Примеры реализации

Слайд 13

Государственный Эрмитаж

Благотворительный проект IBM II-й половины 90-х гг.
Продолжение проекта – 2007 г.
Особенности
Решение

Государственный Эрмитаж Благотворительный проект IBM II-й половины 90-х гг. Продолжение проекта –
«под ключ»;
Введение новых административно-производственных процедур в жизнь музея;
Решение ряда важнейших технологических вопросов с нуля.
В течение нескольких лет сайт Эрмитажа – среди победителей международных интернет-конкурсов на лучший электронный музей.

http://hermitagemuseum.org

Слайд 14

Королевская библиотека Нидерландов

Особенности проекта:
Центральная часть европейского проекта;
Первые в Европе, опыт реальной производственной

Королевская библиотека Нидерландов Особенности проекта: Центральная часть европейского проекта; Первые в Европе,
эксплуатации в течение нескольких лет;
Конкурс: Siemens, Wang,CAP Gemini, Getronics/Wang, Pink Roccade.
Комплекс:
Ядро системы – DIAS:
WebSphere;
Content Manager,
Tivoli Storage Manager (TSM),
DB2.
7-node RS/6000 SP server (processing of the document input/output);
RS/6000 SP 375 MHz POWER3 SMP Wide server - processing software;
RS/6000 F50 server - Control Workstation for the RS/6000 SP;
Enterprise Storage Server,
3 x 3494 Enterprise Tape Libraries
3995 Model C68 Optical Library.

Слайд 15

Kopal Project

Национальная библиотека Германии
Deutsche Nationalbibliothek (The German National Library)
Научное общество по

Kopal Project Национальная библиотека Германии Deutsche Nationalbibliothek (The German National Library) Научное
обработке информации
Gesellschaft für wissenschaftliche Datenverarbeitung mbH Göttingen
Государственная библиотека Университета Гёттингена
Niedersaechsische Staats- und Universitaetsbibliothek Goettingen (Goettingen State and University Library)
IBM Deutschland GmbH
Ядро: DIAS+

http://kopal.langzeitarchivierung.de/

Слайд 16

Государственная библиотека Тяньцзинь

Особенности проекта:
Государственная библиотека в КНР;
Первый подобный проект;
Конкурс: Computer Associates, Dell,

Государственная библиотека Тяньцзинь Особенности проекта: Государственная библиотека в КНР; Первый подобный проект;
EMC, Legend, Oracle + местные компании.
Комплекс:
7 х eServer pSeries 630 security control servers;
8 х Server pSeries 650 digital content metadata servers and resource managers;
eServer xSeries 235 - library automation server;
eServer xSeries 335 - team development server;
eServer xSeries 345 - staging server;
eServer xSeries 360 - a portal server;
2 SAN 2109 Fibre Channel Switches;
IBM 3583 L18 Ultrium Scalable Tape Library.
Information Management:
DB2 Content Manager for AIX, DB2 Content Manager VideoCharger;
Lotus: WebSphere Portal Extend;
Rational Software: Rational Web Developer for WebSphere Software;
Tivoli Storage Management: Tivoli SANergy, Tivoli Storage Manager;
Tivoli Security Solutions: Tivoli Access Manager for e-business;
WebSphere: WebSphere Application Server – Enterprise.

Слайд 17

Библиотека университета Mashiakhat Al Azhar

Особенности проекта:
Оцифровка и каталогизация древних манускриптов.
Комплекс:
IBM RS/6000

Библиотека университета Mashiakhat Al Azhar Особенности проекта: Оцифровка и каталогизация древних манускриптов.
SP2;
IBM RS/6000 B50;
IBM Netfinity 4500R;
Storage:
Optical Storage;
Tape Storage.
Программные платформы:
IBM Content Manager;
IBM Enterprise Information Portal (EIP);
IBM DB2;
IBM WebSphere Application Sever and Edge Server.

Слайд 18

Высшая школа менеджмента СПбГУ

Особенности проекта:
Головной ВУЗ СЗФО;
Школа бизнеса мирового уровня;
Электронная библиотека;
Ядро системы

Высшая школа менеджмента СПбГУ Особенности проекта: Головной ВУЗ СЗФО; Школа бизнеса мирового
– Digital Media Center;
Проектирование – российские бизнес-партнеры.
Сроки:
Проектирование – 6 мес.
Исполнение (архив) – 12 мес.
Контроль за исполнением:
Приоритетный национальный проект «Образование».

Слайд 19

Видение ИТ-стратегии

Предоставить сотрудникам и слушателям ВШМ ИТ-инструменты (программное обеспечение, аппаратное обеспечение и

Видение ИТ-стратегии Предоставить сотрудникам и слушателям ВШМ ИТ-инструменты (программное обеспечение, аппаратное обеспечение
качественная поддержка), в которых они нуждаются;
Использовать Интранет/Интернет-ориентированное программное обеспечение;
Обеспечить возможность авторизованного доступа к информационным ресурсам ВШМ внешним пользователям;
Использовать преимущества ИТ с помощью стандартов, доступных на рынке;
ИТ в ВШМ должны способствовать повышению качества выпускников и обеспечению сохранности знаний, производимых ВШМ.

Слайд 20

Цифровой медиа-архив (2)

Возможности:

Во время выступления/лекции ведется (по запросу) видеозапись.

Видеозапись и слайды поступают

Цифровой медиа-архив (2) Возможности: Во время выступления/лекции ведется (по запросу) видеозапись. Видеозапись
для хранения в цифровой медиа-архив

Обращения пользователей/ посетителей библиотеки к ЦМА для просмотра видеоматериалов

Создание собственного продукта – CD/DVD с записью лекций преподавателей/гостей ВШМ СПбГУ

Слайд 21


5

Дополнительные материалы Системы хранения данных IBM

 5 Дополнительные материалы Системы хранения данных IBM

Слайд 22

Уровень предприятия

Наиболее широкая продуктовая линейка в индустрии

Семейство дисковых систем IBM System Storage

Уровень предприятия Наиболее широкая продуктовая линейка в индустрии Семейство дисковых систем IBM
DS

Упростить инфраструктуру и уменьшить затраты на ее управление, внося изменения по мере необходимости.
Обеспечить непрерывность бизнеса и защиту данных.
Эффективно управлять информацией на протяжении всего жизненного цикла.

Инновации семейства IBM System Storage DS помогают:

DS3200/DS3400

DS4000

DS6000

DS8000

Средний уровень

Начальный уровень

Слайд 23

IBM - авторитет индустрии в 4Gbit сетях хранения

IBM - авторитет индустрии в 4Gbit сетях хранения

Слайд 24

Основная система
(FC диски)

Задачи:
Снизить издержки хранения;
Уменьшить время восстановления.
Решение:
Несколько уровней хранения;
Производительная основная СХ;
Промежуточное хранилище;
(например:

Основная система (FC диски) Задачи: Снизить издержки хранения; Уменьшить время восстановления. Решение:
DS4200 или EXP810 c SATA дисками);
Долговременный архив на ленте.
Преимущества:
Соотношение стоимости информации с издержками на хранение;
Быстрое восстановление;
Лучшее использование ресурсов.

Тип СХ Класс данных

Пример инфраструктуры для ILM

Критичные:
Высокая производительность;
Постоянно и активно используемые.
Актуальные:
Умеренная производительность;
Периодческое использование.
Архивные данные:
Низкая производительность;
Редкое использование и хранение на всякий случай.

Промежуточное хранилище
(SATA диски)

Архив (Лента)

Слайд 25

IBM: более 50 лет в разработке лент

Начало - 1952 год:
IBM 726 Tape

IBM: более 50 лет в разработке лент Начало - 1952 год: IBM
Unit
7,500 cps;
100 bpi.
И продолжение в 2005 году:
IBM TS1120 Tape Drive
100 MB/sec;
500 GB.

1984
IBM 3480
1st cartridge drive

1964
IBM 2104
1st read/back drive

1959
IBM 729
1st read/write drive

1952
IBM 726

1928, IBM изобрела
Перфокарту

2003
3592 Gen1

1995
IBM 3590

1999
IBM 3590E

E N T E R P R I S E

2005
3592 Gen2

Слайд 26

Уровень предприятия

TS3100

TS3200 / TS3310

TS3500

Virtual Tape

3494

Средний уровень

Начальный уровень

3592/TS1120

LTO

Наиболее широкая продуктовая линейка в

Уровень предприятия TS3100 TS3200 / TS3310 TS3500 Virtual Tape 3494 Средний уровень
индустрии

Ленточные системы IBM System Storage

Обеспечивают непрерывность бизнеса и защиту данных.
Эффективно управляют информацией на протяжении всего жизненного цикла.
Обеспечивают гибкость построения и расширяемость систем.
Обеспечивают высокую рентабельность систем хранения

Инновации семейства IBM System Storage:

Слайд 27

UltraScalable Tape Library TS3500

Поддерживает до 16 стоек, до 192 приводов, до

UltraScalable Tape Library TS3500 Поддерживает до 16 стоек, до 192 приводов, до
6887 лент, максимальная емкость до 2754 ТБ;
Восстановление канала передачи данных после сбоя;
Балансировка нагрузки;
Поддерживает Ultrium 3 и IBM 3592 приводы;
Multi-Path архитектура;
Возможность чтения/записи Ultrium 2 кассет с емкостью Ultrium 2, но с улучшенной производительностью;
Восстановление пути управления под AIX;
Улучшение управления/функциональности.

Слайд 28

Производственные службы электронной библиотеки

Лаборатория оцифровки объектов;
Прием и обработка объектов на цифровых носителях;
Подготовка

Производственные службы электронной библиотеки Лаборатория оцифровки объектов; Прием и обработка объектов на
объектов архивного хранения;
Каталогизация;
Электронного хранилище;
Сохранение и миграция данных;
Обеспечение фактической и юридической значимости;
Служба экспорта цифровых ОАХ;
Научно-исследовательская служба (НИС);
Служба обеспечения Web-портала;
Служба информационной безопасности.

Слайд 29

Модель IBM DIAS основана на результатах проекта Networked European Deposit Library (EU-Projekt

Модель IBM DIAS основана на результатах проекта Networked European Deposit Library (EU-Projekt
2000 – 2002)

Ввод данных: обработка входящей информации или оцифровка объекта:
SIP – Submission Information Package;
Упаковка и выдача: интерфейс вывода данных из депозитария:
проверка запросов;
подготовка и выдача электронного документа (при необходимости – вместе с ПО для просмотра) в соответствии с метаданными:
Dissemination Information Package (DIP).
Основа – IBM Content Manager;
Digital Media Center.

Слайд 30

Решение «Электронная библиотека» IBM DIAS:

Решение «Электронная библиотека» IBM DIAS:

Слайд 31

Обеспечение фактической и юридической значимости объекта хранения

Верификация аутентичности документа через применение ЭЦП

Обеспечение фактической и юридической значимости объекта хранения Верификация аутентичности документа через применение
необходима на всех значимых этапах преобразования объекта:
Создание эталонной копии для архивного хранения;
Создание рабочей копии для оперативной деятельности;
Любое перемещение эталонной копии внутри архива;
Любое преобразование во время миграции объекта;
При необходимости – при выдачи заверенной копии клиенту;
И т.д.
Услуги ДТС – для обеспечения как фактической, так и юридической значимости.

Слайд 32

Вычислительная инфраструктура ЭБ

Функциональные подразделения:
Поддержка клубной деятельности;
Межбиблиотечный обмен;
Общественный Совет;
Экспозиционная деятельность;
Научно-просветительская деятельность;
Организационно-методическая поддержка исследований;
Электронный читальный зал;
Конференц-зал,

Вычислительная инфраструктура ЭБ Функциональные подразделения: Поддержка клубной деятельности; Межбиблиотечный обмен; Общественный Совет;
Видео-зал, Издательский отдел
(10-15 подразделений Библиотеки).

Серверы рабочих групп;
Рабочие места пользователей;
Локальные функциональные задачи.

Хранилище электронной библиотеки

Главный сервер управления хранением документов;
Индекс поиска и буфер активных документов;
Долговременный архив документов.

Технологические службы ЭБ:
Подготовка объектов архивного хранения;
Приём и обработка объектов на цифровых носителях;
Каталогизация;
Электронное хранилище;
Сохранение и миграция объектов;
Экспорт цифровых ОАХ;
Научно-исследовательская служба (НИС).

Технологические кластеры
Специализированное оборудование
Автоматизация функций DIAS

Централизованные ИТ-сервисы:

Электронный документооборот;
Средства коллективной работы;
Электронная почта, ERP, биллинг...
Информационная безопасность;
Обеспечение аутентичности и юридической значимости;
Интернет-портал;
Библиографический каталог.

Web

Имя файла: Электронные-цифровые-архивы-:-долговременное-сохранение-данных-и-обеспечение-их-аутентичности.-Модель-сохранения-данных-OAIS-(ISO-1472.pptx
Количество просмотров: 139
Количество скачиваний: 0