Электронные цифровые архивы : долговременное сохранение данных и обеспечение их аутентичности. Модель сохранения данных OAIS (ISO 1472

Содержание

Слайд 2

Электронные цифровые архивы : долговременное сохранение данных и обеспечение их аутентичности.

Инновации

Электронные цифровые архивы : долговременное сохранение данных и обеспечение их аутентичности. Инновации
IBM;
Стандарты в области долговременного сохранения данных:
международные
отечественные;
Проекта CASPAR и участие IBM;
Модель цифрового архива DIAS (Digital Information Archival System);
Обеспечение фактической и юридической значимости объекта хранения;
Функциональная архитектура;
Примеры реализации;
Программно-аппаратное обеспечение.

Слайд 3


1

Преамбула

 1 Преамбула

Слайд 4

Source: McKinsey Quarterly survey of 9,345 global executives

Способность управлять растущими
расходами

Способность найти инвестиции

Способность

Source: McKinsey Quarterly survey of 9,345 global executives Способность управлять растущими расходами
управлять глобальной
организацией

Способность найти лучших специалистов

Способность к инновациям

Руководители уверены, что ключевым фактором успеха и конкурентного преимущества являются инновации

Слайд 5

Инновации как основа успеха IBM

2006 год:
ДОХОДЫ -$91.4млрд
Лидер рынка ПО промежуточного слоя;
№1На рынке

Инновации как основа успеха IBM 2006 год: ДОХОДЫ -$91.4млрд Лидер рынка ПО
ИТ-услуг и консалтинга;
№1 В списке TOP100 суперкомпьютеров;
Лидер рынка серверов - 32.8%;
100,000 Бизнес-партнеров;
3621 патент;
$6.1млрд Инвестиции в исследования и разработку.

Слайд 6

Нанотехнологии и цифровые архивы

Открытие магнитной анизотропии атома:
Будущее технологий хранения данных: атом железа

Нанотехнологии и цифровые архивы Открытие магнитной анизотропии атома: Будущее технологий хранения данных:
на специальной медной подложке сохраняет магнитный момент и ориентацию оси в зависимости от заряда. Перемена магнитного момента атома может интерпретироваться как «0» или «1».
Молекулярный вентиль (элементарный переключатель):
В качестве элементарного переключателя (элемента логического вентиля) может использоваться отдельная молекула (нафталинцианин), которая может переходить из состояния «включено» в состояние «выключено» без изменения формы.

Слайд 7


2

Ситуация в мире

 2 Ситуация в мире

Слайд 8

CASPAR – сохранение культурного, художественного и научного наследия.

CASPAR (Cultural, Artistic, and Scientific

CASPAR – сохранение культурного, художественного и научного наследия. CASPAR (Cultural, Artistic, and
knowledge for Preservation, Access and Retrieval)
международный проект ЕС и UNESCO, основной целью которого является разработка стандартов и механизмов долговременного (неограниченного) срока сохранения культурного, научного и художественного наследия мира.
Preservation DataStore – инновационная система хранения данных, в основе которой - модель OAIS (ISO:14721:2002). Разрабатывается IBM.
http://www.casparpreserves.eu/

Слайд 9

Расширяющаяся цифровая вселенная
В 2006 г. объем оцифрованной информации – созданной и

Расширяющаяся цифровая вселенная В 2006 г. объем оцифрованной информации – созданной и
сохраненной для дальнейшего воспроизведения, составил 161 экзабайт (161 миллиард гигабайт) – объем, примерно в 3 миллиона раз превышающий объем всех написанных за историю человечества книг!
До конца 2010 г. этот объем увеличится в 6 раз и составит 998 экзабайт.
IDC (2007) The Expanding Digital Universe

Слайд 10

Основные требования к цифровым архивам

Централизация;
Структурность;
Гарантированная сохранность данных;
Гибкость ;
Универсальность;
Масштабируемость;
Соответствие (международным) стандартам сохранения

Основные требования к цифровым архивам Централизация; Структурность; Гарантированная сохранность данных; Гибкость ;
данных и создания электронных цифровых фондов;
Эффективная модель управления;
Производительность;
«Читабельность» объектов сохранения в течение всего срока сохранения.

Слайд 11

Open Archival Information System Reference Model - OAIS (ISO:14721:2002)

Open Archival Information System Reference Model - OAIS (ISO:14721:2002)

Слайд 12

Открытая система архивной информации - OAIS

Простое хранение цифровой копии – нонсенс.
Как обеспечить

Открытая система архивной информации - OAIS Простое хранение цифровой копии – нонсенс.
воспроизводимость и понимаемость в будущем?
Описательные метаданные.
Определение фокусной аудитории и принятых в этой аудитории форматов.
...

Представление объектов архивного хранения
(Archival Information Package) в соответствии со стандартом OAIS (ISO:14721:2002)

Представление информации в строго заданных параметрах воспроизведения, подходящих для передачи и обмена, интерпретации или дальнейшей обработки

Слайд 13

Модели сохранения

Музей
Исходные данные и средства просмотра сохраняются в оригинальном виде и

Модели сохранения Музей Исходные данные и средства просмотра сохраняются в оригинальном виде
поддерживаются в рабочем состоянии;
Запрет на интерпретацию данных, высокие затраты на обслуживание программно-аппаратных средств;
Эмулятор
Исходные данные сохраняются в оригинальном виде;
Эмуляция средств просмотра (комплекса ПО и АО) – IBM UVC (Universal Virtual Computer);
Необходимость поддержки виртуальной платформы UVC;
Миграция
Миграция основных компонент контентного содержания;
Сохранение основных характеристик идентичности и целостности объектов хранения;
Возможно появление «цифрового шума»;
Описание
Создание описательного содержания, позволяющего воспроизведение оригинала;
Нет необходимости поддержки исходных данных и оригинальных средств просмотра;
Потеря исходных данных (оригинального контента).

IBM Research Lab in Haifa, Israel
http://www.haifa.il.ibm.com/

Модель IBM Preservation DataStore поддерживает все модели сохранения.

Слайд 14


3

Позиция и решения IBM

 3 Позиция и решения IBM

Слайд 15

Модель IBM DIAS основана на результатах проекта Networked European Deposit Library (EU-Projekt

Модель IBM DIAS основана на результатах проекта Networked European Deposit Library (EU-Projekt
2000 – 2002)

Ввод данных: обработка входящей информации или оцифровка объекта:
SIP – Submission Information Package;
Упаковка и выдача: интерфейс вывода данных из депозитария:
проверка запросов;
подготовка и выдача электронного документа (при необходимости – вместе с ПО для просмотра) в соответствии с метаданными:
Dissemination Information Package (DIP).
Основа – IBM Content Manager;
Digital Media Center.

Слайд 16

Решение «Электронная библиотека» IBM DIAS:

Решение «Электронная библиотека» IBM DIAS:

Слайд 17

Обеспечение фактической и юридической значимости объекта хранения

Верификация аутентичности документа через применение ЭЦП

Обеспечение фактической и юридической значимости объекта хранения Верификация аутентичности документа через применение
необходима на всех значимых этапах преобразования объекта:
Создание эталонной копии для архивного хранения;
Создание рабочей копии для оперативной деятельности;
Любое перемещение эталонной копии внутри архива;
Любое преобразование во время миграции объекта;
При необходимости – при выдачи заверенной копии клиенту;
И т.д.
Услуги ДТС – для обеспечения как фактической, так и юридической значимости.

Слайд 18

Производственные службы электронной библиотеки

Лаборатория оцифровки объектов;
Прием и обработка объектов на цифровых носителях;
Подготовка

Производственные службы электронной библиотеки Лаборатория оцифровки объектов; Прием и обработка объектов на
объектов архивного хранения;
Каталогизация;
Электронного хранилище;
Сохранение и миграция данных;
Обеспечение фактической и юридической значимости;
Служба экспорта цифровых ОАХ;
Научно-исследовательская служба (НИС);
Служба обеспечения Web-портала;
Служба информационной безопасности.

Слайд 19

Вычислительная инфраструктура ЭБ

Функциональные подразделения:
Поддержка клубной деятельности;
Межбиблиотечный обмен;
Общественный Совет;
Экспозиционная деятельность;
Научно-просветительская деятельность;
Организационно-методическая поддержка исследований;
Электронный читальный зал;
Конференц-зал,

Вычислительная инфраструктура ЭБ Функциональные подразделения: Поддержка клубной деятельности; Межбиблиотечный обмен; Общественный Совет;
Видео-зал, Издательский отдел
(10-15 подразделений Библиотеки).

Серверы рабочих групп;
Рабочие места пользователей;
Локальные функциональные задачи.

Хранилище электронной библиотеки

Главный сервер управления хранением документов;
Индекс поиска и буфер активных документов;
Долговременный архив документов.

Технологические службы ЭБ:
Подготовка объектов архивного хранения;
Приём и обработка объектов на цифровых носителях;
Каталогизация;
Электронное хранилище;
Сохранение и миграция объектов;
Экспорт цифровых ОАХ;
Научно-исследовательская служба (НИС).

Технологические кластеры
Специализированное оборудование
Автоматизация функций DIAS

Централизованные ИТ-сервисы:

Электронный документооборот;
Средства коллективной работы;
Электронная почта, ERP, биллинг...
Информационная безопасность;
Обеспечение аутентичности и юридической значимости;
Интернет-портал;
Библиографический каталог.

Web

Слайд 20


4

Общая архитектура

 4 Общая архитектура

Слайд 21

Автоматизированная ленточная библиотека архивного хранения (Центральный архив)

Универсальный дисковый массив
(Главный индекс Хранилища, Буфер активных

Автоматизированная ленточная библиотека архивного хранения (Центральный архив) Универсальный дисковый массив (Главный индекс
документов, данные критичных приложений)

Операционный зал

Централизованные ИТ-сервисы

Универсальный сервер (Управление Хранилищем, обеспечение производственных служб)

Резервный ЦОД

Функциональные подразделения

Основной ЦОД

Общая архитектура электронно-цифрового архива

Централизованные ИТ-сервисы

Слайд 22

Референсная модель программного обеспечения

WebSphere

Lotus

WebSphere

Information Management

Websphere

Tivoli

WebSphere

Tivoli

WebSphere

Rational

Rational

WebSphere

WebSphere

WebSphere

WebSphere

Information Management

Референсная модель программного обеспечения WebSphere Lotus WebSphere Information Management Websphere Tivoli WebSphere

Слайд 23


5

Примеры реализации

 5 Примеры реализации

Слайд 24

Государственный Эрмитаж

Благотворительный проект IBM II-й половины 90-х гг.
Продолжение проекта – 2007 г.
Особенности
Решение

Государственный Эрмитаж Благотворительный проект IBM II-й половины 90-х гг. Продолжение проекта –
«под ключ»;
Введение новых административно-производственных процедур в жизнь музея;
Решение ряда важнейших технологических вопросов с нуля.
В течение нескольких лет сайт Эрмитажа – среди победителей международных интернет-конкурсов на лучший электронный музей.

http://hermitagemuseum.org

Слайд 25

Королевская библиотека Нидерландов

Особенности проекта:
Центральная часть европейского проекта;
Первые в Европе, опыт реальной производственной

Королевская библиотека Нидерландов Особенности проекта: Центральная часть европейского проекта; Первые в Европе,
эксплуатации в течение нескольких лет;
Конкурс: Siemens, Wang,CAP Gemini, Getronics/Wang, Pink Roccade.
Комплекс:
Ядро системы – DIAS:
WebSphere;
Content Manager,
Tivoli Storage Manager (TSM),
DB2.
7-node RS/6000 SP server (processing of the document input/output);
RS/6000 SP 375 MHz POWER3 SMP Wide server - processing software;
RS/6000 F50 server - Control Workstation for the RS/6000 SP;
Enterprise Storage Server,
3 x 3494 Enterprise Tape Libraries
3995 Model C68 Optical Library.

Слайд 26

Kopal Project

Национальная библиотека Германии
Deutsche Nationalbibliothek (The German National Library)
Научное общество по

Kopal Project Национальная библиотека Германии Deutsche Nationalbibliothek (The German National Library) Научное
обработке информации
Gesellschaft für wissenschaftliche Datenverarbeitung mbH Göttingen
Государственная библиотека Университета Гёттингена
Niedersaechsische Staats- und Universitaetsbibliothek Goettingen (Goettingen State and University Library)
IBM Deutschland GmbH
Ядро: DIAS+

http://kopal.langzeitarchivierung.de/

Слайд 27

Государственная библиотека Тяньцзинь

Особенности проекта:
Государственная библиотека в КНР;
Первый подобный проект;
Конкурс: Computer Associates, Dell,

Государственная библиотека Тяньцзинь Особенности проекта: Государственная библиотека в КНР; Первый подобный проект;
EMC, Legend, Oracle + местные компании.
Комплекс:
7 х eServer pSeries 630 security control servers;
8 х Server pSeries 650 digital content metadata servers and resource managers;
eServer xSeries 235 - library automation server;
eServer xSeries 335 - team development server;
eServer xSeries 345 - staging server;
eServer xSeries 360 - a portal server;
2 SAN 2109 Fibre Channel Switches;
IBM 3583 L18 Ultrium Scalable Tape Library.
Information Management:
DB2 Content Manager for AIX, DB2 Content Manager VideoCharger;
Lotus: WebSphere Portal Extend;
Rational Software: Rational Web Developer for WebSphere Software;
Tivoli Storage Management: Tivoli SANergy, Tivoli Storage Manager;
Tivoli Security Solutions: Tivoli Access Manager for e-business;
WebSphere: WebSphere Application Server – Enterprise.

Слайд 28

Библиотека университета Mashiakhat Al Azhar

Особенности проекта:
Оцифровка и каталогизация древних манускриптов.
Комплекс:
IBM RS/6000

Библиотека университета Mashiakhat Al Azhar Особенности проекта: Оцифровка и каталогизация древних манускриптов.
SP2;
IBM RS/6000 B50;
IBM Netfinity 4500R;
Storage:
Optical Storage;
Tape Storage.
Программные платформы:
IBM Content Manager;
IBM Enterprise Information Portal (EIP);
IBM DB2;
IBM WebSphere Application Sever and Edge Server.

Слайд 29

Высшая школа менеджмента СПбГУ

Особенности проекта:
Головной ВУЗ СЗФО;
Школа бизнеса мирового уровня;
Электронная библиотека;
Ядро системы

Высшая школа менеджмента СПбГУ Особенности проекта: Головной ВУЗ СЗФО; Школа бизнеса мирового
– Digital Media Center;
Проектирование – российские бизнес-партнеры.
Сроки:
Проектирование – 6 мес.
Исполнение (архив) – 12 мес.
Контроль за исполнением:
Приоритетный национальный проект «Образование».

Слайд 30

Аппаратная платформа

Центральный кластер из 3-х серверов:
4-CPU Power5+ 2.2 GHz;
16 GB RAM;
1x 2-Port

Аппаратная платформа Центральный кластер из 3-х серверов: 4-CPU Power5+ 2.2 GHz; 16
Ethernet x 1 GB;
2 x 2-Port Fiber-Channel x 2 GB;
4 HDD x 73GB;
Administrator Console.
Цифровой архив:
Оперативный архив: DS4800 6TB
48 FC HDD x 146 GB;
Вторичный архив: DS4800 24 TB
48 SATA HDD x 500GB;
Доловременной архив: TS 3500 100TB
4 LTO-3 привода чтения / записи;
260 кассет LTO3.

IBM System p570
Кластер с GPFS

IBM BladeCenter

LAN

SAN Director

IBM DS4800 Оперативный архив

IBM DS4800 Вторичный архив

Ленточная библиотека IBM TS3500

Слайд 31


х

Вопросы и ответы Валерий Елизов R90423@ru.ibm.com +7 (985) 761-9108

 х Вопросы и ответы Валерий Елизов R90423@ru.ibm.com +7 (985) 761-9108

Слайд 32


5

Дополнительные материалы Системы хранения данных IBM

 5 Дополнительные материалы Системы хранения данных IBM

Слайд 33

Уровень предприятия

Наиболее широкая продуктовая линейка в индустрии

Семейство дисковых систем IBM System Storage

Уровень предприятия Наиболее широкая продуктовая линейка в индустрии Семейство дисковых систем IBM
DS

Упростить инфраструктуру и уменьшить затраты на ее управление, внося изменения по мере необходимости.
Обеспечить непрерывность бизнеса и защиту данных.
Эффективно управлять информацией на протяжении всего жизненного цикла.

Инновации семейства IBM System Storage DS помогают:

DS3200/DS3400

DS4000

DS6000

DS8000

Средний уровень

Начальный уровень

Слайд 34

IBM - авторитет индустрии в 4Gbit сетях хранения

IBM - авторитет индустрии в 4Gbit сетях хранения

Слайд 35

Основная система
(FC диски)

Задачи:
Снизить издержки хранения;
Уменьшить время восстановления.
Решение:
Несколько уровней хранения;
Производительная основная СХ;
Промежуточное хранилище;
(например:

Основная система (FC диски) Задачи: Снизить издержки хранения; Уменьшить время восстановления. Решение:
DS4200 или EXP810 c SATA дисками);
Долговременный архив на ленте.
Преимущества:
Соотношение стоимости информации с издержками на хранение;
Быстрое восстановление;
Лучшее использование ресурсов.

Тип СХ Класс данных

Пример инфраструктуры для ILM

Критичные:
Высокая производительность;
Постоянно и активно используемые.
Актуальные:
Умеренная производительность;
Периодческое использование.
Архивные данные:
Низкая производительность;
Редкое использование и хранение на всякий случай.

Промежуточное хранилище
(SATA диски)

Архив (Лента)

Слайд 36

IBM: более 50 лет в разработке лент

Начало - 1952 год:
IBM 726 Tape

IBM: более 50 лет в разработке лент Начало - 1952 год: IBM
Unit
7,500 cps;
100 bpi.
И продолжение в 2005 году:
IBM TS1120 Tape Drive
100 MB/sec;
500 GB.

1984
IBM 3480
1st cartridge drive

1964
IBM 2104
1st read/back drive

1959
IBM 729
1st read/write drive

1952
IBM 726

1928, IBM изобрела
Перфокарту

2003
3592 Gen1

1995
IBM 3590

1999
IBM 3590E

E N T E R P R I S E

2005
3592 Gen2

Слайд 37

Уровень предприятия

TS3100

TS3200 / TS3310

TS3500

Virtual Tape

3494

Средний уровень

Начальный уровень

3592/TS1120

LTO

Наиболее широкая продуктовая линейка в

Уровень предприятия TS3100 TS3200 / TS3310 TS3500 Virtual Tape 3494 Средний уровень
индустрии

Ленточные системы IBM System Storage

Обеспечивают непрерывность бизнеса и защиту данных.
Эффективно управляют информацией на протяжении всего жизненного цикла.
Обеспечивают гибкость построения и расширяемость систем.
Обеспечивают высокую рентабельность систем хранения

Инновации семейства IBM System Storage:

Слайд 38

UltraScalable Tape Library TS3500

Поддерживает до 16 стоек, до 192 приводов, до

UltraScalable Tape Library TS3500 Поддерживает до 16 стоек, до 192 приводов, до
6887 лент, максимальная емкость до 2754 ТБ;
Восстановление канала передачи данных после сбоя;
Балансировка нагрузки;
Поддерживает Ultrium 3 и IBM 3592 приводы;
Multi-Path архитектура;
Возможность чтения/записи Ultrium 2 кассет с емкостью Ultrium 2, но с улучшенной производительностью;
Восстановление пути управления под AIX;
Улучшение управления/функциональности.
Имя файла: Электронные-цифровые-архивы-:-долговременное-сохранение-данных-и-обеспечение-их-аутентичности.-Модель-сохранения-данных-OAIS-(ISO-1472.pptx
Количество просмотров: 124
Количество скачиваний: 0