Организация и проектирование баз данных

Содержание

Слайд 2

Базы данных и информационные системы

Базы данных и информационные системы

Слайд 3

Информационные системы

Информационная система - это …

Отличительные характеристики ИС
- большие объемы хранимой информации
-

Информационные системы Информационная система - это … Отличительные характеристики ИС - большие
простые алгоритмы обработки информации
- не критичность времени получения информации
- большое количество источников и получателей информации

… совокупность банков данных, информационных технологий и комплекса (комплексов) программно-технических средств

банк данных – организационно-техническая система, включающая одну или несколько баз данных и систему управления ими

база данных – совокупность структурированной и взаимосвязанной информации, организованной по определенным правилам на материальных носителях

(з-н РБ № 455-З Об информации, информатизации и защите информации)

Слайд 4

Виды информационных систем

OLTP (Online Transaction Processing, оперативная обработка транзакций)
БД называются БД

Виды информационных систем OLTP (Online Transaction Processing, оперативная обработка транзакций) БД называются
оперативной обработки.

OLAP (On - Line Analitical Processing - оперативная аналитическая обработка данных) и Data Mining  (раскопка данных).
БД называются хранилищами.

Основное назначение OLAP и Data Mining:
как можно быстрее выдавать данные для построения аналитических отчетов (OLAP) и поиск скрытых закономерностей в данных и решение задач прогнозирования (Data Mining).

Основное назначение OLTP:
формирование первичных согласованных данных 

Основная характеристика OLAP и Data Mining:
- выполнение небольшого количества сложных транзакций на выборку данных.

Основная характеристика OLTP:
выполнение большого количества коротких транзакций на изменение данных в реальном времени. 

Слайд 5

Взаимоотношение видов ИС

Взаимоотношение видов ИС

Слайд 6

Типы информационных систем

Системы с распределенной обработкой (DDP, Distributed Data Processing)

Системы распределенных баз данных

Типы информационных систем Системы с распределенной обработкой (DDP, Distributed Data Processing) Системы
(DDB, Distributed Data Base)

Основной признак DDP - централизованная база данных 

Основной признак DDB – распределенная база данных

Основное достоинство DDB – масштабируемость и устойчивость

Основное достоинство DDP – высокая согласованность данных

Слайд 7

Файл

файл

Файл с данными
учета раб.времени

Файл с данными
по служащим

Доступ к базе данных

База

Файл файл Файл с данными учета раб.времени Файл с данными по служащим
данных

База данных – совокупность структурированной и взаимосвязанной информации, организованной по определенным правилам на материальных носителях

Система управления файлами операционной системы

База данных содержит информацию, отражающую состояние объектов и их отношений в предметной области

Слайд 8

Предпосылки появления СУБД

Программа обновления данных по служащим

ОСД

Программа создания отчетов по служащим

ОСД

Программа начисления

Предпосылки появления СУБД Программа обновления данных по служащим ОСД Программа создания отчетов
зарплаты по служащим

ОСД

Файл с данными
по служащим

Файл с данными
учета раб.времени

struct
{ CString s_name;
int i_Status;
int i_Valus …
}

Система управления файлами операционной системы

1. При изменении модели данных требовалось изменить программы всех пользователей.

2. Невозможность обеспечения разграничения прав доступа к данным разных пользователей.

3. Параллельная работа нескольких пользователей с одним и тем же файлом значительно затрудняла логику программирования и приводила к снижению производительности системы.

Слайд 9

СУБД

Программа обновления данных по служащим

Программа создания отчетов по служащим

Запрос на получение данных

Программа

СУБД Программа обновления данных по служащим Программа создания отчетов по служащим Запрос
начисления зарплаты по служащим

Файл с данными
учета раб.времени

Файл с данными
по служащим

ОСД

ОСД

Запрос на обновление данных

Запрос на получение данных

Запрос на получение данных
СУБД

СУБД – совокупность языковых и программных средств, предназначенных для управления совместным использованием базы данных многими пользователями

База данных

Система управления файлами операционной системы

Слайд 10

Основные функции СУБД

1. Определение данных

2. Обработка данных

3. Управление данными

Описание структур данных

Добавление, изменение

Основные функции СУБД 1. Определение данных 2. Обработка данных 3. Управление данными
и удаление данных, сортировка и поиск.

Определение пользователей и их прав доступа к различным данным, блокировки доступа к данным, управление данными на внешних устройствах, …

Слайд 11

Архитектура БД

ANSI (American National Standards Institute) предложена организации БД в виде 3-х

Архитектура БД ANSI (American National Standards Institute) предложена организации БД в виде
уровней абстракций описания данных

Описание данных для решения задач конечных пользователей

Описание данных в виде обобщенной логической структуры

Описание данных в файловой системе

Логическая независимость

Физическая независимость

Логическая независимость – возможность изменения одного приложения без корректировки другого

Физическая независимость – перенос хранения информации с одного носителя на другой при сохранении работоспособности всех приложений

Каждый уровень архитектуры БД представляется моделью данных

Слайд 12

Модели данных

Модели данных

Слайд 13

Объект БД - информация

Термин «информация» происходит от латинского слова «informatio» - разъяснение,

Объект БД - информация Термин «информация» происходит от латинского слова «informatio» -
изложение, сведения.

Информация извлекается из данных и зависит от объекта воспринимающего (обрабатывающего) это сообщение.
Результат зависит от свойств этого объекта.
В зависимости от целей и интересов из одного и того же сообщения можно извлечь совершенно разную информацию.

6032106011720325

Информация отличается от понятия «данные» и «сообщение».

информация – сведения о лицах, предметах, фактах, событиях, явлениях и процессах независимо от формы их представления;

Слайд 14

Иерархия информации

Уровень физ.носителя

Диск, цилиндр, дорожка, сектор

Уровень лог.носителя

Файл, FAT, FNTS …

Уровень программы

Типы

Иерархия информации Уровень физ.носителя Диск, цилиндр, дорожка, сектор Уровень лог.носителя Файл, FAT,
данных Int, Struct …

Уровень пользователя

Документ, форма, график …

Информация в ИС имеет много уровней абстрагирования

СУФ ОС

Драйвер

приложение

Слайд 15

Модель данных

Модель – это абстракция, с помощью которой человек описывает суть проблемы

Модель данных Модель – это абстракция, с помощью которой человек описывает суть
или явления без акцента на существенных деталях, с целью понимания и возможности исследования проблемы или явления.

Модель данных – это набор концепций, содержащих сведения об организации данных, их отношениях (взаимосвязях), ограничениях и допустимых операциях.

1. Код группы(5 цифр)
2. день (2 цифры)
3. месяц (2 цифры)
4. год (2 цифры)
5. период (1 цифра)
6. кол.предметов (2 цифры)
7. кол.слуш. (2 цифры)

6032101011720325

Данные

Модель данных

Слайд 16

Модель данных

Каждый уровень архитектуры БД представляется моделью данных

Модели концептуального уровня называют даталогическими.

Модель данных Каждый уровень архитектуры БД представляется моделью данных Модели концептуального уровня
Они представляет собой отображение логических связей между элементами данных безотносительно к их содержанию и среде хранения. В них отражены особенности предметной области, для которой создаётся БД.

Модели физического уровня называются физическими моделями данных и определяют способы размещения и доступа данных в файлах. 

Модели внешнего уровня являются подсхемами даталогических моделей или структурами данных, используемых в системах программирования (объектно-ориентированная модель)

Даталогическая модель определяет тип конкретной СУБД

Слайд 17

Классификация концептуальных моделей данных

Формат документа

Документальные

Даталогические модели

Фактографические

Дискрип-торные

Тезаурос-ные
Графовые
Множест-венные

Объектно-ориенти-рованные

Иерархические

Сетевые

Реляционные

Бинарных ассоциаций

Объектно -реляционные

Описывают слабоструктурированную информацию

описывают информацию в

Классификация концептуальных моделей данных Формат документа Документальные Даталогические модели Фактографические Дискрип-торные Тезаурос-ные
виде жесткой структуры

Модели, ориентированные на формат документа основаны на языках разметки документов (SGML - Standart Generalised Markup Language, HTML -HyperText Markup Language, язык разметки гипертекста и XML - eXtensible Markup Language), которые позволяют организовывать информацию, содержащуюся в документах, и представлять ее в некотором стандартном виде.

Тезаурусные модели содержат определенные языковые конструкции и принципы их взаимодействия в заданной грамматике. Они эффективно используются в системах-переводчиках.

Дескрипторные модели основаны на дескрипторах— описателях, имеющих жесткую структуру и описывающих документы в соответствии с теми характеристиками, которые требуются для работы с ними. Информация обрабатывается исключительно по дескрипторам, а не по самому тексту документа.

Графовые модели данных отражают совокупность объектов реального мира в виде графа взаимосвязанных информационных объектов.

Множественные модели основаны на теории множеств и описывают совокупность объектов реального мира в виде отношений.

Модели бинарных ассоциаций используются в системах искусственного интеллекта. К этим моделям относятся модели, например, Data Semantics (автор Абриал) и DIAM II (автор Сенко).

Слайд 18

Модель данных основа СУБД

Реляционная модель данных – определяет семейство реляционных СУБД

Документальные модели

Модель данных основа СУБД Реляционная модель данных – определяет семейство реляционных СУБД
– определяют семейство документно-ориентированных БД.

Объектно-ориентированные модели данных – определяют семейство объектно-ориентированных СУБД

Реляционные СУБД составляют значительную часть рынка (порядка 80% от всего рынка).

DB2; Informix; Oracle; Teradata Database; Microsoft SQL Server; SyBase; Microsoft Access; PostgreSQL; MySQL;  FoxPro …

Lotus Notes ( IBM)/ Notes/Domino; CouchDB, MongoDB

Db4o; ObjectStore;  Caché

Значительная часть рынка реляционных СУБД принадлежит Oracle, DB2, MS SQL Server, SyBase, MySQL (более 90%).

Слайд 19

Ещё одна классификация базы данных

Ключ-значение

NoSQL

БД

SQL

Schema less

Реляционная модель

Множество разнородных систем

Реляционные БД

Dinamo

Column

Document

Graph

Cassandra

HBase

CouchDB

Neo4j

MongoDB

Memcached 

Redis  

 Lotus Notes

BigTable

Ещё одна классификация базы данных Ключ-значение NoSQL БД SQL Schema less Реляционная

Слайд 20

Характеристика NoSQL БД

2. Неструктурированные (schemaless) 

1. Не используется SQL 

3. Представление данных в

Характеристика NoSQL БД 2. Неструктурированные (schemaless) 1. Не используется SQL 3. Представление
виде агрегатов (aggregates).

4. Слабые ACID свойства. 

5. Применяются в распределенных системах, без совместно используемых ресурсов (share nothing). 

Слайд 21

Иерархическая модель

сегменты

Сегмент – это набор однородных записей

Корневой сегмент

Модель данных для БД автомобильной

Иерархическая модель сегменты Сегмент – это набор однородных записей Корневой сегмент Модель
компании

Модель описывает структуру данных в виде направленного графа

предок

потомок

потомок

Записи состоят из полей

Поле – это минимальная неделимая структура данных, доступная пользователю как единое целое

потомок

предок

Слайд 22

Иерархическая модель

Адрес корневого сегмента

Экземпляры сегмента А

Сегмент С

Сегмент D

Сегмент A

Сегмент E

Сегмент F

Экземпляры сегмента

Иерархическая модель Адрес корневого сегмента Экземпляры сегмента А Сегмент С Сегмент D
C

Ссылки на потомков

Слайд 23

Иерархическая модель

Описание данных иерархической модели включает описание сегментов и полей для каждого

Иерархическая модель Описание данных иерархической модели включает описание сегментов и полей для
сегмента

SEGM NAME = <имя сегмента>
BYTES = <размер сегмента в байтах>
FREQ = <среднее количество экземпляров>
PARENT = <имя корневого сегмента>
FIELD NAME = (<имя поля>[,SEQ],{U|M})
START = <размер поля в байтах>
TYPE = {X|P|C}
FIELD NAME = …

Слайд 24

Иерархическая модель

Недостатки иерархической модели

1. Невозможность простой реализации связей, основанных на потомке, имеющем

Иерархическая модель Недостатки иерархической модели 1. Невозможность простой реализации связей, основанных на
несколько предков

2. Сложность реализации связей М:М, основанных на потомке, имеющем несколько предков

предок

потомок

С

А

B

предок

потомок

Слайд 25

Сетевая модель

Модель описывает структуру данных в виде наборов двухуровневых графов

Набором называется двухуровневый

Сетевая модель Модель описывает структуру данных в виде наборов двухуровневых графов Набором
граф, связывающий отношением «один-ко-многим» два типа записей

B

А

Владелец набора

Член набора

Между двумя типами записей может быть определено любое количество наборов

Слайд 26

Сетевая модель

Область данных типа «Клиент»

Область данных типа «Заказы»

Область данных типа «Товары»

Сетевая модель Область данных типа «Клиент» Область данных типа «Заказы» Область данных типа «Товары»