Реляционная модель данных

Содержание

Слайд 2

Из истории РМД

19 августа 1969 года вышла статья Эдгара Кодда посвященная реляционному

Из истории РМД 19 августа 1969 года вышла статья Эдгара Кодда посвященная
представлению данных. Т.о. данный подход существует уже более 40 лет
Реляционная модель данных жива и здравствует, и пока что не видно реальных претендентов на ее замену. Возможно, это объясняется отсутствием в настоящее время в сообществе баз данных людей масштаба доктора Кодда, но, скорее всего, просто отсутствуют потребности в других абстрактных средствах представления данных. Все существующие модели происходят из нее и на ее базе.

С другой стороны, современное представление "истинной" реляционной модели данных обеспечивается в работах последних десятилетий Криса Дейта и Хью Дарвена. Не нарушая предписания, сформулированные в первых статьях Эдгара Кодда Дейт и Дарвен предлагают концепцию построения новых СУБД.
Сам термин «реляционная модель» у Кодда появилась только в 1979 году, а понятие модели– только в 1981

Слайд 3

Основные понятия РМД

Реляционная модель данных (РМД, relation – отношение, математический термин, обозначающий

Основные понятия РМД Реляционная модель данных (РМД, relation – отношение, математический термин,
таблицу) – это теория данных, основанная на некоторых положениях математики (теория множеств и предикативной логики).
Любое предприятие имеет большое количество данных, связанных с его деятельностью (о продукции, о счетах, о планировании, о студентах и др.) Эти данные представляют основные объекты, они связаны между собой отношениями. Поэтому в БД отражаются и объекты и отношения между ними.

Слайд 4

Основные принципы РМД

Основные принципы РМД:
представление данных в виде таблиц;
использование стандартных операторов обработки

Основные принципы РМД Основные принципы РМД: представление данных в виде таблиц; использование
данных, позволяющих генерировать новые таблицы на основе существующих.
РМД характеризуется структурой данных, целостностью и обработкой данных.

Слайд 5

Основные понятия РМД

Структура данных связана с несколькими понятиями: отношение – это данные

Основные понятия РМД Структура данных связана с несколькими понятиями: отношение – это
представленные в виде таблицы; таблица состоит из строк и столбцов. Строка таблицы называется кортежем, количество кортежей – кардинальным числом. Столбец – атрибутом, количество атрибутов – степенью. Каждая строка содержит запись БД. Каждая запись одной таблицы содержит равное количество полей. В таблице не должно быть одинаковых записей (кортежей). Каждая запись характеризуется уникальным идентификатором, который называется первичный ключ.

Слайд 6

Виды отношений в РМД

Целостность данных обеспечивается наличием ключей и связями, устанавливаемыми между

Виды отношений в РМД Целостность данных обеспечивается наличием ключей и связями, устанавливаемыми
таблицами.
Связи между таблицами устанавливаются на базе следующих возможных типов отношений:
один к одному (о-о);
один ко многим (о-м);
много к одному (м-о);
много ко многим (м-м).

Слайд 7

Виды отношений в РМД

Виды отношений в РМД

Слайд 8

Операции над данными

Обработка данных подразумевает совокупность возможных операций над БД.
Следует рассмотреть

Операции над данными Обработка данных подразумевает совокупность возможных операций над БД. Следует
следующие виды операций:
над строками;
над таблицами (отношениями);
специальные.

Слайд 9

Операции над данными в РМД (на уровне строк)

На уровне строк БД возможно

Операции над данными в РМД (на уровне строк) На уровне строк БД
их удаление, обновление, добавление.

Слайд 10

Операции над данными в РМД (на уровне таблиц)

На уровне таблиц – объединение

Операции над данными в РМД (на уровне таблиц) На уровне таблиц –
таблиц, пересечение, разность, декартово произведение (над таблицами разной структуры – результат – все возможные сочетания – ненормализованная таблица с полной информацией об объекте). Остальные операции производятся над таблицами одинаковой структуры.

Слайд 11

Объединение – новая таблица (отношение) на базе двух существующих, включающая все кортежи,

Объединение – новая таблица (отношение) на базе двух существующих, включающая все кортежи,
принадлежащие и первому отношению и второму.
Вычитание – возвращает отношение, содержащее все кортежи, которые принадлежат первому и не принадлежат второму
Пересечение – возвращает отношение, содержащее все кортежи, принадлежащие и первому и второму отношениям.

Операции над данными в РМД (на уровне таблиц)

Слайд 12

Произведение декартово – возвращает отношение, содержащее всевозможные кортежи, которые являются сочетанием двух

Произведение декартово – возвращает отношение, содержащее всевозможные кортежи, которые являются сочетанием двух
кортежей, принадлежащих двум отношениям.

Произведение декартово – возвращает отношение, содержащее всевозможные кортежи, которые являются сочетанием двух кортежей, принадлежащих двум отношениям.

Слайд 13

Операции над данными в РМД (специальные)

Специальные операции – выборка данных, проекция и

Операции над данными в РМД (специальные) Специальные операции – выборка данных, проекция
др.
Выборка – возвращает отношение, содержащее все кортежи, удовлетворяющие определенным условиям.
Проекция – возвращает отношение, содержащее все кортежи существующего отношения после исключения из него некоторых атрибутов.

Слайд 14

Нормализация таблиц

При проектировании РБД необходимо обеспечить эффективную работу с данными, поэтому следует

Нормализация таблиц При проектировании РБД необходимо обеспечить эффективную работу с данными, поэтому
организовывать такую структуру, которая позволит:
организовать быстрый доступ к данным;
исключить ненужное повторение данных, которое может являться причиной ошибок при вводе и нерациональное использование дискового пространства;
обеспечить целостность данных так, чтобы при изменении одних данных происходило автоматическое изменение связанных с ними данных.
Процесс уменьшения избыточности данных называется нормализацией таблицы.

Слайд 15

Нормализация таблиц

При существенном дублировании данных таблица называется ненормализованной. Из нее можно сформировать

Нормализация таблиц При существенном дублировании данных таблица называется ненормализованной. Из нее можно
несколько нормализованных таблиц и установить между ними связи.
Связи устанавливаются между первичным ключом и совпадающими полями другой таблицы. Первичный ключ однозначно определяет запись в таблице, таким ключом может быть код детали, порядковый номер в списке и т.д. Внешний ключ – это поле, содержащее такой же тип информации в таблице, которая является подчиненной.

Слайд 16

Нормализация таблиц

ненормализованная таблица
нормализованные таблицы

Следует различать простое (неизбыточное) и избыточное дублирование данных. Наличие

Нормализация таблиц ненормализованная таблица нормализованные таблицы Следует различать простое (неизбыточное) и избыточное
первого допускается в РБД. Второе может приводить к проблемам при обработке данных. Пример избыточного дублирования:

Слайд 17

Нормализация таблиц

Существует следующая последовательность нормальных форм:
первая нормальная форма (1НФ);
вторая нормальная форма (2НФ);
третья

Нормализация таблиц Существует следующая последовательность нормальных форм: первая нормальная форма (1НФ); вторая
нормальная форма (3НФ);
нормальная форма Бойса-Кодда (БКНФ);
четвертая нормальная форма (4НФ);
пятая нормальная форма (5НФ)
и еще 2 формы сформулированы в последнее время.
Каждая форма – свод правил и ограничений, которые необходимо соблюсти при формировании таблиц.

Слайд 18

Нормализация таблиц

Нормализация таблиц

Слайд 19

Нормализация таблиц

Нормализация таблиц

Слайд 20

Достоинства и недостатки РМД

Достоинства РМД:
простота представления данных (таблицы просты для восприятия информации);
минимальная

Достоинства и недостатки РМД Достоинства РМД: простота представления данных (таблицы просты для
избыточность данных при нормализации таблиц;
универсальность процедур обработки данных.
Недостатки РМД:
фрагментация данных, из-за нормализации таблиц, а в большинстве задач требуется общая картина данных, но эта проблема может быть разрешена через различные средства СУБД – выборку данных в запросах и формирование отчетов на основе данных из различных связанных между собой таблиц.