Информационные системы обработки данных

Содержание

Слайд 2

Системы управления базами данных

Система управления базами данных (СУБД) — это комплекс программных

Системы управления базами данных Система управления базами данных (СУБД) — это комплекс
средств, предназначенный для создания, ведения и совместного использования БД многими пользователями.
База данных (БД) представляет собой совокупность специальным образом организованных данных, хранимых в памяти вычислительной системы и отображающих состояние объектов и их взаимосвязей в рассматриваемой предметной области.

Слайд 3

В основе любой БД лежит модель данных , включающая в себя:
множество формальных

В основе любой БД лежит модель данных , включающая в себя: множество
объектов, с помощью которых описывается данная ПрО (предметная область);
набор операций для манипулирования объектами модели;
методологии, позволяющие получить формальное описание из реальной ситуации и наоборот (описание ситуации на естественном языке из некоторого формального представления).
способы задания ограничений целостности (набор условий, предназначенный для выявления ошибки при описании модели данных).

Слайд 4

По типу используемой модели можно выделить базы данных :
Иерархическая
Сетевая
Реляционная
В последние годы активно

По типу используемой модели можно выделить базы данных : Иерархическая Сетевая Реляционная
внедряются :
Объектно-ориентированные
Объектно-реляционные

Модель представления данных - логическая структура хранимых в базе данных.

Слайд 5

Иерархическая модель данных

Если в модели каждый порожденный элемент имеет не более одного

Иерархическая модель данных Если в модели каждый порожденный элемент имеет не более
исходного, то такая модель называется иерархической.

Слайд 6

Иерархическая модель данных

Тип данных «дерево»(составной из подтипов, каждый из которых является, в

Иерархическая модель данных Тип данных «дерево»(составной из подтипов, каждый из которых является,
свою очередь, типом «дерево»).
Корневым называется тип, который имеет подчиненные типы и сам не является подтипом.
Подчиненный тип (подтип) является потомком по отношению к типу, который выступает в роли предка (родителя).
Близнецы – потомки одного и того же типа.

Слайд 7

Иерархическая БД представляет собой иерархически организованный набор типов «запись»

Иерархическая БД представляет собой иерархически организованный набор типов «запись»

Слайд 8

Для организации данных могут использоваться следующие группы методов:
представление линейным списком с последовательным

Для организации данных могут использоваться следующие группы методов: представление линейным списком с
распределением памяти (адресная арифметика, левосписковые структуры);
представление связными линейными списками (методы, использующие указатели и справочники).
Операции манипулирования иерархически организованными данными :
поиск указанного экземпляра БД
переход от одного дерева к другому;
переход от одной записи к другой внутри дерева (например, к следующей записи типа Сотрудники);
вставка новой записи в указанную позицию;
удаление текущей записи и т. д.

Правило контроля целостности:
потомок не может существовать без родителя,
а у некоторых родителей может не быть потомков.

Слайд 9

Достоинства иерархической модели :
эффективное использование памяти ЭВМ ;
неплохие показатели времени выполнения

Достоинства иерархической модели : эффективное использование памяти ЭВМ ; неплохие показатели времени
основных операций над данными;
модель удобна для работы с иерархически упорядоченной информацией.
Недостатком является:
громоздкость для обработки информации с достаточно сложными логическими связями;
сложность понимания для обычного пользователя.

Примеры: IMS, PC/Focus, Ока, ИНЭС и МИРИС.

Слайд 10

Сетевая модель

Если в модели каждый порожденный элемент может иметь более одного

Сетевая модель Если в модели каждый порожденный элемент может иметь более одного
исходного, то такая модель называется сетевой

Слайд 11

Для описания схемы сетевой БД используется две группы типов: «запись» и «связь».

Для описания схемы сетевой БД используется две группы типов: «запись» и «связь».

Тип «связь» определяется для двух типов «запись»: предка и потомка.
Переменные типа «связь» являются экземплярами связей.

Слайд 12

Операции манипулирования данными :
поиск записи в БД;
переход от предка к первому потомку;
переход

Операции манипулирования данными : поиск записи в БД; переход от предка к
от потомка к предку;
создание новой записи;
удаление текущей записи;
обновление текущей записи;
включение записи в связь;
исключение записи из связи;
изменение связей и т. д.

Слайд 13

Достоинством сетевой модели данных является:
возможность эффективной реализации по показателям затрат памяти

Достоинством сетевой модели данных является: возможность эффективной реализации по показателям затрат памяти
и оперативности
сетевая модель предоставляет большие возможности в смысле допустимости образования произвольных связей (в сравнении с иерархической моделью)
Недостатком сетевой модели данных является:
высокая сложность и жесткость схемы БД, построенной на ее основе;
сложность для понимания и выполнения обработки информации в БД обычным пользователем;
ослаблен контроль целостности связей вследствие допустимости установления произвольных связей между записями.

Сетевые СУБД: IDMS, db_Vista III, СЕТЬ, СЕТОР и КОМПАС

Слайд 14

Реляционная модель данных

Реляционная модель данных

Слайд 15

Операции работы с данными: объединение, пересечение, разность, произведение, ограничение и соединение.
Таблица (отношение)

Операции работы с данными: объединение, пересечение, разность, произведение, ограничение и соединение. Таблица
имеет строки (записи) и столбцы (колонки).
Каждая строка таблицы имеет одинаковую структуру и состоит из полей.
Строкам таблицы соответствуют кортежи, а столбцам — атрибуты отношения.
Нормализация – это разбиение таблицы на две или более, обладающих лучшими свойствами при включении, изменении и удалении данных.
Цель – получение такого проекта базы данных, в котором в котором исключена избыточность информации.

Слайд 16

Пример реляционной базы (начальная таблица )

Пример реляционной базы (начальная таблица )

Слайд 17

I нормальная форма

II нормальная форма

I нормальная форма II нормальная форма

Слайд 18

III нормальная форма базы данных

III нормальная форма базы данных

Слайд 19

IV нормальная форма базы данных

IV нормальная форма базы данных

Слайд 20

Достоинства реляционной модели

Развитая теория реляционной модели данных.
Возможность сведения иерархической и сетевой модели

Достоинства реляционной модели Развитая теория реляционной модели данных. Возможность сведения иерархической и
данных к реляционному способу организации данных.
Поддержка механизмов ускоренного доступа к данным.
Возможность манипулирования данными без необходимости знания физической организации БД.
Наличие языка запросов к базе данных SQL.
Система берет на себя вопросы по эффективности доступа к данным, а также контроля за целостностью информации.

Слайд 21

Недостатки реляционной модели

Разработка программного обеспечения приходится проектировать свою задачу не в

Недостатки реляционной модели Разработка программного обеспечения приходится проектировать свою задачу не в
терминах ПрО (самой по себе достаточно сложной), а в терминах реляционных таблиц, что затрудняет процесс разработки.
НЕТ жесткой методики преобразования элементов ПрО в реляционные таблицы.
При сохранении информации объекты раскладываются на простые элементы, а затем при чтении – собирать заново (реляционная модель лишается одного из главных своих преимуществ – гибкости к изменению структуры БД).

Слайд 22

Объектно-ориентированная модель

ODMG-93 (Object Database Management Group)
Структура графически представима в виде дерева, узлами

Объектно-ориентированная модель ODMG-93 (Object Database Management Group) Структура графически представима в виде
которого являются объекты.
Свойства объектов описываются:
стандартным типом (string—строка символов )
типом конструируемым пользователем (class– объект, являющийся экземпляром соответствующего класса.
Каждый объект-экземпляр класса считается потомком объекта, в котором он определен как свойство.
Он принадлежит своему классу и имеет одного родителя.

Слайд 23

Объектно-ориентированная БД

Объектно-ориентированная БД

Слайд 24

Методы манипулирования данными:
применяются логические операции, усиленные механизмами инкапсуляции, наследования и полиморфизма

создание и

Методы манипулирования данными: применяются логические операции, усиленные механизмами инкапсуляции, наследования и полиморфизма
модификация БД сопровождается автоматическим формированием и последующей корректировкой индексов (индексных таблиц), содержащих информацию для быстрого поиска данных.

Слайд 25

Достоинство объектно-ориентированной
модели в сравнении с реляционной :
возможность отображения информации о

Достоинство объектно-ориентированной модели в сравнении с реляционной : возможность отображения информации о
сложных взаимосвязях объектов;
позволяет идентифицировать отдельную запись базы данных и определять функции их обработки.
Недостатками
высокая понятийная сложность;
неудобство обработки данных и низкая скорость выполнения запросов.

Слайд 26

Объектно-реляционный подход (ORM – Object Relation Mapping

Отличие между объектно-ориентированными и объектно-реляционными БД

Объектно-реляционный подход (ORM – Object Relation Mapping Отличие между объектно-ориентированными и объектно-реляционными
заключается в том, что при введении объекта в качестве атрибута другого объекта в объектно-реляционных БД сохраняется не сам объект, а ссылка на него.

Слайд 27

Структура хранилища данных
Свойства хранилищ данных
Область применения хранилищ данных
Data Mining – технология аналитической

Структура хранилища данных Свойства хранилищ данных Область применения хранилищ данных Data Mining
обработки данных
Системы поддержки принятия решений(СППР)

Хранилища данных

Слайд 28

Хранилище данных (ХД) — это предметно-ориентированное, интегрированное, привязанное ко времени и неизменяемое

Хранилище данных (ХД) — это предметно-ориентированное, интегрированное, привязанное ко времени и неизменяемое
собрание данных для поддержки процесса принятия управляющих решений.

Хранилище данных (ХД) — представляет собой банк данных определенной структуры, содержащий информацию в историческом контексте.

Слайд 29

Структура гиперкуба
Измерение — это множество, образующее одну из граней гиперкуба.
Значение — данные,

Структура гиперкуба Измерение — это множество, образующее одну из граней гиперкуба. Значение
которые подвергаются анализу в ячейках куба

Слайд 30

Сечение – формируется подмножество гиперкуба, в котором значение одного или более измерений

Сечение – формируется подмножество гиперкуба, в котором значение одного или более измерений
фиксиро-вано.

Вращение – изменение порядка представления измерения
(применяется к двухмерным таблицам).

Свертка – группирование(объединение) данных в каком-либо измерении.

Детализация – переход от обобщенных к детализированным данным (операция, обратная свертке).

Основные операции над гиперкубом:

Слайд 31

ХД в зависимости от размера делятся :
Малые (до 106 ячеек данных)
Средние

ХД в зависимости от размера делятся : Малые (до 106 ячеек данных)
(до 108)
Крупные (~ 108)
Сверхбольшие (~ 109)
Подходы к построению ХД:
Многомерная модель хранилища (MOLAP).
Реляционная (ROLAP).
Гибридная (HOLAP).

Слайд 32

MOLAP
Используют при небольшой базе данных и стабильном наборе измерений. Преимущество: быстрое

MOLAP Используют при небольшой базе данных и стабильном наборе измерений. Преимущество: быстрое
чтение и поиск данных
Недостатки : нерациональное использование памяти (все измерения и все аргументы функции хранятся в многомерном виде, много пустых ячеек).
ROLAP
Преимущество — база данных может быть большой.
Недостаток — медленное выполнение аналитических запросов.
HOLAP
Основные данные хранятся в реляционной базе, а агрегированные — в многомерной структуре (кубе).

Слайд 33

Основные свойства хранилищ данных:
Ориентация на ПрО:
данные в хранилище организованы вокруг существенных

Основные свойства хранилищ данных: Ориентация на ПрО: данные в хранилище организованы вокруг
аспектов прикладной деятельности;
Интегрированность:
информация в хранилище должна интегрироваться в целостную структуру, обеспечивающую возможности анализа данных;
Агрегированность.
Чтобы при выполнении аналитических запросов избежать выполнения операций группирования, данные должны обобщаться (агрегироваться) при загрузке хранилища;

Слайд 34

Поддержка хронологии:
хранилище можно рассматривать как набор моментальных снимков состояния данных так,

Поддержка хронологии: хранилище можно рассматривать как набор моментальных снимков состояния данных так,
что атрибут времени всегда явно присутствует в структурах данных хранилища;
Неизменяемость:
данные после загрузки в ХД остаются неизменными, внесения каких-либо изменений, кроме добавления записей, не разрешается.

Слайд 35

Область применения хранилищ данных
для своевременного обеспечения аналитиков всей информацией, необходимой для выработки

Область применения хранилищ данных для своевременного обеспечения аналитиков всей информацией, необходимой для
решений;
для создания единой модели данных организации;
для создания интегрированного источника данных, предоставляющего удобный доступ к разнородной информации (единый «источник истины»).

Слайд 36

Схема взаимодействия хранилища данных с клиентскими приложениями

Схема взаимодействия хранилища данных с клиентскими приложениями

Слайд 37

Data Mining – это технология выявления скрытых (ранее неизвестных) взаимосвязей внутри больших

Data Mining – это технология выявления скрытых (ранее неизвестных) взаимосвязей внутри больших
объемов данных.
Data Mining выполняет следующие виды анализа:
классификация;
регрессионный анализ;
прогнозирование временных последователь-ностей (рядов);
кластеризация;
выявление ассоциаций и последовательностей.

Слайд 38

Системы поддержки принятия решений(СППР)

СППР – являются человеко-машинными объектами, которые позволяют лицам, принимающим

Системы поддержки принятия решений(СППР) СППР – являются человеко-машинными объектами, которые позволяют лицам,
решения (ЛПР), использовать данные, знания, объективные и субъективные модели для анализа и решения слабоструктурированных и неструктурированных проблем.
СППР – это компьютерная система, позволяющая ЛПР сочетать собственные субъективные предпочтения с компьютерным анализом ситуации при выработке рекомендаций в процессе принятия решения.

Слайд 39

Функции СППР :
помощь ЛПР при анализе обстановки (ситуации) и ограничений, накладываемых

Функции СППР : помощь ЛПР при анализе обстановки (ситуации) и ограничений, накладываемых
внешней средой;
выявление предпочтений ЛПР или выявление и ранжирование приоритетов, учет неопределенности в оценках ЛПР и формирование его предпочтений;
генерацию возможных решений ,т.е. формирование списка альтернатив;
оценку возможных альтернатив, исходя из предпочтений ЛПР и ограничений, накладываемых внешней средой;
моделирование принимаемых решений (когда это возможно);
компьютерный анализ последствий принимаемых решений;
сбор данных о результатах реализации принятых решений и выбор лучшего результата.

Слайд 40

Выработка решений в этих системах происходит в результате итерационного процесса, в котором

Выработка решений в этих системах происходит в результате итерационного процесса, в котором
участвуют:
система ППР в роли вычислительного звена;
человек как управляющее звено, задающее исходную информацию и оценивающее полученный результат.

Слайд 41

Основные компоненты информационной технологии поддержки принятия решений

Основные компоненты информационной технологии поддержки принятия решений
Имя файла: Информационные-системы-обработки-данных.pptx
Количество просмотров: 48
Количество скачиваний: 0