Информационные системы обработки данных

Март 14, 2021

Главная
Информатика
Информационные системы обработки данных

Содержание

2. Системы управления базами данных Система управления базами данных (СУБД) — это комплекс программных средств, предназначенный для
3. В основе любой БД лежит модель данных , включающая в себя: множество формальных объектов, с помощью
4. По типу используемой модели можно выделить базы данных : Иерархическая Сетевая Реляционная В последние годы активно
5. Иерархическая модель данных Если в модели каждый порожденный элемент имеет не более одного исходного, то такая
6. Иерархическая модель данных Тип данных «дерево»(составной из подтипов, каждый из которых является, в свою очередь, типом
7. Иерархическая БД представляет собой иерархически организованный набор типов «запись»
8. Для организации данных могут использоваться следующие группы методов: представление линейным списком с последовательным распределением памяти (адресная
9. Достоинства иерархической модели : эффективное использование памяти ЭВМ ; неплохие показатели времени выполнения основных операций над
10. Сетевая модель Если в модели каждый порожденный элемент может иметь более одного исходного, то такая модель
11. Для описания схемы сетевой БД используется две группы типов: «запись» и «связь». Тип «связь» определяется для
12. Операции манипулирования данными : поиск записи в БД; переход от предка к первому потомку; переход от
13. Достоинством сетевой модели данных является: возможность эффективной реализации по показателям затрат памяти и оперативности сетевая модель
14. Реляционная модель данных
15. Операции работы с данными: объединение, пересечение, разность, произведение, ограничение и соединение. Таблица (отношение) имеет строки (записи)
16. Пример реляционной базы (начальная таблица )
17. I нормальная форма II нормальная форма
18. III нормальная форма базы данных
19. IV нормальная форма базы данных
20. Достоинства реляционной модели Развитая теория реляционной модели данных. Возможность сведения иерархической и сетевой модели данных к
21. Недостатки реляционной модели Разработка программного обеспечения приходится проектировать свою задачу не в терминах ПрО (самой по
22. Объектно-ориентированная модель ODMG-93 (Object Database Management Group) Структура графически представима в виде дерева, узлами которого являются
23. Объектно-ориентированная БД
24. Методы манипулирования данными: применяются логические операции, усиленные механизмами инкапсуляции, наследования и полиморфизма создание и модификация БД
25. Достоинство объектно-ориентированной модели в сравнении с реляционной : возможность отображения информации о сложных взаимосвязях объектов; позволяет
26. Объектно-реляционный подход (ORM – Object Relation Mapping Отличие между объектно-ориентированными и объектно-реляционными БД заключается в том,
27. Структура хранилища данных Свойства хранилищ данных Область применения хранилищ данных Data Mining – технология аналитической обработки
28. Хранилище данных (ХД) — это предметно-ориентированное, интегрированное, привязанное ко времени и неизменяемое собрание данных для поддержки
29. Структура гиперкуба Измерение — это множество, образующее одну из граней гиперкуба. Значение — данные, которые подвергаются
30. Сечение – формируется подмножество гиперкуба, в котором значение одного или более измерений фиксиро-вано. Вращение – изменение
31. ХД в зависимости от размера делятся : Малые (до 106 ячеек данных) Средние (до 108) Крупные
32. MOLAP Используют при небольшой базе данных и стабильном наборе измерений. Преимущество: быстрое чтение и поиск данных
33. Основные свойства хранилищ данных: Ориентация на ПрО: данные в хранилище организованы вокруг существенных аспектов прикладной деятельности;
34. Поддержка хронологии: хранилище можно рассматривать как набор моментальных снимков состояния данных так, что атрибут времени всегда
35. Область применения хранилищ данных для своевременного обеспечения аналитиков всей информацией, необходимой для выработки решений; для создания
36. Схема взаимодействия хранилища данных с клиентскими приложениями
37. Data Mining – это технология выявления скрытых (ранее неизвестных) взаимосвязей внутри больших объемов данных. Data Mining
38. Системы поддержки принятия решений(СППР) СППР – являются человеко-машинными объектами, которые позволяют лицам, принимающим решения (ЛПР), использовать
39. Функции СППР : помощь ЛПР при анализе обстановки (ситуации) и ограничений, накладываемых внешней средой; выявление предпочтений
40. Выработка решений в этих системах происходит в результате итерационного процесса, в котором участвуют: система ППР в
41. Основные компоненты информационной технологии поддержки принятия решений
43. Скачать презентацию

Слайд 2

Системы управления базами данных
Система управления базами данных (СУБД) — это комплекс программных

средств, предназначенный для создания, ведения и совместного использования БД многими пользователями.
База данных (БД) представляет собой совокупность специальным образом организованных данных, хранимых в памяти вычислительной системы и отображающих состояние объектов и их взаимосвязей в рассматриваемой предметной области.

Слайд 3

В основе любой БД лежит модель данных , включающая в себя:
множество формальных

объектов, с помощью которых описывается данная ПрО (предметная область);
набор операций для манипулирования объектами модели;
методологии, позволяющие получить формальное описание из реальной ситуации и наоборот (описание ситуации на естественном языке из некоторого формального представления).
способы задания ограничений целостности (набор условий, предназначенный для выявления ошибки при описании модели данных).

Слайд 4

По типу используемой модели можно выделить базы данных :
Иерархическая
Сетевая
Реляционная
В последние годы активно

внедряются :
Объектно-ориентированные
Объектно-реляционные

Модель представления данных - логическая структура хранимых в базе данных.

Слайд 5

Иерархическая модель данных
Если в модели каждый порожденный элемент имеет не более одного

исходного, то такая модель называется иерархической.

Слайд 6

Иерархическая модель данных
Тип данных «дерево»(составной из подтипов, каждый из которых является, в

свою очередь, типом «дерево»).
Корневым называется тип, который имеет подчиненные типы и сам не является подтипом.
Подчиненный тип (подтип) является потомком по отношению к типу, который выступает в роли предка (родителя).
Близнецы – потомки одного и того же типа.

Слайд 7

Иерархическая БД представляет собой иерархически организованный набор типов «запись»

Слайд 8

Для организации данных могут использоваться следующие группы методов:
представление линейным списком с последовательным

распределением памяти (адресная арифметика, левосписковые структуры);
представление связными линейными списками (методы, использующие указатели и справочники).
Операции манипулирования иерархически организованными данными :
поиск указанного экземпляра БД
переход от одного дерева к другому;
переход от одной записи к другой внутри дерева (например, к следующей записи типа Сотрудники);
вставка новой записи в указанную позицию;
удаление текущей записи и т. д.

Правило контроля целостности:
потомок не может существовать без родителя,
а у некоторых родителей может не быть потомков.

Слайд 9

Достоинства иерархической модели :
эффективное использование памяти ЭВМ ;
неплохие показатели времени выполнения

основных операций над данными;
модель удобна для работы с иерархически упорядоченной информацией.
Недостатком является:
громоздкость для обработки информации с достаточно сложными логическими связями;
сложность понимания для обычного пользователя.

Примеры: IMS, PC/Focus, Ока, ИНЭС и МИРИС.

Слайд 10

Сетевая модель
Если в модели каждый порожденный элемент может иметь более одного

исходного, то такая модель называется сетевой

Слайд 11

Для описания схемы сетевой БД используется две группы типов: «запись» и «связь».

Тип «связь» определяется для двух типов «запись»: предка и потомка.
Переменные типа «связь» являются экземплярами связей.

Слайд 12

Операции манипулирования данными :
поиск записи в БД;
переход от предка к первому потомку;
переход

от потомка к предку;
создание новой записи;
удаление текущей записи;
обновление текущей записи;
включение записи в связь;
исключение записи из связи;
изменение связей и т. д.

Слайд 13

Достоинством сетевой модели данных является:
возможность эффективной реализации по показателям затрат памяти

и оперативности
сетевая модель предоставляет большие возможности в смысле допустимости образования произвольных связей (в сравнении с иерархической моделью)
Недостатком сетевой модели данных является:
высокая сложность и жесткость схемы БД, построенной на ее основе;
сложность для понимания и выполнения обработки информации в БД обычным пользователем;
ослаблен контроль целостности связей вследствие допустимости установления произвольных связей между записями.

Сетевые СУБД: IDMS, db_Vista III, СЕТЬ, СЕТОР и КОМПАС

Слайд 14

Реляционная модель данных

Слайд 15

Операции работы с данными: объединение, пересечение, разность, произведение, ограничение и соединение.
Таблица (отношение)

имеет строки (записи) и столбцы (колонки).
Каждая строка таблицы имеет одинаковую структуру и состоит из полей.
Строкам таблицы соответствуют кортежи, а столбцам — атрибуты отношения.
Нормализация – это разбиение таблицы на две или более, обладающих лучшими свойствами при включении, изменении и удалении данных.
Цель – получение такого проекта базы данных, в котором в котором исключена избыточность информации.

Слайд 16

Пример реляционной базы (начальная таблица )

Слайд 17

I нормальная форма
II нормальная форма

Слайд 18

III нормальная форма базы данных

Слайд 19

IV нормальная форма базы данных

Слайд 20

Достоинства реляционной модели
Развитая теория реляционной модели данных.
Возможность сведения иерархической и сетевой модели

данных к реляционному способу организации данных.
Поддержка механизмов ускоренного доступа к данным.
Возможность манипулирования данными без необходимости знания физической организации БД.
Наличие языка запросов к базе данных SQL.
Система берет на себя вопросы по эффективности доступа к данным, а также контроля за целостностью информации.

Слайд 21

Недостатки реляционной модели
Разработка программного обеспечения приходится проектировать свою задачу не в

терминах ПрО (самой по себе достаточно сложной), а в терминах реляционных таблиц, что затрудняет процесс разработки.
НЕТ жесткой методики преобразования элементов ПрО в реляционные таблицы.
При сохранении информации объекты раскладываются на простые элементы, а затем при чтении – собирать заново (реляционная модель лишается одного из главных своих преимуществ – гибкости к изменению структуры БД).

Слайд 22

Объектно-ориентированная модель
ODMG-93 (Object Database Management Group)
Структура графически представима в виде дерева, узлами

которого являются объекты.
Свойства объектов описываются:
стандартным типом (string—строка символов )
типом конструируемым пользователем (class– объект, являющийся экземпляром соответствующего класса.
Каждый объект-экземпляр класса считается потомком объекта, в котором он определен как свойство.
Он принадлежит своему классу и имеет одного родителя.

Слайд 23

Объектно-ориентированная БД

Слайд 24

Методы манипулирования данными:
применяются логические операции, усиленные механизмами инкапсуляции, наследования и полиморфизма
создание и

модификация БД сопровождается автоматическим формированием и последующей корректировкой индексов (индексных таблиц), содержащих информацию для быстрого поиска данных.

Слайд 25

Достоинство объектно-ориентированной
модели в сравнении с реляционной :
возможность отображения информации о

сложных взаимосвязях объектов;
позволяет идентифицировать отдельную запись базы данных и определять функции их обработки.
Недостатками
высокая понятийная сложность;
неудобство обработки данных и низкая скорость выполнения запросов.

Слайд 26

Объектно-реляционный подход (ORM – Object Relation Mapping
Отличие между объектно-ориентированными и объектно-реляционными БД

заключается в том, что при введении объекта в качестве атрибута другого объекта в объектно-реляционных БД сохраняется не сам объект, а ссылка на него.

Слайд 27

Структура хранилища данных
Свойства хранилищ данных
Область применения хранилищ данных
Data Mining – технология аналитической

обработки данных
Системы поддержки принятия решений(СППР)

Хранилища данных

Слайд 28

Хранилище данных (ХД) — это предметно-ориентированное, интегрированное, привязанное ко времени и неизменяемое

собрание данных для поддержки процесса принятия управляющих решений.

Хранилище данных (ХД) — представляет собой банк данных определенной структуры, содержащий информацию в историческом контексте.

Слайд 29

Структура гиперкуба
Измерение — это множество, образующее одну из граней гиперкуба.
Значение — данные,

которые подвергаются анализу в ячейках куба

Слайд 30

Сечение – формируется подмножество гиперкуба, в котором значение одного или более измерений

фиксиро-вано.

Вращение – изменение порядка представления измерения
(применяется к двухмерным таблицам).

Свертка – группирование(объединение) данных в каком-либо измерении.

Детализация – переход от обобщенных к детализированным данным (операция, обратная свертке).

Основные операции над гиперкубом:

Слайд 31

ХД в зависимости от размера делятся :
Малые (до 106 ячеек данных)
Средние

(до 108)
Крупные (~ 108)
Сверхбольшие (~ 109)
Подходы к построению ХД:
Многомерная модель хранилища (MOLAP).
Реляционная (ROLAP).
Гибридная (HOLAP).

Слайд 32

MOLAP
Используют при небольшой базе данных и стабильном наборе измерений. Преимущество: быстрое

чтение и поиск данных
Недостатки : нерациональное использование памяти (все измерения и все аргументы функции хранятся в многомерном виде, много пустых ячеек).
ROLAP
Преимущество — база данных может быть большой.
Недостаток — медленное выполнение аналитических запросов.
HOLAP
Основные данные хранятся в реляционной базе, а агрегированные — в многомерной структуре (кубе).

Слайд 33

Основные свойства хранилищ данных:
Ориентация на ПрО:
данные в хранилище организованы вокруг существенных

аспектов прикладной деятельности;
Интегрированность:
информация в хранилище должна интегрироваться в целостную структуру, обеспечивающую возможности анализа данных;
Агрегированность.
Чтобы при выполнении аналитических запросов избежать выполнения операций группирования, данные должны обобщаться (агрегироваться) при загрузке хранилища;

Слайд 34

Поддержка хронологии:
хранилище можно рассматривать как набор моментальных снимков состояния данных так,

что атрибут времени всегда явно присутствует в структурах данных хранилища;
Неизменяемость:
данные после загрузки в ХД остаются неизменными, внесения каких-либо изменений, кроме добавления записей, не разрешается.

Слайд 35

Область применения хранилищ данных
для своевременного обеспечения аналитиков всей информацией, необходимой для выработки

решений;
для создания единой модели данных организации;
для создания интегрированного источника данных, предоставляющего удобный доступ к разнородной информации (единый «источник истины»).

Слайд 36

Схема взаимодействия хранилища данных с клиентскими приложениями

Слайд 37

Data Mining – это технология выявления скрытых (ранее неизвестных) взаимосвязей внутри больших

объемов данных.
Data Mining выполняет следующие виды анализа:
классификация;
регрессионный анализ;
прогнозирование временных последователь-ностей (рядов);
кластеризация;
выявление ассоциаций и последовательностей.

Слайд 38

Системы поддержки принятия решений(СППР)
СППР – являются человеко-машинными объектами, которые позволяют лицам, принимающим

решения (ЛПР), использовать данные, знания, объективные и субъективные модели для анализа и решения слабоструктурированных и неструктурированных проблем.
СППР – это компьютерная система, позволяющая ЛПР сочетать собственные субъективные предпочтения с компьютерным анализом ситуации при выработке рекомендаций в процессе принятия решения.

Слайд 39

Функции СППР :
помощь ЛПР при анализе обстановки (ситуации) и ограничений, накладываемых

внешней средой;
выявление предпочтений ЛПР или выявление и ранжирование приоритетов, учет неопределенности в оценках ЛПР и формирование его предпочтений;
генерацию возможных решений ,т.е. формирование списка альтернатив;
оценку возможных альтернатив, исходя из предпочтений ЛПР и ограничений, накладываемых внешней средой;
моделирование принимаемых решений (когда это возможно);
компьютерный анализ последствий принимаемых решений;
сбор данных о результатах реализации принятых решений и выбор лучшего результата.

Слайд 40

Выработка решений в этих системах происходит в результате итерационного процесса, в котором

участвуют:
система ППР в роли вычислительного звена;
человек как управляющее звено, задающее исходную информацию и оценивающее полученный результат.

Информационные системы обработки данных

Содержание

Системы управления базами данных Система управления базами данных (СУБД) — это комплекс программных

В основе любой БД лежит модель данных , включающая в себя: множество формальных

По типу используемой модели можно выделить базы данных :ИерархическаяСетеваяРеляционнаяВ последние годы активно

Иерархическая модель данных Если в модели каждый порожденный элемент имеет не более одного

Иерархическая модель данныхТип данных «дерево»(составной из подтипов, каждый из которых является, в

Иерархическая БД представляет собой иерархически организованный набор типов «запись»

Для организации данных могут использоваться следующие группы методов:представление линейным списком с последовательным

Достоинства иерархической модели :эффективное использование памяти ЭВМ ; неплохие показатели времени выполнения

Сетевая модель Если в модели каждый порожденный элемент может иметь более одного

Для описания схемы сетевой БД используется две группы типов: «запись» и «связь».

Операции манипулирования данными :поиск записи в БД;переход от предка к первому потомку;переход

Достоинством сетевой модели данных является: возможность эффективной реализации по показателям затрат памяти

Реляционная модель данных

Операции работы с данными: объединение, пересечение, разность, произведение, ограничение и соединение.Таблица (отношение)

Пример реляционной базы (начальная таблица )

I нормальная формаII нормальная форма

III нормальная форма базы данных

IV нормальная форма базы данных

Достоинства реляционной моделиРазвитая теория реляционной модели данных.Возможность сведения иерархической и сетевой модели

Недостатки реляционной модели Разработка программного обеспечения приходится проектировать свою задачу не в

Объектно-ориентированная модельODMG-93 (Object Database Management Group)Структура графически представима в виде дерева, узлами