Содержание
- 2. Задачи OLTP-системы – это быстрый сбор и оптимальное размещение данных в БД, а также обеспечение их
- 3. Традиционный процесс принятия решений в российской компании, использующей информационную систему, построенную на OLTP-технологии: Менеджер дает задание
- 4. Недостатки такой схемы принятия решений: используется малое количество данных; процесс занимает длительное время; требуется повторение цикла
- 5. Выход из этой ситуации – исходная информация должна быть доступна ее непосредственному потребителю – аналитику (Билл
- 6. Основы OLAP OLAP – технологии интерактивной аналитической обработки данных в системах БД, предназначенные для поддержки принятия
- 7. В качестве источников данных часто используют хранилища данных. Обеспечивает многомерный анализ данных (с т. зр. их
- 8. OLAP (On-Line Analytical Processing) OLAP – это совокупность концепций, принципов и требований, лежащих в основе программных
- 9. Итак, аналитику нужно много данных, эти данные являются выборочными, а также носят характер «набор атрибутов –
- 10. В общем случае куб может быть многомерным (~ до 20 измерений) – «система координат» В принципе,
- 11. Измерения OLAP-кубов (например: страна, товар, год) состоят из т.н. меток или членов (members). Например: измерение "Страна"
- 12. Куб сам по себе не пригоден для восприятия и анализа человеком (нельзя адекватно представить более 3-х
- 13. Данные в таблице не являются первичными, а получены в результате агрегирования более мелких элементов: Год =>
- 14. Такие многоуровневые объединения значений атрибутов-измерений называется иерархиями Пример иерархии:
- 15. Исходные данные берутся из нижних уровней иерархий, а затем суммируются для получения значений более высоких уровней.
- 16. Средства OLAP позволяют значительно повысить эффективность работы аналитика с данными по сравнению с OLTP-системами. Аналитик непосредственно
- 17. Тест FASMI (требования к продуктам OLAP): Fast (Быстрый) - время доступа к аналитическим данным - порядка
- 18. Хранилища данных (Data Warehouse) Хранилище данных (ХД) и OLAP - две разные технологии. Однако, в комплексных
- 19. Понятие хранилища данных: Хранилище данных — система, содержащая непротиворечивую интегрированную предметно-ориентированную совокупность исторических данных крупной корпорации
- 20. Билл Инмон («отец» хранилищ данных): Хранилища данных - "предметно ориентированные, интегрированные, неизменчивые, поддерживающие хронологию наборы данных,
- 21. Предметная ориентация – данные объединены в категории и сохраняются соответственно областям, которые они описывают, а не
- 22. Привязка ко времени – хранилище можно рассматривать как совокупность "исторических" данных: возможно восстановление данных на любой
- 23. В дополнение к единому ХД могут создаваться т.н. витрины данных Витрина данных (Data Mart) – хранилище
- 24. Архитектура Хранилища данных
- 25. Хранилище данных (OLAP, Data Mining) OLTP DB сбор, очистка, загрузка OLTP DB OLTP DB Витрина данных
- 26. Контрольные вопросы: Сущность и назначение операции разрезания (slice) куба OLAP Сущность и назначение иерархий значений в
- 27. Data Mining Корпоративная БД любого современного предприятия обычно содержит набор таблиц, хранящих записи о тех или
- 28. Примеры сведений, которые могут быть получены на основе анализа больших объемов накопленных данных: как зависят продажи
- 29. Григорий Пиатецкий-Шапиро (один из основателей направления): Data Mining – это процесс обнаружения в сырых данных ранее
- 30. Неочевидных – найденные закономерности не обнаруживаются стандартными методами обработки информации или экспертным путем. Объективных – обнаруженные
- 31. Data Mining – это процесс, цель которого - обнаружить новые значимые корреляции, образцы и тенденции в
- 32. Сравнительные примеры вопросов:
- 33. Типы закономерностей, выявляемых методами Data Mining: Ассоциация — высокая вероятность связи событий друг с другом (например,
- 34. Классификация — имеются признаки, характеризующие группу, к которой принадлежит то или иное событие или объект Кластеризация
- 35. Методы исследования данных в Data Mining: регрессионный, дисперсионный и корреляционный анализ; нейросетевые алгоритмы; выбор близкого аналога
- 36. Хранилище данных (OLAP, Data Mining) OLTP DB сбор, очистка, загрузка OLTP DB OLTP DB Витрина данных
- 37. Агентство Gartner Group в 1980-х годах ввело термин "Business Intelligence" (BI) – деловой интеллект или бизнес-интеллект.
- 38. Понятие BI объединяет в себе различные средства и технологии анализа и обработки данных масштаба предприятия. На
- 39. По Gartner Group к системам Business Intelligence относятся программные продукты следующих классов: средства построения хранилищ данных
- 40. Экспертные системы (ЭС) Характеристика и назначение: Основная идея состоит в отчуждении и сохранении знаний и опыта
- 41. Экспертная система — компьютерная программа, способная заменить специалиста-эксперта в решении проблемной ситуации. Экспертная система — это
- 42. Экспертная система – компьютерная система, использующая знания одного или нескольких экспертов (представленные в некотором формальном виде),
- 43. Основные характеристики ЭС: Используют эвристические, субъективные знания экспертов в определенной ПрО. Знания отделены от данных. Предназначены
- 44. Решения ЭС обладают "прозрачностью", т.е. могут быть объяснены пользователю на качественном уровне (способны объяснить, как было
- 45. Преимущества ЭС перед человеком-экспертом: у них нет предубеждений и они устойчивы к различным помехам; они не
- 46. База знаний Интерфейс пользователя Подсистема логического вывода Подсистема объяснений Подсистема приобретения знаний База данных (раб. память)
- 47. База знаний (БЗ) предназначена для хранения экспертных знаний о ПрО, используемых при решении задач экспертной системой.
- 48. Организация БЗ на основе системы продукций (если…, то…): БЗ – совокупность правил («клише»), позволяющих на основе
- 49. База данных часто используется для временного хранения фактов или гипотез, являющихся промежуточными решениями или результатом общения
- 50. Интерфейс пользователя служит для ведения диалога с пользователем, в ходе которого ЭС запрашивает у пользователя необходимые
- 51. Подсистема приобретения знаний служит для корректировки и пополнения базы знаний. В простейшем случае это - интеллектуальный
- 52. Среди инструментальных средств для создания ЭС наиболее популярны такие языки программирования, как LISP и PROLOG, а
- 53. Основные классы задач, решаемых экспертными системами: диагностика, прогнозирование, идентификация, управление (в том числе - ТП), проектирование,
- 54. Области деятельности, где используются экспертные системы: медицина, вычислительная техника, военное дело, микроэлектроника, радиоэлектроника, юриспруденция, экономика, экология,
- 55. Примеры широко известных ЭС: DENDRAL – разработана в Стэндфордском ун-те в сер. 60-х годов для распознавания
- 56. MYCIN - разработана в Стэндфордском университете в середине 70-х годов для диагностики и лечения инфекционных заболеваний
- 57. Контрольные вопросы: Сущность и назначение Data Mining. Основные отличия Data Mining от OLAP. Сущность и назначение
- 58. Технологии управления знаниями Понятие «управление знаниями» (УЗ) появилось в середине 90-х годов в крупных корпорациях, для
- 59. «Управление знаниями» можно рассматривать и как новое направление в менеджменте, и как направление в информатике для
- 60. Двойственность понятия «управление знаниями»
- 61. Новизна концепции УЗ заключается в принципиально новой задаче – копить не только разрозненную информацию, бумаги, графики,
- 62. Понятие «знания» трактуется в УЗ очень широко. Под знаниями скорее понимаются информационно-знаниевые ресурсы. Знания м.б. явными
- 63. Ключ к УЗ - доставка нужных знаний нужным людям в нужное для эффективной реализации бизнес-процессов время.
- 64. Для преодоления перечисленных барьеров и достижения целей УЗ предназначены корпоративные системы управления знаниями (СУЗ), к-рые должны
- 65. широкий спектр средств (среду) для профессионального общения и обмена знаниями между специалистами, экспертами, командами, проектными группами
- 66. В СУЗ интегрируются разнообразные технологии: электронная почта и Интернет-ресурсы; системы управления базами данных (СУБД) и сами
- 67. СУЗ существенно отличается от ИС организации: Предназначение ИС – эффективное хранение, обработка и предоставление пользователям по
- 68. Ввиду относительной новизны проблематики, представления о структуре и составе элементов СУЗ не являются устоявшимся. По одной
- 69. Концептуальная архитектура системы SEAL
- 70. Модели представления знаний Существует множество обстоятельств, которые затрудняют распространение и обмен знаниями между людьми. Дело не
- 72. Например, много неструктурированных и полуструктурированных информационных источников доступно в сети Web и на различных корпоративных порталах,
- 73. Описанием знаний уже давно занимается дисциплина «Искусственный интеллект» (ИИ), (такие ее разделы, как «Представление знаний» и
- 74. Целью УЗ является организация эффективной работы со знаниями (повышение эффективности процессов преобразования знаний на предприятии, создание,
- 75. В настоящее время существуют и развиваются разные методы представления и описания знаний, такие, как: продукционные модели,
- 76. Продукционная модель или модель, основанная на правилах, позволяет представлять знания в виде предположения типа «if -
- 77. Семантическая сеть («смысловая» сеть) Семантика - это наука, устанавливающая отношения между символами и объектами, которые они
- 78. Следует различать понятия «Семантическая сеть» (англ. Semantic Network) и «Семантическая паутина» (англ. Semantic Web). Компьютерные семантические
- 79. Чаще всего в семантических сетях используются следующие отношения: Родо-видовое отношение (транспортное средство – автомобиль) Часть —
- 80. пространственные (далеко от, близко от, за, под, над…); временные (раньше, позже, в течение…); атрибутивные (иметь свойство,
- 81. СС, отражающая взаимоотношения между атрибутами птицы и самолета
- 82. Классификации семантических сетей (по Гавриловой) По количеству типов отношений: Однородные (с единственным типом отношений). Неоднородные (с
- 83. Семантическая паутина (Semantic Web) Концепция организации гипертекста напоминает однородную бинарную СС (страницы – узлы, а гиперссылки
- 84. Фрейм (от англ. frame - каркас, рамка) Это абстрактный образ для представления некоторого стереотипа восприятия. По
- 85. Модель фрейма является достаточно универсальной, поскольку позволяет отобразить все многообразие знаний о мире через: фреймы-структуры, использующиеся
- 86. В качестве значения слота может выступать имя другого фрейма, так образуются сети фреймов. Существует несколько способов
- 87. Важнейшим свойством теории фреймов является наследование свойств (из СС). Наследование происходит по АКО-связям (A-Kind-Of = это)
- 88. Онтология В последние десятилетия онтологии рассматриваются в качестве наиболее перспективной модели представления знаний Термин заимствован из
- 89. Онтология – это формальное, явное, точное определение (спецификация) совместно используемой концептуализации (Gruber T.A., 1995) Концептуализация –
- 90. Рабочее и более приближенное к УЗ определение [Гаврилова Т.А., Хорошевский]: Онтологии - это базы знаний специального
- 91. Формальная модель онтологии Под формальной моделью онтологии О будем понимать упорядоченную тройку вида: О = ,
- 92. Некоторые граничные случаи: Пусть R = Ø и F = Ø => онтология О трансформируется в
- 94. Скачать презентацию