Содержание
- 2. У 70-х роках минулого століття широко застосовувалася практика, коли компанії наймали аналітиків з бізнесу, котрі, використовуючи
- 3. Слід зауважити, що протягом багатьох років компанії проводили статистичні дослідження своїх даних. Коли статистик аналізує дані,
- 4. За останні роки надзвичайно зріс інтерес до дейтамайнінгу з боку ділових користувачів, котрі вирішили скористатися перевагами
- 5. Менеджери з інформаційних технологій, що мають завдання підібрати відповідну СППР, часто безпосередньо зустрічаються зі складними питаннями
- 6. Дейтамайнінг (Data mining) — це тип аналітичних додатків які підтримують рішення, розшукуючи за прихованими шаблонами (patterns)
- 7. Добування даних — це процес фільтрування великих обсягів даних для того, щоб підбирати відповідну до контексту
- 8. Інструментальні засоби добування даних використовують різноманітні методи, включаючи доказову аргументацію (case-based reasoning), візуалізацію даних, нечіткі запити
- 9. Дейтамайнінг як процес виявлення в загальних масивах даних раніше невідомих, нетривіальних, практично корисних і доступних для
- 10. Інтеграція OLAP-технологій та ІАД Оперативна аналітична обробка та інтелектуальний аналіз даних - дві складові частини процесу
- 11. Вчений K. Parsaye вводить складений термін "OLAP Data Mining" (багатовимірний інтелектуальний аналіз) для позначення такого об'єднання
- 13. Дуже часто виникає питання про різницю між засобами інтелектуального аналізу і OLAP-системами (On-Line Analytical Processing) -
- 14. Приклади формулювань задач при використанні методів OLAP і Data Mining OLAPData Mining Які середні показники травматизму
- 15. Data Mining і сховища даних Для успішного проведення всього процесу знаходження нових знань необхідною умовою є
- 17. Скачать презентацию
Слайд 2У 70-х роках минулого століття широко застосовувалася практика, коли компанії наймали аналітиків
У 70-х роках минулого століття широко застосовувалася практика, коли компанії наймали аналітиків
Поняття Data Mining
Слайд 3
Слід зауважити, що протягом багатьох років компанії проводили статистичні дослідження своїх
Слід зауважити, що протягом багатьох років компанії проводили статистичні дослідження своїх
Слайд 4
За останні роки надзвичайно зріс інтерес до дейтамайнінгу з боку ділових
За останні роки надзвичайно зріс інтерес до дейтамайнінгу з боку ділових
Слайд 5
Менеджери з інформаційних технологій, що мають завдання підібрати відповідну СППР, часто
Менеджери з інформаційних технологій, що мають завдання підібрати відповідну СППР, часто
Слайд 6
Дейтамайнінг (Data mining) — це тип аналітичних додатків які підтримують
Дейтамайнінг (Data mining) — це тип аналітичних додатків які підтримують
Англомовний термін «Data mining» часто перекладається як «добування даних»; «добування знань»; «добування інформації»; «аналіз, інтерпретація і подання інформації зі сховища даних»; «вибирання інформації із масиву даних». У даній книзі буде використовуватися як основний термін «дейтамайнінг» — україномовна транскрипція початково запровадженого і однозначно вживаного в англомовній літературі терміна «Data mining».
Слайд 7
Добування даних — це процес фільтрування великих обсягів даних для того,
Добування даних — це процес фільтрування великих обсягів даних для того,
Слайд 8
Інструментальні засоби добування даних використовують різноманітні методи, включаючи доказову аргументацію (case-based
Інструментальні засоби добування даних використовують різноманітні методи, включаючи доказову аргументацію (case-based
Слайд 9
Дейтамайнінг як процес виявлення в загальних масивах даних раніше невідомих,
Дейтамайнінг як процес виявлення в загальних масивах даних раніше невідомих,
Дейтамайнінг являє собою велику цінність для керівників і аналітиків у їх повсякденній діяльності. Ділові люди"усвідомили, що за допомогою методів ДМ вони можуть отримати відчутні переваги в конкурентній боротьбі.
Слайд 10Інтеграція OLAP-технологій та ІАД
Оперативна аналітична обробка та інтелектуальний аналіз даних - дві
Інтеграція OLAP-технологій та ІАД
Оперативна аналітична обробка та інтелектуальний аналіз даних - дві
Слайд 11
Вчений K. Parsaye вводить складений термін "OLAP Data Mining" (багатовимірний інтелектуальний
Вчений K. Parsaye вводить складений термін "OLAP Data Mining" (багатовимірний інтелектуальний
"Cubing then mining". Можливість виконання інтелектуального аналізу повинна забезпечуватися над будь-яким результатом запиту до багатовимірного концептуального уявлення, тобто над будь-яким фрагментом будь-якої проекції гіперкуба показників.
"Mining then cubing". Подібно даним, витягнутим з сховища, результати інтелектуального аналізу повинні представлятися в гіперкубічній формі для подальшого багатовимірного аналізу.
"Cubing while mining". Цей гнучкий спосіб інтеграції дозволяє автоматично активізувати однотипні механізми інтелектуальної обробки над результатом кожного кроку багатовимірного аналізу (переходу між рівнями узагальнення, витягання нового фрагмента гіперкуба і т. д.).
На жаль, дуже небагато виробників надають сьогодні достатньо могутні засоби інтелектуального аналізу багатовимірних даних в рамках систем OLAP. Проблема також полягає в тому, що деякі методи ІАД (байєсівські мережі, метод найближчого сусіда) непридатні для завдань багатовимірного інтелектуального аналізу, оскільки засновані на визначенні схожості деталізованих прикладів і не здатні працювати з агрегованими даними .
Слайд 13
Дуже часто виникає питання про різницю між засобами інтелектуального аналізу і
Дуже часто виникає питання про різницю між засобами інтелектуального аналізу і
OLAP - це частина технологій, скерованих на підтримку прийняття рішення. Звичайні засоби формування запитів і звітів описують саму базу даних. Технологія OLAP використовується для відповіді на задані питання. При цьому користувач сам формує гіпотезу про дані чи відношення між даними і після цього використовує серію запитів до бази даних для підтвердження чи відхилення цих гіпотез. Засоби Data Mining відрізняються від засобів OLAP тим, що замість перевірки передбачуваних взаємозалежностей, вони на основі наявних даних можуть будувати моделі, що дозволяють кількісно оцінити ступінь впливу досліджуваних факторів. Крім того, засоби інтелектуального аналізу дозволяють робити нові гіпотези про характер невідомих, але реально існуючих відношень у даних.
Сучасні технології інтелектуального аналізу опрацьовують інформацію з метою автоматичного пошуку шаблонів, характерних для яких-небудь фрагментів неоднорідних багатомірних даних. На відміну від оперативної аналітичної обробки даних у Data Mining тягар формулювання гіпотез і виявлення незвичайних шаблонів перекладено з людини на комп'ютер.
Слайд 14
Приклади формулювань задач при використанні методів OLAP і Data Mining
OLAPData
Приклади формулювань задач при використанні методів OLAP і Data Mining
OLAPData
Слайд 15Data Mining і сховища даних
Для успішного проведення всього процесу знаходження нових
Data Mining і сховища даних
Для успішного проведення всього процесу знаходження нових
Отже, сховище даних - це предметно-орієнтований, інтегрований, прив'язаний до часу, незмінний збір даних для підтримки процесу прийняття управлінських рішень. Предметна орієнтація означає, що дані об'єднані в категорії і зберігаються відповідно до тих областей, що вони описують, а не до їх застосувань. Інтегрованість означає, що дані задовольняють вимогам усього підприємства (у його розвитку), а не єдиної функції бізнесу. Тим самим сховище даних гарантує, що однакові звіти, згенеровані для різних аналітиків, будуть містити однакові результати.