Системы анализа больших данных (САБД)

Содержание

Слайд 2

Цель курса

/12

Цель изучения дисциплины «Системы анализа больших данных» направлена на:
формирование у обучающихся

Цель курса /12 Цель изучения дисциплины «Системы анализа больших данных» направлена на:
пониманий и знаний теоретических и практических аспектов и подходов к проектированию и реализации комплексных программных систем по анализу данных, а также проблем и подходов их решения, которые адресуются в системах анализа больших объемов данных.
подготовку квалифицированных выпускников, умеющих эффективно и качественно разрабатывать и внедрять программные комплексы и инструментальные средства по анализу и работе с информацией.
выработку навыков самостоятельного исследования и изучения технологий, систем, программных комплексов, архитектур, программных особенностей API в САБД
формирование умений реализации современных подходов, используемых при проектировании систем обработки больших данных

Слайд 3

/12

Структура курса

Курс состоит из двух частей:
теоретическая часть
подготовка материала и выступление перед

/12 Структура курса Курс состоит из двух частей: теоретическая часть подготовка материала
аудиторией по выбранной тематике
практическая часть
реализация современных подходов проектирования программного обеспечения, используемых в системах обработки больших данных

Слайд 4

Варианты тем для выступления (1)

Системы анализа больших данных:
! IBM Watson
!

Варианты тем для выступления (1) Системы анализа больших данных: ! IBM Watson
Виртуальный помощник IPSoft Amelia
! Когнитивные системы помощи клиентам (Чат боты, поддержка у Мегафон, и т.д.)
Semantext
Dell EMC Analytic Insights Module
Windows Azure HDInsight
Microsoft Azure Machine Learning
Pentaho Data Integration
Teradata Aster Analytics
SAP BusinessObjects Predictive Analytics
Oracle Big Data Preparation
другие

Используйте Google, сайты поставщиков, книги, статьи и форумы

Слайд 5

Варианты тем для выступления (2)

Базы данных:
Apache Hive
Cloudera Impala
Apache Presto
Apache Drill
Apache Cassandra
Redis
EMC Greenplum
другие

Варианты тем для выступления (2) Базы данных: Apache Hive Cloudera Impala Apache

Слайд 6

Варианты тем для выступления (3)

Аналитические платформы:
RapidMiner
IBM SPSS Modeler
KNIME
Qlik Analytics Platform
STATISTICA Data Miner
Informatica

Варианты тем для выступления (3) Аналитические платформы: RapidMiner IBM SPSS Modeler KNIME
Intelligent Data Platform
World Programming System
Deductor
SAS Enterprise Miner
другие

Слайд 7

Варианты тем для выступления (4)

Фреймворки:
Elasticsearch
Kibana
Apache Flink
Apache ZooKeeper
Apache Mesos
Apache Flume
другие
Аварийное восстановление ("disaster recovery")

Варианты тем для выступления (4) Фреймворки: Elasticsearch Kibana Apache Flink Apache ZooKeeper
программных систем после сбоев
! Обзор существующих подходов и методов
! Существующие программные системы, сравнительный анализ реализаций и ограничений

Слайд 8

Варианты тем для выступления (5)

Способы повышения безопасности работы с данными:
Способы обфускирования и

Варианты тем для выступления (5) Способы повышения безопасности работы с данными: Способы
обезличивания информации
Применение шифрования данных стандартными библиотеками: BouncyCastle, SafeNet Keysecure Gemalto и SunJCE
Использование безопасных соединений по протоколам HTTPS с использованием ключей шифрования для SSL/TLS (Two-way TLS)
Локализация распределенных программных систем анализа в выделенной, изолированной локальной сети. Подход применения Gateway для выхода из изолированной сети во внешний мир

Слайд 9

Варианты тем для выступления (6)

Экономические трудности применения облачных и кластерных систем анализа
Сравнительный

Варианты тем для выступления (6) Экономические трудности применения облачных и кластерных систем
анализ способов развертывания программных систем по экономическим показателям и функциональным возможностям на стороне заказчика "On-premises", в удаленном облаке, у сторонней организации предоставляющей необходимые сервисы и вычислительные мощности

Слайд 10

План выступления

20 минут на одно выступление
Обзор системы/технологии/инструмента
назначение
возможности
ограничения
Задачи, которые можно решить
Программная архитектура и

План выступления 20 минут на одно выступление Обзор системы/технологии/инструмента назначение возможности ограничения
основные модули системы
Пример использования
Обзор API

Слайд 11

Требования к выступлениям

Предварительная запись на выступление
староста делает табличку со списком групп и

Требования к выступлениям Предварительная запись на выступление староста делает табличку со списком
разлиновкой по неделям занятий в Google таблицах
студенты бронируют тему и заносят себя в определенный день доклада
в один день по 3-4 выступления
ppt-версия презентации выкладывается в группу VK

Слайд 12

Запись на выступления

Запись на выступления

Слайд 13

Практические задачи

Реализация программного средства для обфускировнаи и де-обфускирования данных
Создание демонстрационной программы и

Практические задачи Реализация программного средства для обфускировнаи и де-обфускирования данных Создание демонстрационной
тестовых сценариев по шифрованию данных стандартной библиотекой BouncyCastle
Проектирование и реализация клиент-серверного приложения, взаимодействующего по HTTPS протоколу с использованием ключей шифрования для SSL/TLS (Two-way TLS)
Создание маршрутизатора для клиент-серверного приложения, работающего через Gateway по средствам библиотеки Netflix Zuul.

Слайд 14

Реализация практических задач

Без отчетов
Ссылку на репозиторий GitHub в обсуждение VK
Демонстрация работы

Реализация практических задач Без отчетов Ссылку на репозиторий GitHub в обсуждение VK Демонстрация работы

Слайд 15

Правила оценки успеваемости

Правила оценки успеваемости
Имя файла: Системы-анализа-больших-данных-(САБД).pptx
Количество просмотров: 24
Количество скачиваний: 1