Большие данные

Содержание

Слайд 2

Большие данные (Big Data) —
совокупность подходов, инструментов и методов, предназначенных для

Большие данные (Big Data) — совокупность подходов, инструментов и методов, предназначенных для
обработки структурированных и неструктурированных данных (в т.ч. из разных независимых источников) с целью получения воспринимаемых человеком результатов. Большие данные характеризуются значительным объемом, разнообразием и скоростью обновления, что делает стандартные методы и инструменты работы с информацией недостаточно эффективными.

Слайд 3

Технология Больших данных — это инструмент принятия решений на основе больших

Технология Больших данных — это инструмент принятия решений на основе больших объемов информации.
объемов информации.

Слайд 4

Примерами источников информации, для которых необходимы методы работы с большими данными могут

Примерами источников информации, для которых необходимы методы работы с большими данными могут
служить:

логи поведения пользователей в Интернете;
GPS-сигналы от автомобилей для транспортной компании;
информация о транзакциях всех клиентов банка;
информация о всех покупках в крупной розничной сети;
информация с многочисленных городских IP-видеокамер;
информация с датчиков большого производства, оборудованного технологией промышленного Интернета и т.д.

Слайд 5

Большие данные объединяют техники и технологии, которые извлекают смысл из данных

Большие данные объединяют техники и технологии, которые извлекают смысл из данных на экстремальном пределе практичности.
на экстремальном пределе практичности.

Слайд 6

Использование технологии больших данных позволяют:

Лучше понимать клиентов
Большие данные могут рассказать много

Использование технологии больших данных позволяют: Лучше понимать клиентов Большие данные могут рассказать
нового о том, что заставляет ваших клиентов покупать предлагаемые им продукты и услуги.

Слайд 7

Разработать целевые маркетинговые сообщения
Ключ к пониманию ваших клиентов – ответ

Разработать целевые маркетинговые сообщения Ключ к пониманию ваших клиентов – ответ на
на вопрос «Как и когда они делают покупки?», «Что является для них ценным?». На основе подобной информации вы можете разработать более эффективные маркетинговые сообщения для рынка и снизить затраты на привлечение клиентов. Большие данные могут помочь вашей компании (вне зависимости от ее размера) решить, когда, где и как ориентироваться на потенциальных клиентов и какой контент будет работать лучше всего в настоящий период времени.

Слайд 8

Ускорить вывод на рынок новых продуктов
Данная причина особенно важна для

Ускорить вывод на рынок новых продуктов Данная причина особенно важна для онлайн-продуктов
онлайн-продуктов и услуг, поскольку пользовательские данные клиентов могут помочь вам понять, что и как работает, а что нет. Сколько времени ваши клиенты пользуются продуктом? Что мотивирует их продолжать пользоваться продуктом или наоборот - отказаться? Благодаря этой информации, вы можете увеличить целевые показатели существующих продуктов и сделать новые продукты с более высокими результатами

Слайд 9

Быстрая проверка идей
Особенность малого бизнеса заключается в большей гибкости по

Быстрая проверка идей Особенность малого бизнеса заключается в большей гибкости по сравнению
сравнению с корпорациями. С помощью больших данных вы можете быстро извлечь выгоду из полученных идей, проверить их в практике и вывести продукты на рынок, прежде, чем ваши более крупные конкуренты начнут действовать

Слайд 10

Оптимизация путешествия клиента
Путешествие клиента – это маркетинговый термин. Большие данные как

Оптимизация путешествия клиента Путешествие клиента – это маркетинговый термин. Большие данные как
раз дают вам представление о путешествии клиента и его пользовательском опыте. Как потребители воспринимают наш бренд? Как они путешествуют через Ваш сайт? Сколько времени требуется, чтобы превратить их в продажу? С помощью этой информации Вы можете обнаружить точки прилипания в пути от впечатления до преобразования и сделать улучшения на этом пути.

Слайд 11

Улучшение бизнес-процессов внутри организации
Просматривая данные по существующим внутри компании бизнес-процессам, собранные

Улучшение бизнес-процессов внутри организации Просматривая данные по существующим внутри компании бизнес-процессам, собранные
компанией на протяжении многих лет, а также анализируя их, можно не только найти слабые места в бизнес-процессах, но и оптимизировать их либо переделать с нуля. Большие данные могут помочь вам предсказать, сколько клиентов прогнозируется в следующем квартале и помочь укомплектовать свои магазины.

Слайд 12

Методы работы с большими данными:
Машинное обучение
Анализ настроений
Анализ социальной сети
Ассоциация правил
Анализ дерева классификации
Генетические

Методы работы с большими данными: Машинное обучение Анализ настроений Анализ социальной сети
алгоритмы
Регрессионный анализ

Слайд 13

Машинное обучение помогает:
Различать спам и не спам в электронной почте
Изучать пользовательские предпочтения

Машинное обучение помогает: Различать спам и не спам в электронной почте Изучать
и давать рекомендации
Определять лучший контент для привлечения потенциальных клиентов
Определять вероятность выигрыша дела и устанавливать юридические тарифы

Слайд 14

Анализ настроений помогает:
Улучшать обслуживание в гостиничной сети, анализируя комментарии гостей
Настраивать стимулы и

Анализ настроений помогает: Улучшать обслуживание в гостиничной сети, анализируя комментарии гостей Настраивать
услуги для удовлетворения потребностей клиента
Определить по мнениям в социальной сети о чем думают клиенты.

Слайд 15

Анализ социальных сетей используют чтобы:
Увидеть, как люди из разных групп населения формируют

Анализ социальных сетей используют чтобы: Увидеть, как люди из разных групп населения
связи с посторонними лицами  
Выяснить важность и влияние конкретного человека в группе
Найти минимальное количество прямых связей  для соединения двух людей
Понять социальную структуру клиентской базы

Слайд 16

С помощью правил ассоциации:
Размещают продукты в большей близости друг к другу, чтобы

С помощью правил ассоциации: Размещают продукты в большей близости друг к другу,
увеличились продажи
Извлекают информацию о посетителях веб-сайтов из журналов веб-сервера
Анализируют биологические данные
Отслеживают системные журналы для обнаружения злоумышленников
Определяют чаще ли покупатели чая берут газированные напитки

Слайд 17

Классификация используется для:
Автоматического присвоения документов категориям
Классификации организмов по группам
Разработки профилей студентов, проходящих

Классификация используется для: Автоматического присвоения документов категориям Классификации организмов по группам Разработки профилей студентов, проходящих онлайн-курсы
онлайн-курсы

Слайд 18

Генетические алгоритмы используют для:
Составления расписания врачей для отделений неотложной помощи в больницах 
Расчет

Генетические алгоритмы используют для: Составления расписания врачей для отделений неотложной помощи в
оптимальных материалов для разработки экономичных автомобилей
Создания «искусственно творческого» контента, такого как игра слов и шутки

Слайд 19

Регрессионный анализ используют для определения:
Уровней удовлетворенности клиентов
Как прогноз погоды за предыдущий

Регрессионный анализ используют для определения: Уровней удовлетворенности клиентов Как прогноз погоды за
день влияет на количество полученных звонков в службу поддержки
Как район и размер домов влияют на цену жилья

Слайд 20

Применение Больших данных (Big Data)

Самый быстрый рост расходов на технологии

Применение Больших данных (Big Data) Самый быстрый рост расходов на технологии больших
больших данных происходит в банковской сфере, здравоохранении, страховании, ценных бумагах и инвестиционных услугах, а также в области телекоммуникаций.

Слайд 21

Банки и компании, выпускающие кредитные карты, используют большие данные, чтобы выявлять

Банки и компании, выпускающие кредитные карты, используют большие данные, чтобы выявлять закономерности,
закономерности, которые указывают на преступную деятельность.
Снижение финансовых рисков – до 60%  в банковском секторе;

Слайд 22

Больница может использовать его для обеспечения безопасности, актуальности данных пациента и полного

Больница может использовать его для обеспечения безопасности, актуальности данных пациента и полного
сохранения их качества. Размещая базы данных о здоровьи в блокчейн, больница обеспечивает всем своим сотрудникам доступ к единому, неизменяемому источнику информации.

Слайд 23

Реклама, маркетинг и торговля. Не имеет значения, что вы предлагаете потребителю,

Реклама, маркетинг и торговля. Не имеет значения, что вы предлагаете потребителю, качественные
качественные товары, услуги или яркие обещания – все это должно находить отклик. И тут снова приходят на помощь озера данных. Компании получили возможность предугадывать желания – предлагать продукт, который вы подсознательно хотите купить.

Слайд 24

Промышленность в целом и энергетический сектор в частности генерируют огромный объем информации,

Промышленность в целом и энергетический сектор в частности генерируют огромный объем информации,
которая при применении традиционных методов аналитики используется не в полной мере. ВD позволяют извлекать, преобразовывать, обрабатывать и хранить данные, которые не всегда учитываются, но могут косвенно влиять на работу производства.

Слайд 25


Большие данные открывают перед энергетикой и другие возможности. Они позволяют

Большие данные открывают перед энергетикой и другие возможности. Они позволяют тщательнее контролировать
тщательнее контролировать динамику потребления электроэнергии, точечно отслеживать дебиторскую задолженность, дают возможность качественнее управлять стоимостью контрактов и прогнозировать возникновение спроса на дополнительные услуги среди клиентов отрасли.

Слайд 26

Проблемы внедрения

Первая проблема — дефицит кадров: сектору не хватает специалистов по

Проблемы внедрения Первая проблема — дефицит кадров: сектору не хватает специалистов по
всем направлениям, связанным с обработкой и внедрением больших данных. Сейчас многие коммерческие компании готовят кадры самостоятельно, но этого недостаточно, чтобы решить эту проблему.

Слайд 27

Вторая — инфраструктура. По количеству ЦОД и вычислительных мощностей РФ существенно

Вторая — инфраструктура. По количеству ЦОД и вычислительных мощностей РФ существенно уступает
уступает развитым странам. В США, например, они занимают около 65 млн кв. метров. В РФ — на порядок меньше. Нужно развивать инфраструктуру как для обработки данных, так и для передачи этих данных на высокой скорости.

Слайд 28

Третья — доступность данных. У нас есть серьезные ограничения по обработке

Третья — доступность данных. У нас есть серьезные ограничения по обработке и
и обмену разными типами данных. Необходимы стандарты по анонимизации и деперсонализации данных, возможность свободного оборота данных, которые перестали быть персональными.

Слайд 29

Четвертая проблема — исследования и идеи.
Нет необходимой экспериментальной среды

Четвертая проблема — исследования и идеи. Нет необходимой экспериментальной среды и ресурсов
и ресурсов для разработки и внедрения новых технологий работы с Big Data. Для инноваторов необходимо создать облегченный доступ к большим данным, кросс-отраслевые инкубаторы.

Слайд 30

Пятая — невозможность массово имплементировать большие данные в масштабах всей экономики.

Пятая — невозможность массово имплементировать большие данные в масштабах всей экономики.

Слайд 31

Проблемы Big Data

1) Самой большой проблемой больших данных являются затраты на

Проблемы Big Data 1) Самой большой проблемой больших данных являются затраты на
их обработку. Сюда можно включить как дорогостоящее оборудование, так и расходы на заработную плату квалифицированным специалистам, способным обслуживать огромные массивы информации. Очевидно, что оборудование придется регулярно обновлять, чтобы оно не теряло минимальной работоспособности при увеличении объема данных.

Слайд 32

2) Большое количество информации, которую необходимо обрабатывать. Если, например, исследование дает

2) Большое количество информации, которую необходимо обрабатывать. Если, например, исследование дает не
не 2-3, а многочисленное количество результатов, очень сложно остаться объективным и выделить из общего потока данных только те, которые окажут реальное влияние на состояние какого-либо явления

Слайд 33

3)Проблема конфиденциальности Big Data. В связи с тем, что большинство сервисов

3)Проблема конфиденциальности Big Data. В связи с тем, что большинство сервисов по
по обслуживанию клиентов переходят на онлайн-использование данных, очень легко стать очередной мишенью для киберпреступников. Даже простое хранение личной информации без совершения каких-либо интернет-транзакций может быть чревато нежелательными для клиентов облачных хранилищ последствиями.

Слайд 34

4) Проблема потери информации. Меры предосторожности требуют не ограничиваться простым однократным

4) Проблема потери информации. Меры предосторожности требуют не ограничиваться простым однократным резервированием
резервированием данных, а делать хотя бы 2-3 резервных копии хранилища. Однако с увеличением объема растут сложности с резервированием – и IT-специалисты пытаются найти оптимальное решение данной проблемы
Имя файла: Большие-данные.pptx
Количество просмотров: 257
Количество скачиваний: 13