Аналитическая журналистика

Содержание

Слайд 2

Big data —

это различные инструменты, подходы и методы обработки как структурированных,

Big data — это различные инструменты, подходы и методы обработки как структурированных,
так и неструктурированных данных для того, чтобы их использовать для конкретных задач и целей.
способность управлять большими объемами разнородных данных со скоростью, достаточной для анализа таких данных в реальном времени и своевременного реагирования.

Слайд 3

Представьте такой магазин, где нет системы выкладки: макароны лежат рядом с собачьим

Представьте такой магазин, где нет системы выкладки: макароны лежат рядом с собачьим
кормом и зубными щетками. Как в нем что-то найти? Это же невозможно! Нужна систематизация.
Мир данных часто представляет собой вот такой магазин, и, чтобы разобраться, нужно приложить максимум усилий.

Слайд 4

Признаки:
Объем: количество данных;
Скорость: быстрота обработки;
Вариативность: количество разных типов данных.
Данные в обобщенном

Признаки: Объем: количество данных; Скорость: быстрота обработки; Вариативность: количество разных типов данных.
виде.

Влияние больших данных на систему управления данными, факторы:
Принципиально новые источники данных – смартфоны, планшеты, датчики;
Эффективные и экономически выгодные технологии сбора, хранения и анализа информации, способные работать со сколь угодно большими объемами данных.

Слайд 5

Структурированные данные имеют определенные длину и формат.

Источники:
Данные, генерируемые машинами, создаваемыми компьютерами

Структурированные данные имеют определенные длину и формат. Источники: Данные, генерируемые машинами, создаваемыми
и другими устройствами без вмешательства человека:
Медицинские приборы
Метки радиочастотной идентификации (например, отслеживание перемещение контейнеров с продукцией)
GPS- датчики в смартфонах (исследование поведения покупателей)
Лог-файлы – все виды данных о функционировании серверов, приложений, сетей, собираемые в процессе их работы
Данные из точек продаж (штрихкод)
Финансовые данные – получаемые из финансовых систем (не все финансовые данные генерируются машиной) – обозначение компании и её стоимость
Данные, генерируемые человеком: создаются человеком при взаимодействии с компьютером:
Входные данные (то, что вводит человек – соц. дем.)
Данные о посещении веб-сайтов
Игровые данные

Слайд 6

Неструктурированные данные не имеют определенного формата. Примерно 80% всех получаемых данных.

Машинные

Неструктурированные данные не имеют определенного формата. Примерно 80% всех получаемых данных. Машинные
данные: спутниковые снимки, метеорологические данные, научные данные (графики сейсмической активности), записи с камер наблюдения

Данные, генерируемые человеком: тексты документов, соц.сети, информационное наполнение веб-сайтов (YouTube).

Слайд 7

Техники и методы анализа, применимые к Big data

Техники и методы анализа, применимые к Big data

Слайд 8

* По данным компании IBS

2008: 0,18 зеттабайта
(1 ЗБ = 1024 эксабайта)

2011: 1,76 зеттабайта

2013:

* По данным компании IBS 2008: 0,18 зеттабайта (1 ЗБ = 1024
4,4 зеттабайта

2003: 5 эксабайтов данных
(1 ЭБ = 1 млрд гигабайтов)

2015:
6,5 зеттабайта

2020: 40-44 зеттабайтов

2025: вырастет в 10 раз

Накопление данных всем миром

Слайд 9

«Есть пять вариантов использования, которые являются наиболее популярными», генеральный директор Pentaho Квентин

«Есть пять вариантов использования, которые являются наиболее популярными», генеральный директор Pentaho Квентин
Галливэн:


Составление портрета клиента. Такое применение позволяет получить наиболее полную картину о потенциальных и имеющихся клиентах. Заказчики хотят знать, сколько времени посетители проводят на сайте, какие страницы посещают, где дольше задерживаются, когда и, главное, почему уходят.
Внедрение в обычные вещи. Второе популярное направление — управляемые датчики и аппаратные средства, помогающие собирать данные о пользе, здоровье пользователей или безопасности устройств.
Оптимизация базы данных. Мы помогаем клиентам определить, какие данные лучше подходит для более дешевой вычислительной платформы.
Повышение корпоративной эффективности. К примеру, крупный институт захотел перейти к отчетности данных, для этого необходимо было предъявить банку архивы финансового отдела. Поскольку те хранились в нескольких различных базах данных, нам пришлось сначала загрузить их и обработать в Hadoop, что позволило банку получить единую удобную базу данных.
Информационная безопасность клиентов. Использование кейсов Big Data для обеспечения безопасности хранения данных, также помогает обеспечить более эффективный метод хранения большого объема информации.

Слайд 10

Медицинская сфера:

Реализация технологий Big Data позволяет врачам более тщательно изучить болезнь и выбрать

Медицинская сфера: Реализация технологий Big Data позволяет врачам более тщательно изучить болезнь
эффективный курс лечения для конкретного случая. Благодаря анализу информации, медработникам становится легче предсказывать рецидивы и предпринимать превентивные меры. Как результат — более точная постановка диагноза и усовершенствованные методы лечения.

Слайд 11

Cети магазинов Target с помощью глубинного анализа данных и собственной системы прогнозирования удается с высокой

Cети магазинов Target с помощью глубинного анализа данных и собственной системы прогнозирования
точностью определить — беременна женщина или нет.

Слайд 12

На основе технологий Больших Данных в городе Лонг-Бич работают «умные» счетчики воды, которые используются для пресечения

На основе технологий Больших Данных в городе Лонг-Бич работают «умные» счетчики воды,
незаконного полива. Ранее они применялись с целью сокращения потребления воды частными домовладениями (максимальный результат — сокращение на 80%).

Слайд 13

На основании данных, полученных от датчиков дорожных камер, власти производят контроль работы светофоров, что в свою

На основании данных, полученных от датчиков дорожных камер, власти производят контроль работы
очередь позволяет регулировать траффик. Под управлением компьютеризованной системы находится порядка 4 500 тысяч светофоров по всему городу. Согласно официальным данным, новый алгоритм помог уменьшить заторы на 16%.

Слайд 14

ПРОБЛЕМА БОЛЬШИХ ДАННЫХ

ПРОБЛЕМА БОЛЬШИХ ДАННЫХ

Слайд 15

В Перми из компании уволили 150 айтишников: команда Big Data проанализировала их

В Перми из компании уволили 150 айтишников: команда Big Data проанализировала их
активность на удаленке
Позже Агапитов назвал основной причиной увольнений тот факт, что Xsolla, штаб-квартира которой находится в Лос-Анджелесе, а главный офис разработки — в Перми, перестала показывать 40-процентный рост выручки.

Что говорит сам основатель Xsolla:
https://meduza.io/feature/2021/08/06/my-formalno-esche-nikogo-ne-uvolili-my-skazali-kompaniya-vas-ne-tsenit

Слайд 16

Большие данные в ритейле

«Если посмотреть, какие битвы разыгрываются в интернете вокруг использования

Большие данные в ритейле «Если посмотреть, какие битвы разыгрываются в интернете вокруг
различных брендов, — говорит экс-директор по моделированию и анализу данных X5 Retail Group Валерий Бабушкин, — это выглядит как целая патриотическая война. В какие магазины ты ходишь — в эти или в эти? “Да ты что! Как можно в них ходить?!” 

Слайд 18

Большие данные для большого города

https://postnauka.ru/tv/85785

Большие данные для большого города https://postnauka.ru/tv/85785

Слайд 19

Что еще почитать / посмотреть по теме:

Big Data в кино: Netflix,

Что еще почитать / посмотреть по теме: Big Data в кино: Netflix,
Кевин Спейси и генерация сценариев https://dtf.ru/flood/39198-big-data-v-kino-netflix-kevin-speysi-i-generaciya-scenariev
Документальный фильм «Большие данные с человеческим лицом» https://www.afisha.ru/movie/226995/
Документальный фильм «Социальная дилемма» (с большой долей скептицизма)
Курс «Маленький гид по большим данным» https://postnauka.ru/courses/83921
Курс «Big data смотрит на мир» https://postnauka.ru/courses/86303
Артур Хачуян (генеральный директор SocialDataHub): «Настоящая Big Data в рекламе» https://www.youtube.com/watch?v=OAzcxDE7X-g&t=680s&ab_channel=BBDOGroup текст статьи: https://rb.ru/howto/bigdata-advertising/
Проблема больших данных в городских исследованиях https://postnauka.ru/video/83423

Слайд 20

Литература по теме:

К. Митник «Искусство быть невидимым. Как сохранить приватность в эпоху

Литература по теме: К. Митник «Искусство быть невидимым. Как сохранить приватность в
Big Data»
С. Стивен-Давидовиц «Все лгут. Поисковики, Big Data и Интернет знают о вас все»
У. Девис «Индустрия счастья. Как Big Data и новые технологии помогают добавить эмоцию в товары и услуги»
А. Благирев «Big Data простым языком»
В. Мальцев «Карл Маркс и большие данные»
С. Грингард «Интернет вещей»