Лекція_2_Вибір_інструментів_для_візуалізації_даних

Содержание

Слайд 2

План

1. Як розповісти історію за допомогою даних
2. Більше, ніж числа
3. Журналістика
4. Залежності

План 1. Як розповісти історію за допомогою даних 2. Більше, ніж числа

5. Дизайн

Слайд 3

Як розповісти історію за допомогою даних
Подумайте про всі популярні книги по візуалізації,

Як розповісти історію за допомогою даних Подумайте про всі популярні книги по
які існують, - про ті, про які ви постійно чуєте на лекціях або про які читаєте в блогах, а ще про ті, які прийшли вам на розум прямо зараз, поки ви пробігали очима по цих рядках. Що у них всіх спільного? Вони всі розповідають цікаві історії. Ймовірно, ці історії повинні були переконати вас у чомусь. Або, можливо, підштовхнути вас зробити щось, познайомити з новою інформацією або змусити переглянути свої упереджені уявлення про реальність. Як би там не було, по-справжньому гарна візуалізація даних - неважливо, велика чи маленька, створена з любові до мистецтва або для презентації - допомагає вам зрозуміти, про що саме здатні розповісти дані.

Слайд 4

Більше ніж числа
Погляньмо правді в очі. Дані можуть бути чимось досить прикрим

Більше ніж числа Погляньмо правді в очі. Дані можуть бути чимось досить
і дратівливим, якщо ви не знаєте, що ви шукаєте, або не знаєте, чи є в них щось таке, що слід шукати в першу чергу. Тоді вони перетворюються на купу цифр і слів, які не мають іншого сенсу, крім свого безпосереднього значення. В цьому і полягає великий сенс статистики та візуалізації - в тому, що вони допомагають побачити, що саме стоїть за всім цим. Пам'ятайте: дані є відображенням реального життя. Це не просто купа якихось чисел. І від вас - статистиків, програмістів, дизайнерів і фахівців в обробці даних - залежить, як розповісти ту чи іншу історію.

Слайд 5

Більше ніж числа
Як приклад давайте подивимося на безробіття. Видати середні значення по

Більше ніж числа Як приклад давайте подивимося на безробіття. Видати середні значення
областям країни неважко, але, як ви самі переконалися, стан справ навіть у межах одної області може сильно коливатися. У двох сусідніх районах ситуація може істотно різнитися. Можливо, серед ваших знайомих є людина, яка втратила роботу в останні кілька років, і, як то кажуть, він для вас не просто статистична одиниця, правильно? Вам не потрібно розповідати історію кожного з людей. І все ж є тонка, але від цього не менш важлива відмінність між збільшенням рівня безробіття на 5 відсотків і декількома сотнями тисяч людей, що залишилися без роботи. У першому випадку сказане сприймається як досить абстрактна цифра, а в другому дані мають зовсім інше смислове навантаження.

Слайд 6

Журналістика
Повною мірою все вищесказане до мене дійшло під час стажування в газеті

Журналістика Повною мірою все вищесказане до мене дійшло під час стажування в
New York Times. Тривала вона всього три літніх місяці після другого курсу магістратури, але змінила мій підхід до даних назавжди. Я не тільки навчився створювати графіку для новин. Я навчився підносити дані як новину, а разом з тим дізнався багато про дизайн, організації та перевірки фактів, а також про їх пошуку і вивченні.
Одного разу я присвятив день завданню перевірки трьох чисел з цілого масиву даних, а все тому, що коли відділ графіки New York Times створює якусь діаграму, він повинен упевнитися в точності відомостей. Тільки переконавшись у надійності отриманої інформації, ми переходили до створення презентації. Саме така увага до деталей робить графіку в цій газеті настільки хорошою.

Слайд 7

Журналістика
Подивіться на будь-яку схему або діаграму у New York Times. Дані в

Журналістика Подивіться на будь-яку схему або діаграму у New York Times. Дані
ній завжди представлені коротко, ясно і надзвичайно красиво. Однак що це означає? Коли ви дивитеся на інфографіку, ви отримуєте можливість зрозуміти дані. Важливі моменти або області супроводжуються коментарями; символи і кольори акуратно пояснені в легенді або в примітках; а ще Times робить все для того, щоб історія, що міститься в даних, прочитувалась аудиторією легко. Це вже не просто діаграма або схема. Це графіки.
Графік, представлена ​​на наступному слайді, схожий на той, яку ви можете знайти в New York Times. На ній показано, як збільшується ймовірність того, що ви помрете в найближчий рік, в залежності від вашого віку.

Слайд 9

Журналістика
В основі цього малюнка лежить простий лінійний графік. Однак елементи дизайну допомагають

Журналістика В основі цього малюнка лежить простий лінійний графік. Однак елементи дизайну
краще розповісти історію. Підписи і примітки пояснюють контекст і допомагають зрозуміти, чому ці дані цікаві; а товщина ліній і колір фокусують очі на те, що важливо.
Вимоги до дизайнера графіків і діаграм не зводяться тільки до візуалізації статистичних даних - від нього вимагається також дати зрозуміти, що саме виражає конкретний зображений елемент.

Слайд 10

Мистецтво
New York Times - газета об'єктивна. Вона викладає вам дані і дає

Мистецтво New York Times - газета об'єктивна. Вона викладає вам дані і
факти. У цьому їй немає рівних. На іншому кінці спектру знаходиться візуалізація, яка в меншій мірі пов'язана з аналітикою і в більшій - з зануренням в емоції. Саме цим займаються Джонатан Харріс і Сеп Камвар в своїй роботі «Все у нас добре» (Jonathan Harris, Sep Kamvar, We Feel Fine), представленої на наступному слайді.

Слайд 12

Мистецтво
В їх інтерактивному творінні зібрані пропозиції і фрази з різних персональних блогів,

Мистецтво В їх інтерактивному творінні зібрані пропозиції і фрази з різних персональних
і всі вони візуалізовані як бульбашки, що пливуть в просторі. Кожна бульбашка являє собою емоцію і пофарбована у відповідний колір. Загалом складається враження, ніби всі ці люди мчать в космосі, але якщо ви подивіться довше, то помітите, як бульбашки починають збиватися разом. Спробуйте впорядкувати і категоризувати їх, використовуючи інтерфейс, і ви побачите, як ці, здавалося б, довільно розкидані крихітні штучки об'єднуються. Натисніть на який-небудь пляшечку, щоб дізнатися чиюсь індивідуальну історію. Це так поетично і одночасно так пізнавально!

Слайд 13

Мистецтво
Можна навести ще багато прикладів. Скажімо, робота Ґолана Левіна «Смітник» (Golan Levin,

Мистецтво Можна навести ще багато прикладів. Скажімо, робота Ґолана Левіна «Смітник» (Golan
The Dumpster). У ній досліджуються записи в блогах, в яких йдеться про розставання зі значимою людиною. Або «Sumedicina» Кіма Азендорфа (Kim Asendorf), в якій розповідається вигадана історія чоловіка, тікає від ураженої корупцією організації, але не словами, а схемами і діаграмами. Або скульптури Андреаса Ніколаса Фішера (Andreas Nicolas Fischer), що зображують економічний спад в Сполучених Штатах.

Слайд 15

Мистецтво
Основна ідея полягає в тому, що дані і візуалізація не обов'язково повинні

Мистецтво Основна ідея полягає в тому, що дані і візуалізація не обов'язково
передавати лише голі, холодні факти. Іноді те, що вам необхідно, це зовсім не аналітичні прозріння. Часом буває корисніше розповісти історію з емоційної точки зору, щоб підштовхнути глядачів до роздумів над наявними даними. Подумайте над цим. Не завжди кіно повинно бути документальним, і не завжди візуалізація повинна бути у вигляді традиційних графіків і діаграм.

Слайд 16

Залежності
Вам напевно коли-небудь потрапляли на очі малюнки з з цілим набором графіків

Залежності Вам напевно коли-небудь потрапляли на очі малюнки з з цілим набором
і діаграм, розташованих як ніби в абсолютно випадковому порядку? Я говорю про малюнки, яким очевидно чогось не вистачає - як ніби графічного дизайнера колись було подумати над даними, і він поспіхом додав їм якусь форму, аби встигнути до крайнього терміну. Дуже часто те, чого так явно не вистачає в подібних випадках, - і є залежність.
У статистиці під залежністю, як правило, мають на увазі кореляцію і причинність. Множинні змінні можуть бути переплетені між собою складними зв'язками. Шоста глава, «Візуалізація залежностей», присвячена саме цим поняттям і тому, як їх візуалізувати.

Слайд 17

Залежності
Однак і на більш абстрактному плані, на якому ви не думаєте про

Залежності Однак і на більш абстрактному плані, на якому ви не думаєте
рівняння і критерії перевірки гіпотез, ви можете розробляти діаграми і графіки для візуального порівняння і зіставлення величин і розподілів. Як простий приклад можна привести схему проникнення технологій в життя, взяту з «Доповіді про світовий прогрес» і представлену на наступному слайді.

Слайд 19

Залежності
Стовпчикові діаграми показують кількість користувачів інтернету, а також кількість абонентів з комутованим

Залежності Стовпчикові діаграми показують кількість користувачів інтернету, а також кількість абонентів з
доступом і широкосмугових мереж на 100 жителів. Відзначте, що розкид у інтернет-користувачів (від 0 до 95 на 100 жителів) набагато ширше, ніж у двох інших груп.
Простіше і швидше за все - надати комп'ютерній програмі, яка у вас встановлена, самій вирішити, який діапазон використовувати для кожної столбцовую діаграми. Однак все столбцовую діаграми тут збудовані на базі одного і того ж діапазону, незважаючи на те що немає жодної країни, у якій було б по 95 абонентів з комутованим доступом або користувачів широкосмугових мереж на 100 жителів. Але це дає вам можливість легко порівнювати розподілу між групами.

Слайд 20

Залежності
А тому, коли вам доводиться працювати з великою кількістю різних наборів

Залежності А тому, коли вам доводиться працювати з великою кількістю різних наборів
даних, постарайтеся думати про них як про групу, а не як про окремі, жодним чином не пов'язаних між собою масивах. Так ви зможете отримати набагато цікавіші результати

Слайд 21

Дизайн
Коли вже всі дані в порядку, ви можете приступати до візуалізації. Над

Дизайн Коли вже всі дані в порядку, ви можете приступати до візуалізації.
чим би ви не працювали - будь то доповідь, онлайн-інфографіка або твір data-арту, - вам слід дотримуватися кількох основних принципів. Кожен з них дає простір для маневру, так що вам краще сприймати їх, скоріше, як якісь орієнтири, а не як звід жорстких правил, але якщо в графічному дизайні ви новачок, тоді вам саме з них і варто почати.

Слайд 22

Дизайн
Розробка будь-якої діаграми протікає приблизно по одному і тому ж сценарію. Ви

Дизайн Розробка будь-якої діаграми протікає приблизно по одному і тому ж сценарію.
збираєте дані; ви кодуєте дані за допомогою кіл, стовпців і квітів; а потім пропонуєте іншим людям прочитати їх. В цей момент читачі повинні розшифрувати ваші кодування. Що означають всі ці кола, стовпці і кольору?
В роботі Вільяма Клівленда (William Cleveland) і Роберта МакГі (Robert McGill) питання кодування розглянуті в деталях. Деякі типи кодувань працюють краще, ніж інші. Але який саме підхід до кодування ви виберете, буде не так вже й важливо, якщо в кінцевому рахунку читачі не зможуть зрозуміти, що саме висловлюють ті чи інші позначення. Якщо вони не зможуть розкодувати ваше послання, значить, час, який ви присвятили створенню діаграми, виявиться витраченим даремно.

Слайд 23

Дизайн
Можливо, ви відзначали про себе, що в малюнках, що знаходяться десь між

Дизайн Можливо, ви відзначали про себе, що в малюнках, що знаходяться десь
data-артом і інфографікою, часом відсутня контекст, а вже з творами data-арту це і зовсім звичайна ситуація. Легенди і мітки здатні повністю зруйнувати враження від роботи, але ви можете принаймні дати трохи інформації, описавши найнеобхідніше в одному короткому абзаці. Це допоможе іншим оцінити вашу працю.

Слайд 24

Дизайн
Однак з подібною відсутністю пояснень іноді можна зіткнутися і в тих випадках,

Дизайн Однак з подібною відсутністю пояснень іноді можна зіткнутися і в тих
коли основне завдання діаграм і графіків якраз і полягає в поданні даних. В результаті читачі бувають розчаровані, а вам напевно не хочеться допускати цього. Відбувається таке деколи тому, що, працюючи з даними, ви з ними зростаються і знаєте напам'ять, що означає кожен елемент діаграми. Читачам жевсе новиною. Не знаючи контексту, з яким ви самі звикли, аналізуючи дані, вони виявляються немов сліпими - не можуть побачити те, що бачите ви.

Слайд 25

Дизайн
Отже, як ви можете переконатися, що читачам вдасться розшифрувати ваші кодування? Просто

Дизайн Отже, як ви можете переконатися, що читачам вдасться розшифрувати ваші кодування?
поясніть їм значення кожного елемента за допомогою підписів, легенд і ключів. Що саме вибрати - залежить від ситуації. Подивіться, наприклад, на карту світу на наступному слайді, яка дає уявлення про використання програми Firefox в різних країнах земної кулі.

Слайд 27

Дизайн
Ви бачите, що різні країни пофарбовані в різні відтінки голубого, але що

Дизайн Ви бачите, що різні країни пофарбовані в різні відтінки голубого, але
означають ці відтінки? Темний колір - це більше або менше споживачів? І якщо більше, то більше якого саме кількості? У тому вигляді, в якому карта представлена ​​на малюнку, вона досить-таки марна. Але якщо ви забезпечите її описом, такий, як на наступному слайді, все відразу проясниться. В даному випадку колірна легенда виконує і ще одну функцію: вона являє собою стовпчикову діаграму, яка демонструє поширеність програми на підставі кількості користувачів.

Слайд 29

Дизайн
Якщо у вас є достатньо місця або занадто багато категорій, ви можете

Дизайн Якщо у вас є достатньо місця або занадто багато категорій, ви
вставити підписи безпосередньо поруч з об'єктами вашої діаграми, як це продемонстровано на наступному слайді. На даній діаграмі показано кількість номінацій, які той чи інший актор отримав перед тим, як був удостоєний премії «Оскар» за кращу чоловічу роль.

Слайд 31

Дизайн
По інтернету в свій час розгулювала теорія про те, що статуетку, як

Дизайн По інтернету в свій час розгулювала теорія про те, що статуетку,
правило, виграє той актор, який на відповідний рік отримав найбільше номінацій серед представників своєї когорти. Як випливає з підписів, оскароносці, відмічені темно-оранжевим, дійсно отримали найбільше номінацій, а світло-помаранчевим відзначені ті, хто не отримав найбільше номінацій, однак тим не менше був удостоєний статуетки у відповідному році.

Слайд 32

Дизайн
Як бачите, у вас є безліч варіантів дії. Всі ці деталі не

Дизайн Як бачите, у вас є безліч варіантів дії. Всі ці деталі
вимагають великих зусиль у використанні, вони начебто дрібні, але різниця від їх застосування може бути величезною для сприйняття вашої роботи. По інтернету в свій час розгулювала теорія про те, що статуетку, як правило, виграє той актор, який на відповідний рік отримав найбільше номінацій серед представників своєї когорти. Як випливає з підписів, оскароносці, відмічені темно-оранжевим, дійсно отримали найбільше номінацій, а світло-помаранчевим відзначені ті, хто не отримав найбільше номінацій, однак тим не менше був удостоєний статуетки у відповідному році.

Слайд 33

Дизайн
Дайте осям назви
Ви вже зрозуміли, чому необхідно завжди давати пояснення до кодування.

Дизайн Дайте осям назви Ви вже зрозуміли, чому необхідно завжди давати пояснення
Точно так же вам слід завжди давати назви осях в ваших графіках і діаграмах. Без підписів і пояснень осі виконуватимуть лише декоративну роль. Дайте їм назви, щоб читачі знали, яка саме шкала застосовується в кожному конкретному випадку. Логарифмічна, диференціальна, експоненціальна.

Слайд 35

Дизайн
Як ви можете переконатися, притому що графік всюди один, в результаті простої

Дизайн Як ви можете переконатися, притому що графік всюди один, в результаті
зміни назв осей виходять абсолютно різні історії. Звичайно, все це робилося заради забави. А тепер уявіть собі, що даний графік повинен був розповісти про щось дуже серйозне. Без підписів і назв ваша діаграма просто безглузда.
Имя файла: Лекція_2_Вибір_інструментів_для_візуалізації_даних.pptx
Количество просмотров: 33
Количество скачиваний: 0