Визуализация данных для новичков: практика
Дата публикации: 22.09.2020
unitalk.cloudПошаговый алгоритм визуализации, главные правила разработки и топ инструментов для не-специалистов
Не так давно мы выпустили статью «Как визуализация данных поможет вам в принятии решений и управлении бизнесом». Сегодня поговорим о том, как создавать визуализацию: с чего начать, что продумать, какие правила соблюдать и какие инструменты использовать, если вы раньше не имели с ней дела и под рукой нет разработчиков и дизайнеров.
Статичная и интерактивная визуализация
Визуализация может быть статичной, когда дизайнер отрисовывает изображения и все. А может быть интерактивной, когда есть программная реализация для управления визуальным представлением данных. Интерактивная визуализация — самый эффективный вариант, так как она позволяет пользователям более глубоко взаимодействовать с данными для оценки разных ситуаций и сценариев в бизнесе.
Интерактивность также дает возможность вносить изменения в данные визуализации, способствует пониманию базовых данных и позволяет пользователю передавать важные концепции или идеи. А иногда это просто круто. К примеру, на visual-literacy.org есть интерактивная периодическая таблица визуализации — по образу и подобию периодической таблицы Менделеева. Каждый элемент — это тип визуализации, по клику открывается пример, как это выглядит.
И это один из самых простых вариантов! А уж что New York Times делает…
При этом, что закономерно, статика в изготовлении проще, а вот для динамики понадобятся разработчики с опытом.
Источники данных для визуализации
У каждой компании — свой набор источников данных. Чаще всего для сбора данных можно использовать:
- социальные сети;
- системы аналитики по типу Google Analytics;
- клиентский отдел;
- финансовый отдел;
- HR-отдел.
Визуализация позволяет собрать все данные из разных источников в одном месте для дальнейшей обработки и работы с ними.
Процесс создания
- Задачи и цели. Любой проект начинается с определения задач: зачем компании нужна визуализация, какие задачи она должна решать, какие цели она поможет достичь. Важно! Определяйте не только задачи, но и дальнейшие пути применения и распространения визуализации. Базовый пример: диаграмма под экран во всю сцену будет отличаться от диаграммы для мобильного приложения.
- Целевая аудитория. Кто будет смотреть вашу визуализацию? Каким объемом данных эти люди уже обладают? Насколько они понимают технические тонкости того, что вы планируете рассказать? Кто эти люди? От всего этого зависит дальнейшие шаги: от выбора формата до объемов данных, которые будут задействованы.
- Сбор данных. Бывает, что визуализация проходит в порядке: достали уже имеющиеся данные → обработали → визуализировали. А бывает иначе: придумали идею → сформировали список нужных данных → собрали данные → обработали → визуализировали. Принципиальной разницы конкретно для разработки визуализации нет.
- Выбор каркаса, формата + определение элементарной частицы данных. В этот момент подготовка заканчивается и начинается фактическая работа над визуализацией.
- Выбор инструментов для разработки. Будут это онлайн-сервисы, которые позволяют легко создать визуализацию по типовым шаблонам, просто загрузив в них таблицу с данными? Или уникальное решение, разработанное конкретно для этого проекта?
- Создание чернового варианта и проверка на реальных данных. Черновой вариант позволит увидеть слабые места формата до финального этапа работы, а использование реальных данных точно покажет, достаточно ли их для выбранного формата. Иногда при черновом наброске с реальными данными может оказаться, что предварительно собранный массив данных слишком мал для задумки или, наоборот, что все данные просто не помещаются в выбранном формате и делают визуализацию перегруженной. Черновик помогает вовремя увидеть и исправить это.
- Отрисовка и программная реализация. Финальная стадия непосредственного создания визуализации, какой ее увидит целевая аудитория.
Правила визуализации
Правила визуализации — это тема, которую можно рассматривать, пожалуй, вечно. Мы не будем пытаться объять необъятное. Вместо этого разберем важные правила визуализации графиков и диаграмм — как самых распространенных и доступных форм.
Если нарушать эти правила, визуализация перестанет работать, перестанет выполнять свою миссию — простым способом доносить людям данные, которые они не могут получить иначе.
Формат
Если только начинаете работать с визуализацией и используете простые данные, рекомендуем первое время делать несколько черновых вариантов для выбора оптимальной формы. Это продиктовано (все той же) главной миссией визуализации: упрощать и доносить. Формат визуализации должен помогать достичь этой цели, а не мешать. Если формат усложняет данные, его важно изменить.
Общая закономерность:
- круговая диаграмма подойдет для 2-5 значений с значительной разницей показателей;
- если значений больше или показатели примерно на одном уровне, лучше использовать линейчатую диаграмму.
Когнитивные предубеждения
Когнитивные предубеждения — наши убеждения на основе прошлого опыта или знаний, о которых мы писали в статье «Как психографика повышает количество лидов и конверсий». То есть это то, что мы считаем по умолчанию правильным или нормальным, потому что мы так привыкли (или знаем, что так должно быть).
Какие когнитивные предубеждения важны в визуализации?
- Временные оси. Оси для обозначения лет, месяцев, кварталов, дней располагаются горизонтально слева направо.
- Цвет — это информативный прием. Зеленый: «да», «успешно», «получилось», «хорошо», «положительно». Красный: «нет», «плохо», «потери», «отрицательно». Желтый: «зона риска». Розовый: «женщины». Голубой: «мужчины». Синий: «зима». Оранжевый: «Осень». Это — ассоциации, которыми оперирует наш мозг при считывании визуальных данных.
Вот эта диаграмма однозначно считывается как «все плохо» из-за обилия красного. И только когда мы начинаем читать легенду, оказывается, что 60% занимает положительный ответ. Если только вы не рассказываете, что 60% людей сказали «Да» на предложение бить котиков, избегайте «отрицающего» цвета.
Логический порядок
Логический порядок расположения — это от большего к меньшего, реже — от меньшего к большему. Расположение элементов вразнобой делает изображение неопрятным и затрудняет считывание информации.
Сравнение данных
Сравнение данных — еще один аспект, в котором помогает визуализация. Важно участь:
- данные для сравнения помещаются на одном графике, а не на трех разных, но стоящих рядом;
- легко сравнивать данные при логическом порядке расположения элементов;
- сложно сравнивать данные в круговых диаграммах, если нужна хоть какая-то точность восприятия или если размер сегментов отличается меньше, чем на ⅓;
Дизайнерские приемы
Дизайн должен работать на задачу. Если какой-то из элементов дизайна не работает на задачу, вероятно, его можно убрать. Если его можно убрать и суть точно не изменится, его наверняка нужно убрать.
Чаще всего для визуализации не нужны градиенты, 3D-эффекты, тени, кислотные цвета.
Зачастую хороший дизайн выполнен с простой, ясностью и даже минимализмом.
Минимализм
Неинформативные элементы — долой. Чем больше у вас элементов, которые не несут пользы аудитории, тем хуже работает визуализация. Поэтому — долой.
Самые распространенные неинформативные (чаще всего) элементы графиков: линии сетки, оси, основные и вспомогательные линии сетки.
Важно! У этого правила, как и у любого другого, есть исключения. Поэтому оформляйте свой график на основе конкретно вашей ситуации.
Громоздкость
Чаще всего работает правило «Одна мысль — один график». Иначе очень легко сделать график слишком громоздким и сложно читаемым.
Впрочем, сложные формы — понятие относительное: все упирается в целевую аудиторию. И даже сложные формы допустимы, правда, разработать их на порядок труднее.
К примеру, вот изображение 101 футбольного «пробега» ресивера Оделла Бэкхема после кэтча на протяжении всего сезона:
А вот пиковые занятия разными видами спорта на протяжении всего дня от Хенрика Линдберга:
Формат чисел
Главные правила:
- числа ставятся с разделителями разрядов: 20000 → 20 000;
- большие числа пишутся с сокращениями: 2 000 000 → 2 млн;
- дробные числа по возможности округляются: 2,94 → 3;
- если числа после запятой нужны, выберите единый формат, к примеру, все цифры округлять до десятичных, вне зависимости от того, сколько цифр после запятой в изначальном наборе данных.
Тайтл и легенда
Название и легенда — то, что позволяет трактовать график правильно. Поэтому упускать их никак нельзя.
Важно! Даже если вы готовите графики на живое выступление и планируете озвучивать значение каждой линии, все равно сделайте легенду. Зритель не запомнит все значения с первого раза, а в процессе прослушивания лекции/доклада ему, вероятно, придется вернуться к графику не раз. Сделайте так, чтобы аудитория могла в любой момент посмотреть на легенду и вспомнить, что значит тот или иной элемент.
Однотипные данные
Бывает, когда в визуализации требуется сделать два, три, а то и больше графиков — но все с однотипными данными. В таком случае придерживайтесь одного формата, чтобы не запутать зрителя.
Суть в том, что если вы сначала показали столбиковую диаграмму, а потом круговую, человек в первую очередь начинает искать разницу в типах данных, чтобы оправдать смену формата. Если разницы нет, не нужно путать своего зрителя.
Простые инструменты для визуализации данных
Если вы хотите создать информативный график без разработчика, попробуйте готовые решения, которые работают на основе шаблонов и выгрузки данных из таблиц.
Популярные и простые сервисов для самостоятельной визуализации данных — от круговых диаграмм до карт и таймлайнов:
- simile-widgets.org.
- visualizefree.com.
- visual.ly.
- wolframalpha.com.
- www.instantatlas.com.
- www.zingchart.com.
- rawgraphs.io.
- datahero.com.
- plot.ly.
Полезно почитать