Интеллектуальная визуализация данных: алгоритм оценки качества

Разрыв между плохой и хорошей визуализацией данных невелик.

Разрыв между хорошей и хорошей визуализацией данных огромен!

Проблема в том, что мы и наши HiPPO делимся мнениями и чувствами и наши представления о том, что станет вирусным в разговоре. Это совершенно контрпродуктивно, чтобы различать плохое, хорошее и великое.

Вместо этого нам нужно твердое понимание восходящего потока, с которым мы сталкиваемся в нашем стремлении к величию, и стандартные рамки, которые могут помочь нам беспристрастно оценивать качество.

Давайте сделаем это сегодня. Узнайте, как отделить плохое от хорошего и хорошее от великого, и сделайте это, используя примеры, которые мы все можем сразу понять.

Мы начнем с рассмотрения двух групп людей, которые лежат в основе конфликта навязчивых идей. а затем научитесь оценивать, насколько эффективна любая визуализация данных, совершенно по-новому. Если вы примете его, я гарантирую, что влияние на вашу работу будет преобразующим.

Конфликт навязчивых идей.

В любой визуализации данных участвуют две стороны.

[19659020] 1. Аналитик / Визуализатор данных.

Как я часто рассказывал в этом блоге, мы, аналитики, все занимаемся убеждением. Мы работаем против этого желаемого результата, потому что когда мы работаем над созданием визуализации данных, вот наши главные проблемы / желания / перспективы:

Как я могу втиснуть как можно больше в графику? [19659002] Что я могу включить, чтобы каждый четко понимал, сколько работы я сделал?

Какую часть моих планов мне нужно сделать явной, а какую скрытую?

Могу ли я что-то добавить, чтобы увеличить шансы, что это станет вирусным и приведет к известности и славе?

Хорошо. Я только поддразниваю.

Но, как аналитик, визуализатор данных я не могу сказать, что эти мысли не приходят мне в голову. 🙂

Я делюсь вышеизложенным в первую очередь для того, чтобы вы знали, что эти мотивы существуют — и, как и я, вы должны пытаться бороться и сопротивляться!

Лучшие визуализаторы данных, озабоченные следующими вопросами:

1 . известные и неизвестные переменные
2 . причинная связь
3 . . нюанс
4 . методы визуализации
5 . сообщения с порядком ранжирования
6 . простота, простота, простота, простота, простота, простота и, на всякий случай, в последний раз простота.

Это шесть вещей, которые имеют первостепенное значение в моей работе, и они должны быть важны в вашей.

Простота важнее всего остального, потому что, если я не могу выделить сложность, я мог бы с таким же успехом не выполнять эту работу, потому что это только шанс снежного кома на солнце что аудитория поймет мой сложный образ .

Давайте посмотрим на другую группу людей, участвующих в уравнении визуализации данных.

2. Потребитель данных.

Вот проблемы / желания / перспективы, которые возникают у потребителя визуализаций данных в верхней части головы, когда они представлены с набором анализа:

Что это для меня значит?

Как легко понять самый важный момент?

Что это для меня?

Сколько усилий мне нужно приложить, чтобы понять всю инфографику?

Что это для меня значит?

Как я могу доверять тому, что это сообщение от надежного аналитика / источника / с использованием надежной методологии?

(Никогда не недооценивайте ошеломляющую роль эгоизм, который Потребитель данных приносит с собой к столу, когда вы показываете ему таблицу данных или визуализацию данных. И это понятно, потому что у них есть трудная работа и 71 другая вещь, о которой нужно беспокоиться.)

Обратите внимание, что есть очень мало общего между навязчивыми идеями потребителя данных и визуализатора данных.

Если у вас есть выбор (а он есть!), Позвольте потребителю данных управлять вашими усилиями по визуализации данных. Единственное исключение — когда вы пытаетесь протолкнуть пропаганду, а затем придерживаетесь своей повестки дня.

Если инфографика — отстой, обычно это происходит из-за конфликта между визуализатором и потребителем по указанным выше параметрам.

Вы увидите это наглядно, когда посмотрите на любую картинку через объектив потребителя глазами на простоте (измерение аналитика).

Алгоритм оценки визуализации данных.

Алгоритм возможно, будет немного напыщенным, если он применяется здесь. Я разработал набор фильтров и линз через которые вы можете просматривать любую визуализацию данных, чтобы быстро оценить качество.

Возможно, кто-то, читающий этот пост в блоге, поможет нам всем, создав алгоритм машинного обучения, чтобы оценить, является ли Data Viz плохим, хорошим или отличным. 🙂

Размышление о вышеупомянутом конфликте навязчивых идей между потребителем и визуализатором помогло мне разделить оценку визуализаций данных на восемь измерений. Они влияют друг на друга и на все портфолио, но при этом стоят сами по себе.

В формате «Одержимость | [ratings scale] », вот алгоритм оценки данных:

1 . Время для самого важного понимания. [Scale: Fast. Slow. KMN!]

2 . Попытка понять всю графику. [Low. Medium. No Thank You.]

3 . Знаки доверия. [Clear. Non-Obvious. None.]

4 . Ранжирование ключевых сообщений. [Yes. Partial. WTH!]

5 . Объяснение ключевой логики, управляющей графикой. [Super clear. Cloudy. Invisible.]

6 . Выявление нюансов. [Sweet. Some. Sour.]

7 . Визуализатор пытается быть слишком умным. [No, and thank god. Yes, but it is harmless. Yes, sadly.]

8 . Скорее всего рекомендую влиятельным лидерам. [Yes! No. No way.]

Я хочу, чтобы вы прямо заметили:

Я поставил Потребителя данных на первое место

Стимулировал хорошее поведение визуализаторов данных, и…

… Включил результат в конце, потому что activity — это хорошо и красиво, но важно результаты

Я надеюсь поделиться очень конкретным алгоритмом, который заставит ваше критическое мышление течь. Я приглашаю вашу критику и предложения о том, как я могу сделать его еще умнее. Ответьте, пожалуйста.

Лучший способ учиться — практиковаться на реальных примерах. Итак … Давайте сделаем это!

COVID Чего мне следует бояться (!) Визуализации данных.

Несколько недель назад, возможно, не случайно, несколько различных организаций опубликовали наглядные пособия, которые помогают нам понять, что мы можем делать безопасно, а что может причинить серьезный вред.

Я собрал четыре из этих попыток, каждая из которых представляет собой действительно разные способы визуализации почти идентичной информации. Это дает нам идеальный набор данных для применения нашего алгоритма и попутного обучения разборчивым навыкам.

Визуализация данных # 1

Первый рисунок принадлежит неподражаемому Рэндаллу Манро (я очень большой поклонник xkcd!).
У Рэндалла есть уникальный способ передачи сложной информации (купите Thing Explainer !), И этот рисунок ничем не отличается. Он сочетает в себе серьезность, веселье и научную точность.

Как подход, 2×2 работают очень хорошо. Они принуждают к простоте. Вышеуказанная цветовая кластеризация помогает быстрее переходить к самым безопасным или опасным действиям.

С другой стороны, трудно понять все это целиком. Вы можете заблудиться.

Я рассматриваю это как очень серьезный пример, но важно помнить, что цель вышеизложенного включает цель — заставить нас улыбнуться.

Давайте применим наш алгоритм и посмотрим, как этот рисунок работает с нашим жестким, но с любовью, объективом.

1 . Время для максимального важное понимание. [Быстрый Медленный . KMN!]

2 . Попытка понять всю графику. [Низкий Средний . Нет, спасибо.]

3 . Знаки доверия. [ОчиститьНеочевидно Нет .]

4 . Ранжирование ключевых сообщений. [ Да . Частично. WTH!]

5 . Объяснение ключевой логики, управляющей графикой. [СуперясноОблачно Невидимый .]

6 . Выявление нюансов. [ Милый . Несколько. Кислый.]

7 . Визуализатор пытается быть слишком умным. [Нетиславабогу Да, но безвредно . Да, к сожалению.]

8 . Скорее всего рекомендую влиятельным лидерам. [ Да! Нет. Ни в коем случае.]

Технически графика должна пройти № 3, так как это для развлечения, и, возможно, № 5 также. Но я все же оценил его серьезно, чтобы все мы могли попрактиковаться в подсчете очков.

Если здесь применима фраза «большой промах», то это, возможно, № 2, попытка понять всю графику (или, точнее, мультфильм). [19659002] Основываясь на оценке алгоритма, он получил оценку 23/66.

О, я совершенно забыл сказать вам … Я создал небольшую систему подсчета очков, чтобы помочь вам по-настоящему усвоить ключевые сообщения. Те, кто меня знает, не удивятся, что моя система имеет крутой график оценок (#highstandardsFTW!).

Система выставления оценок использует множитель для каждой оценки в приведенной выше шкале. Кроме того, поскольку каждое измерение не имеет одинакового уровня важности, для каждого измерения есть множитель — чтобы эффективно передать мои ценности.

Вот математика…

Это все весело и весело, пока вы не поймете, что есть счет ! 🙂

Важно : Моя цель при создании алгоритма оценки визуализации данных и таблицы оценок не в том, чтобы вы полностью согласились с тем, как я оцениваю каждую визуализацию. Моя цель — научить систематическому подходу, который вы можете применить к этим трудным и сложным задачам.

Надеюсь, вы понимаете, почему я забиваю именно так. Надеюсь, вы согласитесь. Но это желание третичное.

Визуализация данных №2

Второй рисунок взят из всемирно известной «Информация прекрасна» ( IiB ). У них есть одни из самых известных в мире визуализаций данных. (Простой и эффективный: When Sea Levels Attack )

IiB имеет тенденцию создавать графику для больших экранов, мне нужно быть на моем любимом 27-дюймовом мониторе ThinkVision, чтобы читать его оптимально.

В этом Например, вы заметите, что цветовая палитра работает против возможности чтения текста (бирюзовый на темно-сером или чуть светлее на темно-сером).

Спектр от светло-желтого до кроваво-красного кругов с внутренними градациями пытается добавить уровень хитрости, который, возможно, насыщает визуализатор данных за счет потребителя данных.

Как только вы увеличите масштаб до одного часть визуального, вещи становятся читаемыми. Вы теряете полную картину любого раздела. С этой точки зрения, возможно, вы согласитесь, что в том, что находится в пузыре, есть ощущение случайности (проверьте это также на двух изображениях ниже).

Было приятно добавить «факторы риска, которые следует учитывать ”В верхнем левом углу визуализации, которая объясняет логику, управляющую графикой. (Вы можете видеть это более четко в представлении с более высоким разрешением, синий шрифт на сером затрудняет выше.)

Мне нравится тонкая полезная информация советы вроде того, что касается приправ, ниже.

Давайте применим наш алгоритм и посмотрим, как этот рисунок работает с нашим жестким, но с любовью, объективом:

1 [19659020]. Время для самого важного озарения. [Быстрый Медленный . KMN!]

2 . Попытка понять всю графику. [Низкий Средний . Нет, спасибо.]

3 . Знаки доверия. [ОчиститьНеочевидно Нет .]

4 . Ранжирование ключевых сообщений. [Да Частично . WTH!]

5 . Объяснение ключевой логики, управляющей графикой. [Суперясно Облачно . Невидимый.]

6 . Выявление нюансов. [Сладкий Некоторые . Кислый.]

7 . Визуализатор пытается быть слишком умным. [НетиславабогуДанобезвредно Да, к сожалению .]

8 . Скорее всего, порекомендую влиятельным лидерам. [Да! Ни в коем случае.]

Я был так близок к выбору ни в коем случае с точки зрения рекомендации этого рисунка другим (потому что я никогда не буду). В конце концов, IiB — такая огромная организация и такая известная, и так много людей их любят … никоим образом не выглядело слишком против течения.

Я пришел к пониманию, что IiB имеет очень специфическую язык дизайна, структура и философия, которая их определяет. Возможно, сейчас это действует как ограничение.

На основании оценки алгоритма он получает балл 7/66.

Вот математика:

Важно, чтобы данные были настолько важны — для такого широкого потребления (вся планета) — необходимо выяснить, как достичь необычайно высокой простоты и эффективного стандарта связи. В остальном, визуализатор данных продолжает упражняться в самоудовлетворении.

Визуализация данных №3

Третий рисунок сделан профессором Саскией Попеску, доктором Джеймсом П. Филлипсом и доктором Иезекиилем Эмануэлем.

Я большой поклонник доктора Эмануэля. Он был специальным советником по политике здравоохранения в администрации Обамы и сыграл важную роль в принятии Закона о защите пациентов и доступном медицинском обслуживании (также известного как Obamacare). За это он испытывает мою вечную благодарность от имени тех, кого общество и политики обычно не слушают в Соединенных Штатах.

Индекс риска Covid-19 четко определяет логику, лежащую в основе изображения: замкнутое пространство толпы продолжительность взаимодействия и принудительный выдох .

Обратите внимание, что IiB также имел некоторые из этих факторов, принудительный выдох здесь является дополнением (неудивительно, что врачи выдвинули это на первый план.)

Цвета на графике связаны с интенсивностью риска, зеленый — низкий, красный — высокий. Просто, прямо, эффективно.

Я не большой поклонник гигантского логотипа компании на графике, как вы видите ниже в «шестиугольнике». Я верю: больше белого пространства = больше мира.

Учитывая душераздирающие дебаты в США, я действительно оценил бонусный призыв к действию вверху, чтобы носить маску.

Вы заметили знаки доверия внизу? Действительно красиво.

Как и в случае с графикой IiB, этот предназначен для отображения на большом экране. Я аплодирую команде за то, что они убедились, что каждый сегмент читаем — никаких причудливых цветов шрифтов и причудливого фона как демонстрация сообразительности визуализатора.

Люди в моей команде знают, что я испытываю особую ненависть к иконкам. Они добавляют беспорядка. В данном случае я поддерживаю решение о включении значков.

Например, без необходимости читать какой-либо текст, я знаю, что работа в офисе сопряжена со средним / высоким риском, а участие в групповых религиозных службах находится в рекомендую, пожалуйста, избегайте категории — даже в небольшой версии выше и, конечно, в увеличенной версии ниже.

Давайте применим наш алгоритм и посмотрим, как этот рисунок работает с нашим жестким, но с любовью, [19659093].

1 . Пора сделать самое важное. [ Быстро . Медленный. KMN!]

2 . Попытка понять всю графику. [Низкий Средний . Нет, спасибо.]

3 . Знаки доверия. [ Очистить . Не очевидно. Нет.]

4 . Ранжирование ключевых сообщений. [Да Частично . WTH!]

5 . Объяснение ключевой логики, управляющей графикой. [ Супер ясный . Облачно. Невидимый.]

6 . Выявление нюансов. [Сладкий Некоторые . Кислый.]

7 . Визуализатор пытается быть слишком умным. [ Нет, и слава богу . Да, но это безвредно. Да, к сожалению.]

8 . Скорее всего, рекомендую влиятельным лидерам. [ Да! Нет . Ни в коем случае.]

Этот рисунок стал вирусным в соцсетях, и заслуженно. Поскольку CV-19 вспыхивает во многих странах (к сожалению, мы в США все еще проходим через волну первую), я надеюсь, что вы воспользуетесь приведенным выше рисунком, чтобы оставаться в безопасности — и поделитесь им со своими друзьями и семьей, чтобы они также может оставаться в безопасности.

На основе оценки алгоритма он получает балл 50/66.

Вот математика:

Ясно, что визуализатор данных может гордиться , достигая уровня навязчивых идей, которые частично совпадают с навязчивыми идеями Потребителя данных.

Визуализация данных №4

Последний рисунок был разработан врачами из Целевой группы Техасской медицинской ассоциации по COVID-19 и Комитета TMA по инфекционным заболеваниям.

Мне это нравится.

Это просто. Легко переваривается. В этом нет ничего милого (ура!). Нет кругов, через которые можно прыгать. Никаких дорогостоящих специалистов по визуализаторам данных по шрифтам не наняли. Графика не слишком старается.

Вероятно, она была разработана Докторами из ТМА. Это безумно скучно. Все, что это… Эффективно .

Практически единственная легкая критика, которую я могу сделать, это то, что, возможно, в соответствии с (по иронии судьбы) либеральной позицией штата Техас, когда дело доходит до борьбы с Ковидом, этот рисунок снижает планку рискованности по сравнению со всеми другими источниками. Я разделяю это как небольшой красный флаг, но он является смежным с техническим анализом данных, который мы проводим сегодня.

Логика, управляющая графикой, интегрирована в ядро ​​графики, как становится ясно ниже. Чтобы понять визуальное представление, не нужно прилагать никаких усилий. Начни сверху, продолжай. Цвета и полосы помогают вам в этом.

Даже при таком маленьком размере он хорошо читается …

Когда информация изложена так четко, на вас бросаются другие вещи, заставляющие задуматься (отличная черта отличной визуализации данных).

Все нижеперечисленные пункты — 8 или 9, но учтите ошеломляющие различия.

Посещение бара так же рискованно, как и религиозная служба с более чем 500 прихожанами! И оба они немного рискованнее, чем есть буфет !! Вы из любопытства сомневались в данных. Хороший знак.

 Высокий риск TMA COVID

Давайте применим наш алгоритм и посмотрим, как этот рисунок работает с нашим жестким, но с любовью объективом:

1 [19659020]. Время для самого важного озарения. [ Быстро . Медленный. KMN!]

2 . Попытка понять всю графику. [ Низкий . Средняя. Нет, спасибо.]

3 . Знаки доверия. [Очистить Неочевидное . Нет.]

4 . Ранжирование ключевых сообщений. [ Да . Частично. WTH!]

5 . Объяснение ключевой логики, управляющей графикой. [ Супер ясный . Облачно. Невидимый.]

6 . Выявление нюансов. [ Милый. Несколько. Кислый.]

7 . Визуализатор пытается быть слишком умным. [ Нет, и слава богу . Да, но безвредно. Да, к сожалению.]

8 . Скорее всего рекомендую влиятельным лидерам. [ Да! Нет . Ни в коем случае.]

На основании оценки алгоритма он получил балл 64/66.

Вот математика:

Графика ТМА послужила искрой для написания этого информационного бюллетеня.

Миру нужен был простой способ эффективно передавать, в данном случае буквально, информацию, которая может спасти жизни.

Хотя в бизнес-среде редко бывает так много, я надеюсь, что TMA вдохновит вас на то, чтобы вы не упускали из виду то, что важно при работе над визуализацией данных: понимание данных.

Итог.

Как вы справляетесь с конфликтом между вашими целями как визуализатора данных (и стимулами, которые ваш работодатель создает для вас) и потребителем данных? Хотя ответ кажется очевидным, его невероятно сложно выполнить. Я надеюсь, что вы воспользуетесь оценкой визуализации данных, чтобы убедиться, что вы, ваша команда, сначала решите проблему Потребителя данных, а затем себя.

Если у вас есть графика с оценкой выше 60, я бы с удовольствием их увидел! (Если ими можно поделиться.)

Всего наилучшего.

PS: Бонусный урок жизни:

Небольшое количество людей наверняка заметило бы, что идеальный результат алгоритма равен 66 (все отлично), и оценка была достаточно хорошей 22 (все можно оптимизировать). Эта огромная пропасть отражает жизнь (и мою философию).

Есть тысячи аналитиков, которые остановятся на хорошем, в конце концов, это хорошо. Возможно, сотня или меньше проделают тяжелую работу, необходимую, чтобы добиться успеха. Они будут править (деловым) миром.

#nowyouknow

Комментарии запрещены.