Pull to refresh

Comments 37

Ловите маркетолога!

Графики действительно стали красивее, понятнее, и нагляднее, но для оценки, получения конкретных значений, вся эта красота не нужна, нужны абсолютные значения, временные интервалы, горизонтальные-вертикальные линии привязанные к конкретным показателям.

Excel 20 лет (с 1995 г.) был законодателем стиля в диаграммах. Но теперь он утратил первенство и "плетется в хвосте". На самом деле миру нужны и красивые графики, и быстрые, но в разных местах. Первые дают ответы, вторые - скорее порождают новые вопросы.

Первые идут в презентации, годовые отчеты и дэшборды (на них смотрят дни-месяцы). В них принято хотя бы немного приврать, и это там удается сделать незаметно.

Вторые видны в IPython-notebooks у дата-сайентистов (на них смотрят считанные секунды, но и строят их по сотне в день, а то и в час). Врать в них не удается - код и данные расположены выше в ячейках и валидируются повторным выполнением кода.

Но недавно появились и третья сила - диаграммы для рассказов, вобравшие в себя все лучшее. https://ipyvizzu-story.vizzuhq.com/latest/examples/usbudget/ жмем на FullScreen и стрелку вправо/влево. Ничего круче в мире диаграмм пока нет.

Огромным плюсом Python+JS является возможность визуализировать плавной анимацией сам "переход" мышления: от общего - к частному, от структурного (верт.) - к анализу динамики (гориз.), от выброчного - к полному (и обратно), без главного компонента - и с ним. Развидеть это не получится.

Вот это о чём я и говорю в своём комментарии ниже - а меня минусуют :-( хотя может минусуют за мою слепоту об EXCEL и заголовке - но это вообще тогда кощунство

если очень любите анимацию, вам наверное понравится а-ля MS PivotViewer https://seajax.github.io/
справа, вверху нужно выбрать столбиковую диаграмму

Диаграмма по ссылке во втором состоянии очень вольно обошлась с подписями оси ординат (60B$ - > 120B$).

))

Да, пожалуй это баг, черкану им. При разложении факторов во всяких ARIMA довольно сложно придумать подписи для Y, а сравнимость полезна. Я бы вообще убирал подписи.

возможность визуализировать плавной анимацией

И в чем польза плавной анимации? Теряется смысл оси ординат, уплывают плавно нулевые значения. Если остановить анимацию в промежуточном положении, на экране вообще странные данные не имеющие смысла математического (данные пересекаются и это на отражено на оси ординат), только художественный эффект. Это противоречит смыслу минимализма. Может пригодится тем кто плохо понимает смысл диаграммы развернутой по годам.

Вот тут анимация по годам, но в каждый момент времени данные валидны.

https://youtu.be/F8Bpt9sXN7Y?si=f0pDNe079zEEur8w

Польза плавной анимации - в сохранении контекста. Глаз "помнит" что именно последний stack-бар превратился в пирог или бар-граф. Поелозив туда-обратно можно вбить инфу в мозг даже тем кто ~за 80~, настоящим стейкхолдерам (акционерам). Резко сменяющиеся слайды такого полезного эффекта не имеют.

А мне вариант сдвинутых столбцов понравился (но до ума он так графически и не доведён, хотя в тексте всё верно говорится). Но сама статья не понравилось - вот текстовые описания идей в статье хорошие, порой картинки хорошие - но в целом - текст плохо коррелирует с изображениями тут же приводимых диаграмм; так же не хватает некой последовательности в в этих примерах к рассуждениям. Приводится несколько абсолютно разных примеров - но границы между ними размыты. Вообще всё как-то размыто, целостности я не смог заметить - от того визуально очень сложно всё воспринимать. Хотя на слух всё не так плохо. Но это не выступление на конференции, которое в первую очередь воспринимают ушами - а статья, которую воспринимают глазами - и вот тут всё как-то плохо получилось - т.е. тема про графические представления плохо воспринимается глазами :-(

Ну и EXCEL - при всей мощи (в умелых и усердных руках) сего долбанного инструмента мелкомягких - для визуализации диаграмм инструмент сильно отстаёт от специализированных сервисов. Хотя да - для офисных и домашних хомячков это практически единственный доступный инструмент произвольного построения диаграмм!

Ну и в теме приводятся только статические диаграммы. И совершенно не раскрыта тема анимации и динамических диаграмм - да - это уже далеко не EXCEL и совсем не для хомячков - и вообще да - это уже тема другой статьи!

P.S.

Если честно, когда открывал заголовок - думал статья будет для разработчиков - как рисовать красивые диаграммы доступными им средствами и не на EXCEL. Хотя да, на VBA можно и на EXCEL - но ограничения платформы данной электронной будут практически те же.

P.P.S.

Ну а если о говорить об офисных инструментах на русскоязычном ресурсе - то, в первую очередь стоит подразумевать российскую аудиторию (прошу не кидать кашки - да я знаю, что аудитория данного ресурса далеко не вся российская, но всё же актуальность для россиян в таких вопросах тоже очень тут высока) как мне кажется, в нынешнюю эпоху импортозамещения говорить об одном только EXCEL уже явно моветон. И даже если не не зацикливаться только на российских альтернативах продуктов Микрософт (кстати, среди них тоже есть не только EXCEL и Office - где можно строить графики), то есть ещё и LibreOffice и другое ПО анализа данных, и различные online-сервисы (и их offline-версии), где графики строятся не хуже чем в EXCEL - статья остаётся слишком упрощённой (хотя её автор умудрился сумбурно оформить) без альтернативных подходов по другим продуктам. Всё же статья, таки, о дизайне - а не об инструментах EXCEL

>Если честно, когда открывал заголовок - думал статья будет для разработчиков - как рисовать красивые диаграммы доступными им средствами и не на EXCEL.
Странно. Я специально в заголовке указал Excel, чтобы не возникали ложные ожидания.

Прошу прощения за свою слепоту - но всё мой комментарий был несколько шире - чем претензия к узконаправленности только на EXCEL

Возникло ожидание, что будет хорошо комментированный макрос!

Не, ну советы нормальные, как минимум заставят пользователей поиграться с этими настройками, хотя много чего еще можно было бы рассказать (разбросы стандартного отклонения у точек, аппроксимирующие линии, те же круговые и трехмерные диаграммы не раскрыты вообще). Для презентации годится. Для строгого формализованного представления данных (например в научных статьях) нужны немного другие правила - но там и инструменты обычно другие, ориджин, призма.

Если в тексте научной статьи вставлен график Excel, то это означает только одно. Ничего полезного в данной статье нет. А считать убожества Excel законодателям стиля в диаграммах.... Тут и сказать то нечего

Ну почему, настолько категорично? Если статью писали физики, то да, они какой-нибудь ориджин (о боже!) используют, так он в исходном виде не сильно лучше экселя бывает. А те, кто в стороне от расчетов, так им за один график корячиться нет желания, хорошо если красиво постараются сделать.

Вот на Origin тоже попрошу не наезжать 😎. Я тот самый физик, который пользовался Origin до 2004 года (кажется, версия 7.1 была последней, что я застал). Там было практически всё – можно было делать в осях многочисленные разрывы, строить 3D-графики с плавным переходом цветов и подсветкой (очень похоже на результат OpenGL), был свой скриптовый язык (не пользовался). Цена на него была, правда, конской.

Честно сказать, мне до сих пор непонятно, почему в Экселе такие убогие графики. Вроде с 1997 года прошло уже 25 лет, а графики на том же уровне.

В продвинутом виде как раз понятно, что профессиональный инструмент (ориджин) лучше, наверное его и сейчас сложно бесплатными профессиональными инструментами одолеть в части сложных графиков (те самые 3Д). Я где-то в те же годы сталкивался с тем, и имхо, ориджин с нуля малоинтуитивен и, скорее всего, таким и остался, проще говоря - типичный профессиональный академический софт, может дать отличный результат, только нужно соотвествующую голову и руки за него сажать.

Возможно потому что есть power bi?

Поддержу столь эмоциональное и не очень популярное мнение.
Оно статистически подтверждается, хотя и исключения, конечно, бывают: "полезного в данной статье" может и быть :)

Естественно, учёным негоже Word / Excel.
Разумеется, уважающий себя аспирант освоит LaTeX / python и строки
import matplotlib.pyplot as plt
import numpy as np
для него - как "Отче наш" :)

Но и "убожествам Excel" нашлось место под солнцем.
Например, детишкам в школе вы же не станете преподавать LaTeX / python? (Это только в СУНЦах в 11-х классах можно )) А "убожества Excel" - хотя бы половину из этой статьи - показать можно и в 5-6 классах, и дети будут очень рады, что табличку типа
Вася 5
Петя 3
Маша 4
Коля 5
можно в пару кликов превратить в диаграмму!

Так что при всех достоинствах LaTeX / python, автору статьи про Excel - несомненно плюсик.

ладно дети. Я вам скажу, что минимум половина, а скорее и все 80% отчетов с графиками которые создаются в недрах любой крупной организации (от банка до университета, от огромного завода до сети киосков с шаурмой) будут в Экселе !!

И любая! аналитика сперва рождается в экселе и живет там долгое время пока возможно не будет переписана на PowerBi

Вот поэтому я выше в комментарии и указал - что хорошо бы говорить об Excel, но и альтернативы сразу приводить на другом ПО - того глядишь народу понравится и он начнёт осваивать другие горизонты, и это соотношение изменитсяю.

Excel - на мой взгляд ужасный продукт - но очень привычный и распространённый - от того и удобный! Но это не значит, что его трон вечен!

он не ужастный, он лучший (и единственный) в своем классе - self-service analytics

В классе дерьма тоже можно быть премиальной какашкой! Особенно когда в этом классе нет золотой идеальной конфетки!

Но лично я часто плююсь, когда пытаюсь использовать Excel. Его юзабилити очень хромает - но да лет за 20 небольшой прогресс есть - но лет за 10 он уже очень незаметный!

  1. Сформулируйте идею (от данных к идее), которую хотите донести при помощи визуализации.

Это самая главная мысль в статье. Именно так и есть - сперва формулируют идею, а потом под нее подгоняют визуализацию (а заодно и данные). Это самая главная суть любой аналитики.

Хорошо но не до конца - нет про использование двух шкал на одном графике (например для отображения по второй шкале процентов)

Почему то мне на первом скриншоте вполне нормально смотрелся график

Рисунок 12а, там где доля продаж мониторов с разными диагоналями. Нет смысла сортировать столбцы по высоте столбцы надо отсортировать по размеру диагонали. Взгляд всё также легко выцепит лидера и его цифры, но при этом сразу и гистограмма покупок по диагоналям в целом.

Тема поднималась и раскрывалась уже неоднократно, в том числе на хабре

Из моих любимых работ на эту тему: статья https://habr.com/ru/articles/323230/ (Упрощение дизайна отчетов по стандарту IBCS) и книга Storytelling with Data (обзор на хабре: https://habr.com/ru/companies/true_engineering/articles/422093/)

Спасибо за ссылки. Ранее не сталкивался со стандартом IBCS. Обязательно почитаю. Думаю, что и указанные вами статьи, и моя статья полезны для аудитории.

Есть хорошая книга для тех, кто хочет изучить тему визуализации данных - Джин Желязны "Говори на языке диаграмм"

Эта книга несколько раз упоминается в статье))

рис.18: к-т детерминации равен 0,75 (против 0,7 по Экселю); угловой к-т регрессии равен 0,9295 (против 0,9 по Экселю)

Вы использовали данные в приложенном Excel-файле?
Я проверил наклон регрессионной кривой расчетом в лоб по формуле:








Подтвердил значение m = 0,8646.
Проверьте ваши расчеты.

С учётом дросселя Тейла-Сена наклон "m" может увеличиться: m(i)=sqrt[1+(Dy-Dx)^2/(2mDx)^2] +- (Dy-Dx)/2mDx; i=1; i=2.

Интересное замечание. Спасибо. Я ранее не использовал робастные методы. Почитал подробнее про оценочную функцию Тейла-Сена, и выполнил расчеты для данных на рис. 18. Поскольку выбросов нет, можно было ожидать, что наклоны по методу Тейла-Сена и наименьших квадратов (МНК) будут близки. Действительно метод Тейла-Сена дал чуть большее m = 0,8947. На 3,5% больше чем МНК.

Sign up to leave a comment.