By JOANNA SARATA (Predictive Solutions)

WENN ES UM DIAGRAMME GEHT, IST „WENIGER“ NICHT UNBEDINGT BESSER UND „MEHR“ KANN OFT ZU EINER FUNKTIONELLEREN DATENVISUALISIERUNG FÜHREN.

Ich plädiere nicht für eine Revolution in der Diagrammarchitektur, sondern möchte Sie ermutigen, über eine effektivere Nutzung des Diagrammplatzes nachzudenken, die den Informationswert der Visualisierung verbessert, aber die Klarheit der Botschaft nicht beeinträchtigt.

Planen Sie den Kauf eines neuen Autos? Wenn ja, dann könnte Sie das folgende Schaubild und Beispiel interessieren, das meiner Meinung nach nicht nur Autofahrern klar sein sollte. Wir haben einen Datensatz, der von einem Analysten erstellt wurde, der den Kauf eines neuen Autos plant. Er enthält u. a. die Preise der einzelnen Modelle und Daten zur Motorleistung.

Wir haben eine einfache scatter cloud mit zwei quantitativen Variablen. Der Analyst untersucht die Beziehung zwischen dem Preis eines Neuwagens und seiner Leistung, gemessen in Pferdestärken. Diese Visualisierung zeigt uns, dass die Verteilung der Punkte zwar auf eine nicht lineare Beziehung hindeutet, aber im Allgemeinen gilt: je mehr PS, desto teurer das Auto.

Was könnte uns helfen, die Grafik besser zu verstehen? Da es gängige Praxis ist, die Verteilungen der einzelnen Variablen zu betrachten, wenn man eine Beziehung zwischen zwei Variablen untersucht, warum sollte man nicht die Verteilungen in der gleichen Darstellung zeigen? Hier kommen die Ränder ins Spiel. Werfen Sie einen Blick auf das nächste Diagramm.

Ich habe eine Darstellung der Verteilung der beiden Variablen in Form von Boxplots auf ihren jeweiligen Rändern hinzugefügt. Was sagt uns das? Die Variable „Preis“ ist eindeutig rechtsschief, wobei 50 % der Beobachtungen innerhalb des Preises von 20 Tausend Dollar liegen. Dies geht aus dem Kasten am rechten Rand hervor. Beobachtungen über 55 Tausend Dollar sind Ausreißer (markiert als Punkte), und über 75 Tausend Dollar sind Extreme (markiert als Sterne).

Im Falle der PS, die ebenfalls rechtsschief sind, gibt es nur einen Ausreißer und ein Extrem, ebenfalls in den oberen Bereichen des Wertes.

Mit den hinzugefügten Boxplots wurde die Aussagekraft der Visualisierung verbessert und die Ausreißer wurden leichter identifizierbar, wobei die Übersichtlichkeit der Darstellung selbst erhalten blieb.

Was ist Ihre Idee für die Verwendung von Chart Margins?

Pin It on Pinterest

Share This