Design Basics
Datenvisualisierung – Wie du schlechte Grafiken vermeidest

Datenvisualisierung – Wie du schlechte Grafiken vermeidest

Jesse Schweizer
22/12/2020
Design Basics

Die digitale Welt ist heute unheimlich wichtig. Wir arbeiten, lernen und kommunizieren durch sie. Wie wir die von uns generierten Daten gestalten ist extrem wichtig, damit wir einen Nutzen aus ihnen ziehen können und dennoch machen es viele falsch.

Das Jahr ist 2020, die meisten von uns sitzen Zuhause und können nur noch durch den Bildschirm mit unserer Umwelt interagieren. Die Corona-Pandemie hat uns vieles gelehrt, darunter auch, wie wichtig die digitale Welt heutzutage ist. Wir arbeiten, lernen und kommunizieren mit ihr und durch sie. Die Daten, die wir dabei generieren, können uns viel über die verschiedensten Dinge verraten, von gesellschaftlichen Trends und wirtschaftlichen Entwicklungen bis hin zum Kaufverhalten von Kunden. Um Daten jedoch auch nachvollziehen zu können, ist es wichtig, sie auf eine Art und Weise darzustellen, die für Menschen sinnbringend ist. Hier kommt die Informationsvisualisierung ins Spiel.

Laut einer Schätzung von PwC befinden sich im heutigen Internet rund 44 Zettabytes an Daten (während es 2019 «erst» 4.4 ZB waren). Diese Zahl wird für die meisten Menschen nichts bedeuten, weshalb ich es etwas veranschaulichen möchte: Meine Internetgeschwindigkeit Zuhause beträgt 107 Megabits/s. Um 44 ZB herunterzuladen, würde ich 116 Millionen Jahre benötigen! Selbst mit der schnellstmöglichen Internetverbindung der Welt, für welche WissenschaftlerInnen aus Australien mit 44.2 Terabits/s den Rekord aufgestellt haben, würde man trotzdem noch 272 Jahre brauchen! Der Punkt: Wir produzieren eine Unmenge an Daten und das immer schneller. Dennoch machen Unternehmen nicht richtig von den ihnen verfügbaren Daten gebrauch. Eine Forrester Umfrage hat ergeben, dass 60-73% der verfügbaren Daten in Firmen während der Analyse ungenutzt bleiben.

Die menschliche Aufnahmefähigkeit

Wir nehmen die Welt hauptsächlich mithilfe der fünf klassischen Sinne war. Der dänische Wirtschaftsjournalist Tor Nørretranders hat folgende Grafik erstellt (die, wie wir noch sehen werden, einige Makel hat), in der er die unterschiedlichen Aufnahmegeschwindigkeiten der Sinne darstellt:

Unsere Augen nehmen demzufolge mit Abstand am meisten Informationen auf, nämlich 1250 MB/s. Dies ist 10-mal so viel wie der zweitplatzierte Tastsinn, und 100-mal so viel wie das Gehör und die Nase. Der kleine weisse Balken ganz unten rechts widerspiegelt, wie viel der ständig aufgenommenen Information wir tatsächlich bewusst wahrnehmen, und zwar nur 0.7%.

Was ist Informationsvisualisierung?

Wie der Name dies vermuten lässt, geht es darum, Informationen visuell wiederzugeben. Nicht nur können wir Informationen optisch am schnellsten verarbeiten, Visualisierungen können uns auch Neues vor Augen führen, an das wir zuvor noch gar nicht gedacht haben. Oftmals können so Fragen beantwortet werden, die gar nicht gestellt wurden. Je mehr Werkzeuge zur Visualisierung eingesetzt werden, desto mehr können wir aus einem Datenset lernen.

Im Alltag begegnet uns Informationsvisualisierung ständig, z.B. in der Form von Kuchen-, Säulen- oder Liniendiagrammen. Doch hast du dir schon einmal Gedanken darüber gemacht, was ein gutes Diagramm ausmacht? Oder ist dir schon einmal ein Diagramm begegnet, dass für mehr Verwirrung als Belehrung gesorgt hat?

Prinzipien der Informationsvisualisierung

Eine Grafik kann nach folgenden Kriterien bewertet werden:

Wie viel stellt die Grafik dar? Wie wahr ist die Darstellung? Wie effizient wird dargestellt?

Eines der berühmtesten Beispiele einer gelungenen Grafik wurde 1869 vom Franzosen Charles Minard zu Napoleons Invasion in Russland erstellt.

Darauf wird die Route der französischen Armee nach Moskau und zurück abgebildet, ebenso wie die Temperaturen, die auf dem Rückweg geherrscht haben. Die Exzellenz dieser Grafik setzt sich aus verschiedenen Elementen zusammen:

Übersichtlichkeit & Detail

Ein Blick genügt, um einen guten Überblick über die dargestellte Materie zu bekommen. Man sieht, welcher Weg in etwa genommen wurde, so wie die relative Abnahme des Heers mit dem Fortschritt der Invasion. Ebenso ist direkt ersichtlich, dass fallende Temperaturen auf dem Rückweg zu fortwährenden Verlusten beigetragen haben.

Die Grösse der Armee ist numerisch exakt wie auch visuell durch die Breite grob dargestellt. Das Temperaturgefälle, das ebenfalls numerisch exakt sowie durch einen Graphen grob dargestellt ist, ist durch Linien mit der korrespondierenden Position der zurückkehrenden Armee verbunden. Linien eignen sich besonders, um die Zusammengehörigkeit von Elementen klarzumachen.

Mehrdimensionalität

Die Grafik enthält Informationen zu mehreren Variablen: Der geographischen Lage, der Zeit, der Anzahl und der Temperatur. Mit jeder hinzukommenden Dimension steigt die Anzahl an erkennbaren Zusammenhängen um ein Vielfaches, und desto mehr kann entdeckt und vermittelt werden.

Klarheit

Die Grafik enthält nur essenzielle Elemente, unnötiges wurde weggelassen. Der Fokus liegt auf dem, was vermittelt werden soll.

Wie versprochen, komme ich nochmal auf die Grafik von Tor Nørretranders zu sprechen. Bei meiner Recherche zu diesem Artikel ist mir aufgefallen, dass sie eine der, meiner Meinung nach, wichtigsten Prinzipien zur Erstellung von Grafiken verletzt: Die dargestellten Proportionen unterscheiden sich stark von den tatsächlichen Proportionen, die sich aus den numerischen Werten ergeben. Um dies klar zu machen, habe ich die Grafik nachgemacht, sodass die Flächen auch mit den entsprechenden Zahlen übereinstimmen:

Wie wichtig ist unser Sehsinn wirklich?

Aufgrund der Verfälschung beim Original ist nicht direkt ersichtlich, wie dominant unser Sehsinn tatsächlich ist. Ebenso werden dem Hör- und dem Riechsinn zu viel Gewicht gegeben. Numerisch ist die Aufnahmegeschwindigkeit des Sehsinns 100 Mal höher, doch die repräsentative Fläche ist nur 10 Mal grösser. Der kleine weisse Balken unten rechts, der darstellen soll, wie viel wir bewusst wahrnehmen, verschafft den Eindruck, wir würden praktisch schlafwandelnd durchs Leben laufen. Obwohl er 0.7% der gesamten Fläche einnehmen soll, beträgt die tatsächlich eingenommene Fläche nur 0.028%, also rund 25 Mal weniger. (In der überarbeiteten Version habe ich die entsprechende Fläche weiss umrandet.)

Mal abgesehen von meinen mentalen (Un)Fähigkeiten, liegt ein Grund darin, wieso mir die Diskrepanz zwischen Daten und entsprechender Repräsentation so spät aufgefallen ist, dass Fläche als Vergleichsmethode eher ungenau ist. Gemäss dem Artikel «Graphical Perception: Theory, Experimentation, and Application to the Development of Graphical Methods», der 1984 im Journal of the American Statistical Association erschienen ist, werden die verschiedenen Vergleichsmethoden von genau nach ungenau wie folgt qualifiziert:

Position, Länge, Winkelneigung, Fläche, Volumen, Krümmung, Schattierung

Was man nebst dem Gebrauch von Schattierung zu Vergleichszwecken und 3D-Kuchendiagrammen ebenfalls unterlassen sollte, ist, Grafiken mit Unnötigem zu füllen. Was selbstverständlich klingen mag, wird in der Praxis leider oftmals missachtet.

Wie eine Grafik nicht aussehen sollte (Quelle: http://www.koreaherald.com/view.php?ud=20140923000921)

Diese Grafik ist ein gutes Beispiel für den Begriff «chartjunk», den der amerikanische Statistiker Edward Tufte, an dessen Werk dieser Artikel anlehnt, geprägt hat. Er beschreibt damit das Phänomen von nutzlosen Elementen in Grafiken, welche in keiner Weise zur Informationsfülle beitragen und somit nur ablenken. In diesem Beispiel wird dadurch sogar Information versteckt, da viele der zeitlichen Angaben nicht mehr lesbar sind. Allgemein sollte man von 3D-Darstellungen ablassen, wenn sie nicht zwingend nötig für die Datenrepräsentation sind, da sie nicht nur perspektivisch Verwirrung stiften können (z.B. in den oben verpönten 3D-Kuchendiagrammen), sondern in der Regel, wie in unserem Beispiel, auch nichts Positives zur Ästhetik beitragen.

Ein 3D-Pie-Chart sollte nicht verwendet werden. Balkendiagramme liefern bessere Abschätzungen in der Wahrnehmung und 3D-Darstellungen können die Daten verzerren.

Worauf man bei der Kreation oder Verwendung von Grafiken auch achten sollte, ist, wofür und in welchem Medium sie letztendlich eingesetzt werden. So ist es für gewöhnlich zu empfehlen, wenn möglich, Grafiken mit hilfreichen Erklärungen zu versehen, in einer PowerPoint-Präsentation hingegen ist von viel Text abzuraten, da es dem Publikum nicht zumutbar ist, der Sprecherin/dem Sprecher zuzuhören und gleichzeitig längere Textabschnitte zu lesen. Es ist besser, die Grafik simpel zu halten, damit sich die Zuschauer voll und ganz auf die Sprecherin/den Sprecher konzentrieren können und nicht die PowerPoint Präsentation die Rolle des Referenten übernimmt.

Es gibt viele Dinge, die beachtet werden müssen, wenn man eine Grafik gut und effizient gestalten möchte. Zumeist bringt einen das Mantra weniger ist mehr in punkto grafische Gestaltungsextravaganz schon viel weiter. Für den Abschluss habe ich hier noch einige wichtige Punkte aufgelistet, die man beachten sollte, wenn man seine Grafik so verständlich und ansprechend wie möglich machen möchte:

Wörter sollten von links nach rechts laufen und ausgeschrieben werden.

Kleine Beschreibungen helfen, die Daten zu erklären.

Die Grafik sollte interessant wirken und Kuriosität hervorrufen.

Legenden sollten vermieden werden, Beschriftungen sind direkt auf der Grafik zu machen.

Wenn Farben verwendet werden, sollten sie so gewählt sein, dass es auch für jene mit Farbsehschwächen Sinn macht.

Da ich selbst eine Farbsehschwäche habe, weiss ich nur zu gut, wie nervend es ist, wenn farbabhängige Legenden benutzt werden! Deshalb ist es auch wichtig, Elemente direkt zu beschriften.

Schriften sollten klar, präzise und unscheinbar sein.

Gross- und Kleinschreibung verwenden