5.1 Farblegende, Wertklassifikation
Problemstellung
Die Darstellung verschiedener Kennzahlen in Form von statistisch-thematischen Karten ("Choroplethenkarten") erfordert eine Zuordnung von Kennzahlenwerten der regionalen Einheiten zu Farben.
Allgemeine Anmerkungen
- Oft wird hierzu eine Klassifikation der Datenwerte vorgenommen (z.B. in 5 oder 7 Klassen), und diese Klassen werden mit einem bestimmten vorgegebenen Farbschema dargestellt.
- Laut Literatur gibt es dabei keine generell "beste" oder bevorzugte Methode zur Darstellung (Anzahl Klassen, Methodik der Klassenbildung); die allgemeine Empfehlung wäre, die Methode konkret nach den jeweiligen Daten zu richten.
- Für den Tiroler Gesundheitsdatenatlas sollte eine einheitlich durchgängige Methode verwendet werden; dazu war ein Verfahren wünschenswert, das für sehr unterschiedliche Kennzahlen (Raten, Prozente, Lebensjahre,...), Datenverteilungen und Regionsanzahlen gleichermaßen geeignet ist.
Gewählte Methode: "unclassed maps"
- Es erfolgt keine vorgegebene Klassenbildung der Datenwerte, sondern die Stärke des Farbtons ("Transparenz") in einer Region wird individuell in Abhängigkeit vom Wert der Kennzahl festgelegt (Anmerkung: dies entspricht dem Extremfall, dass jeder Wert eine eigene Klasse hat).
- "Transparenzformel":
a ... gewünschte Transparenz des Minimalwertes (vorzugeben)
x ... Datenwert
min, max ... Minimum und Maximum der Datenreihe
Transparenz(x,a) = a + (100-a)*(x-min)/(max-min)
z.B. für a = 5%: Transparenz( x ) = 5 + 95*(x-min)/(max-min) - Damit erfolgt eine Normierung auf das Intervall [a, 100]; die höchste und die niedrigste Farbintensität entsprechen in jeder Karte also dem jeweils höchsten und niedrigsten Datenwert.
Im Beispiel hat die Region mit dem Minimalwert eine Farbintensität von 5%, diejenige mit dem höchsten Datenwert eine von 100%.
Vor- und Nachteile der gewählten Methode
[+] Universell einsetzbar, auch für verschiedene Anzahlen dargestellter Regionen (ob 4 Versorgungsregionen, 9 Bezirke oder 37 Planungsverbände) gleichermaßen brauchbar.
[+] Die Rangreihenfolge der Datenwerte wird gut wiedergegeben.
[-] Es gibt in jeder Karte immer eine hellste und eine dunkelste Region, die gesamte Farbskala wird auch bei regional praktisch identischen Datenwerten ausgeschöpft.
Balkendiagramm der Regionen als Legende
Um den zuletzt genannten Nachteil zu entschärfen, wird zu jeder Karte immer auch ein Balkendiagramm miterstellt, in welchem die Werte der einzelnen dargestellten Regionen der Größe nach absteigend geordnet wiedergegeben werden. Daraus ist die Streubreite der jeweiligen Datenreihe ersichtlich, und es kann abgelesen werden, wie weit die Werte der einzelnen Regionen tatsächlich auseinander liegen (insbesondere, ob die Datenwerte der besonders dunklen oder hellen "Flecken" tatsächlich weiter von den anderen abweichen).
Dieses Balkendiagramm ist zugleich auch die Farblegende für die Datenwerte in der Karte.