Hast du wirklich mehr Ahnung von Daten als Donald Trump?
Warum nicht nur dem US-Präsidenten während der Pandemie mehr Datenkompetenz gut täte.
Für jeden hat sich während der Coronapandemie etwas geändert. Ich zum Beispiel habe meinen Umgang mit Medien verändert – vor allem, was die Coronaberichterstattung angeht. Warum? Vielleicht gibt die Auswahl folgender Schlagzeilen die Antwort preis:
All diese Überschriften erschienen im Abstand von 3 Tagen zueinander. Balkan, Brasilien, USA – dort soll Corona derzeit jeweils »am schlimmsten« wüten.
Welches Land hat Corona wirklich »am schlimmsten« getroffen? Diese Frage ist offenbar nicht so trivial, wie es zunächst scheint. Ein datenkritischer Blick auf 3 Schlagzeilen während des Lockdowns soll dir dabei helfen, dir selbst ein Bild machen zu können.
Der Trump in uns – Warum du Zahlen stets relativ sehen solltest
Glaubt man vielen Berichten der letzten Wochen, schneidet niemand auf der Welt bei der Reaktion auf die Pandemie derzeit schlechter ab als das Land von »The Donald«. Das ist natürlich ein verlockendes Narrativ. »Die USA ist am schlimmsten von dem Coronavirus Sars-CoV-2 betroffen«,
Aber was sagen die Daten wirklich?
Richtig ist, dass es in absoluten Zahlen in keinem anderen Staat mehr bestätigte Tote und bestätigte Infizierte in Zusammenhang mit Covid-19 gibt als in den USA. Fast 150.000 Menschenleben.
Richtig ist aber beispielsweise auch, dass in den USA mehr Weiße als Schwarze von Polizisten erschossen werden – in absoluten Zahlen.
Schließlich verschleiert diese absolute Darstellung, dass es als Schwarzer in den USA (13% Bevölkerungsanteil, aber 23% Anteil der durch die Polizei Erschossenen) relativ betrachtet mehr als doppelt so wahrscheinlich ist, durch die Kugel eines Polizisten zu sterben wie für weiße US-Amerikaner (60% Bevölkerungsanteil, 45% der Schusswaffenopfer). Natürlich kommt es auf die relative Zahl an, will man strukturellen Rassismus erforschen.
Bei Rassismus weiß das (fast) jeder.
Wer also über Coronatote oder Infizierte in einer bestimmten Region berichtet, sollte mit der gleichen Begründung Zahlen relativ darstellen. Wie steht es in dem Fall um die strauchelnde Supermacht?
- Relative Durchseuchung: Anteilig belegen die USA, was die absolute Anzahl der insgesamt bislang Infizierten angeht, einen weniger schlagzeilentauglichen Rang 9 aller Länder weltweit (Stand 27. Juli 2020, etwa 1,3% bestätigte Durchseuchung der Gesellschaft). Der unrühmliche erste Rang gehört derzeit mit weitem Abstand dem Emirat Katar im Nordosten der arabischen Halbinsel (etwa 3,8%). Die Zahlen sind jedoch mit Vorsicht zu betrachten, denn sie hängen unter anderem von der Anzahl durchgeführter Tests ab.
- Relatives Sterberisiko: Beim relativen Sterberisiko belegen die USA (Stand 27. Juli 2020) derzeit den elften Platz. Und die 10 Plätze davor? Die Plätze 1 bis 7 werden ausschließlich von europäischen Staaten belegt. Chile und Peru belegen Rang 8 und 9, danach folgt vor den USA Frankreich. Für Bewohner Belgiens etwa war es seit Ausbruch doppelt so wahrscheinlich, an Corona zu sterben, wie für Bewohner der USA. Im Kleinstaat San Marino in Norditalien war das Sterberisiko gar 3-mal so hoch wie in Übersee.
Auch diese relativen Zahlen haben noch einen Haken: Sie zeigen nur das kumulierte Risiko, also über den gesamten Zeitraum der Pandemie zusammengezählt. Für eine Einschätzung des aktuellen Risikos müssen ausschließlich die aktuellen Daten betrachtet werden. Einen gewissen Aufschluss gibt der Durchschnitt der letzten
Die Entwicklung der Todeszahlen hinkt dem »Infektionsgeschehen«, also der täglichen Ansteckungsrate, etwa 3 Wochen
Die Anzahl der durch (oder mit) Corona unmittelbar Gestorbenen gibt indes keine genaue Auskunft darüber, inwieweit die Sterblichkeit einer Gesellschaft mittelbar beeinflusst wird. Zum Beispiel, weil es weniger Verkehrstote oder mehr Suizide gibt.
Die Übersterblichkeit ist die aussagekräftigste der 3 Kennzahlen, aber leider auch die, deren Berechnung am spätesten erfolgt. Sie vergleicht alle Todesfälle aus dem Pandemiezeitraum mit einem Mittelwert der Todesfälle aus vergangenen Jahren, ggf. bereinigt, um etwa Veränderungen der Altersstruktur einer Gesellschaft oder dem Umstand gestiegener Lebenserwartung Rechnung zu tragen. Auf diese Weise wird beispielsweise rückwirkend das Ausmaß der jährlichen Grippewelle berechnet. Die Übersterblichkeit gibt am besten Auskunft darüber, ob eine Gesellschaft aus gesundheitlicher Sicht insgesamt gut auf die Pandemie reagiert hat.
Die folgende Grafik setzt bei ausgewählten Ländern die Übersterblichkeit ins Verhältnis zu den gemeldeten Coronatoten. Liegt der Wert bei nahezu 100%, wie beispielsweise in Frankreich (97%), so entsprechen die gemeldeten Coronatoten (Frankreich: ca. 30.200) in etwa der gleichzeitigen (Gesamt-)Übersterblichkeit – also zusätzliche Tote im Vergleich zum Durchschnitt der letzten Jahre (Frankreich: ca. 31.100). Ein niedrigerer Wert wie in Spanien bedeutet, dass die offizielle Anzahl der an Covid-19 Verstorbenen nur 60% der Übersterblichkeit darstellt, dass also statt nur 28.500 Coronatoten im Pandemiezeitraum etwa 47.500 mehr Menschen gestorben sind als normalerweise.
Schlau aus den Daten wird man also erst dann,
Die Berichterstattung über die USA ist dafür ein gutes Beispiel: Nur in (die tatsächliche Durchseuchung verzerrenden) absoluten Fallzahlen liegt das viertgrößte Land der Welt tatsächlich an der traurigen Spitze. Betrachtet man die eigentlich relevanten Kennzahlen, reicht es nur für einen Platz im vordersten Feld. Das hält von Tagesschau über Deutschlandfunk bis hin zu Spiegel, Zeit und so ziemlich jedem anderen Medium aber niemanden davon ab, weiter anderslautend zu titeln.
Warum ist diese Relativierung gegen Trump ein probates Mittel, während ihm der gleiche statistische Kniff (zu Recht!) zum Vorwurf gemacht wird?
Verunsichert? Gut so!
Wo also ist Corona »am schlimmsten«? Der Vergleich der relativen Übersterblichkeit beantwortet diese Frage zu einem gewissen Teil. Vieles verschweigt die Kennzahl aber: Sie sagt nichts aus über die Höhe eines Wirtschaftseinbruchs, eventuelle Auswirkungen auf die psychische Gesundheit (und deren Folgen), über Arbeitslosigkeit oder sonstige sozioökonomische Konsequenzen von Corona. Auch positive Effekte der Pandemie werden spätestens aus der Retrospektive ein Teil der Betrachtung sein; viele davon können wir heute unmöglich »messen«:
Es ist eine Herausforderung, bei so viel Komplexität nicht dem eigenen Lieblingsnarrativ zu erliegen. Das wissen Datenanalysten wie Max Roser nur zu genau. Er und sein Team betreiben die Website, von der ich mich im Augenblick zu Corona am besten informiert fühle: Our World in Data.
Von ihr stammen auch die Graphen, die du bisher schon im Text gesehen hast. Das Besondere an Our World in Data ist nicht nur die schiere Menge der verfügbaren aktuellen Daten, die Interaktivität oder die Tatsache, dass Roser sie kostenlos ins Internet stellt, sondern auch die Transparenz der Website. Quellen werden offengelegt und Zweifel an der Datenqualität transparent aufgezeigt (allerdings leider nur auf Englisch).
Vom sprichwörtlichen »Bauchgefühl« hält Roser nicht viel:
Eine weitere Schwierigkeit beim Umgang mit Daten ist Roser wichtig: die Datenqualität. »Man muss hinterfragen, woher die Daten kommen, welche Auswahl getroffen wurde und was miteinander in Verbindung gesetzt wird«, rät er.
Doch trotz ihrer Ungenauigkeit sind Coronadaten genauer und transparenter als viele andere Informationen, auf deren Grundlage Entscheidungen sonst getroffen werden (zum Beispiel Befragungen und Konjunkturprognosen wie der »ifo-Index«). Selten waren die Datensätze zugänglicher, die Darstellungsmöglichkeiten vielfältiger. Aber absolut sicher sind auch sie nicht.
Warum Datenqualität wichtig ist – und wie du sie hinterfragst
Je transparenter die Datenquelle, desto besser die »Datenqualität«. Jede Kennzahl ist immer mit Hinblick auf die den Daten zugrunde liegenden Unsicherheiten zu beurteilen. Auch die Daten zu Corona haben unterschiedliche Qualität und bergen gewisse Unsicherheiten:
- Die Infektionszahlen sind offizielle Zahlen der jeweiligen Regierungen – und einige davon waren schon in der Vergangenheit
- Die Todeszahlen sind insgesamt verlässlicher, weil Tote mit vorherigen Symptomen aktuell meist auf Corona getestet werden. Doch auch hier drohen Manipulation (die aus statistischer Sicht überaus unglaubwürdige Erfolgsstory aus China – angeblich 4 Tote von Anfang Mai bis Mitte Juli – ist wahrscheinlich staatlich manipuliert) und Inkonsistenz (teilweise werden nur in Krankenhäusern Verstorbene gezählt oder Daten geschätzt). Viele Länder haben außerdem keine ausreichende Infrastruktur, um verlässliche Daten zu erfassen. Und doch: Diese Daten sind das Beste, was wir haben – und sie sind tagesaktuell verfügbar.
Eigentlich müsste also gerade die Zeit für Datenjournalismus, kritisches Hinterfragen und Differenzierung sein. Eigentlich. Stattdessen bombardieren Medien ihre Konsumenten immer noch zu oft mit absoluten Zahlen ohne Kontext: »In Deutschland ist die Zahl der mit Corona Infizierten auf 204.964 gestiegen.« Eine solche Information fördert ohne Einordnung keinerlei Verständnis und erst recht kein Interesse für einen vertieften Blick auf die Daten.
Das Einmaleins der Datenkompetenz
Wie könnte es besser gehen? Wenn du versuchst, Fakten aus Daten abzuleiten, verwende einfach folgende Checkliste:
- Formuliere eine möglichst klare Frage (zum Beispiel: »Wie hoch ist das aktuelle Sterberisiko?«).
- Lege eine Perspektive fest (weltweit im Zeitverlauf oder der Vergleich aktueller Daten auf Kreisebene).
- Finde eine aussagekräftige Kennzahl (relative Übersterblichkeit, hilfsweise bestätigte Tote).
- Am wichtigsten: Ordne dein Ergebnis ein (Datenqualität und »normale« Sterblichkeit im selben Zeitraum).
Damit lässt sich auch besser verstehen, wie gefährlich die Pandemie aktuell noch ist. Momentan sterben coronabedingt weltweit wieder über 6.000 Menschen am Tag – etwa alle 14 Sekunden ein Leben, zumindest nach offiziellen Angaben.
Doch auch dies ist eine absolute Zahl. An einem »normalen« Tag sterben weltweit durchschnittlich über 160.000 Menschen. Derzeit etwa 6.000 Coronatote bedeuten einen Anstieg der durchschnittlichen Todesgefahr um knapp 4%, für die Risikogruppen liegt er um ein Vielfaches höher. In der zweiten Aprilhälfte lag der 7-Tage-Mittelwert schon einmal eine Weile bei etwa 7.500 täglichen Toten, also etwa um 1/4 höher.
Haben wir also das Schlimmste hinter uns und sollten optimistisch sein?
Global gesehen muss diese Frage derzeit klar mit Nein beantwortet werden. Nachdem die Todeszahlen bis Ende Mai rückläufig waren (auf bis zu unter 4.000 Verstorbene pro Tag), steigt diese Zahl seitdem anfangs langsamer, jüngst schneller wieder an. Der starke Anstieg der weltweiten Infektionszahlen garantiert, dass dieser Trend in den nächsten Wochen anhält.
In einer global vernetzten Welt ist jedes Land und fast jeder Erdbewohner in irgendeiner Weise durch eine Pandemie dieses Ausmaßes betroffen. Natürlich interessiert für das eigene Infektionsrisiko zunächst nur die Situation vor der eigenen Haustür. Gleichzeitig wird diese Krise fast alle betreffen, solange das Virus weltweit wütet und es keinen Impfstoff gibt.
Je besser möglichst viele von uns dabei die Daten verstehen, desto besser können wir als Gemeinde, als Nation und als Weltgemeinschaft reagieren. Und desto weniger Unsinn wird verbreitet.
Mit Illustrationen von Mirella Kahnert für Perspective Daily