Die Wissenschaft hinter den Corona-Maßnahmen
Peter Klimek wurde zum österreichischen Wissenschaftler des Jahres gekürt. Seit März 2020 ist der Leiter des Wiener Complexity Science Hub den Österreichern bekannt als Komplexitätsforscher (eine Berufsbezeichnung, die es praktisch nur in der Alpenrepublik zu geben scheint). Zusammen mit Niki Popper von der TU Wien wurden seine Modelle aus Differentialgleichungen, Wahrscheinlichkeitsrechnungen und Graphen zum Begleiter für zahlreiche Landsleute, wenn es darum ging, Maßnahmen durchzusetzen.
Etwas weniger Bekanntheit erhielten die Kollegen der Uni Graz, die jedoch bereits lange vor der Pandemie eine kleine vereinfachte Version dieser Modelle für die Allgemeinheit zu Verfügung stellten. Hier kann jeder selber seine kleinen Corona-Wellen bauen, und (sehr vereinfacht) nachverfolgen, wie sich gesunde blaue in rote erkrankte und schließlich in grüne genesene Pünktchen verwandeln.
Das Geschäft mit den Wahrscheinlichkeiten
Die Modelle der oben genannten Herren sind dabei selbstverständlich um mehrere Potenzen – nun ja – komplexer. Vor allem jedoch begründen sich diese auf der Verfügbarkeit von großen Datensätzen von Bewegungsmustern, durchgeführten Tests und Ansteckungsraten aus der realen Welt. Die darin präsentierten Graphiken und Zahlenkolonnen sind selbstverständlich beeindruckend und haben im akademischen Diskurs absolut ihre Berechtigung. Dieser lebt davon die Art der Zusammenhänge zu diskutieren, die Aussagekraft bestimmter Variablen in Frage zu stellen und vor allem fehlende Details hinzuzufügen – und genau davon gibt es darin zur Genüge.
Doch suggerieren diese Modelle, sowie deren wissenschaftliche und besonders mathematische Sprache, eine Präzision und eine Wahrheit, die diese beim besten Willen nicht leisten können. Dies beginnt schon dabei, dass sich die Maßeinheiten seit Beginn der Pandemie ständig änderten. Nimmt man beispielsweise die Teststrategie, die sich über den Verlauf der COVID-Krise völlig gewandelt hat: So sah das österreichische Epidemiegesetz von 1950 beispielsweise lediglich vor, Verdachtsfälle auf das Corona-Virus zu testen. Dies erweiterte man in Folge um Screening-Programme in Pflegeheimen und Krankenhäusern, umgekehrt verbesserten sich stets die Contact Tracing-Kapazitäten, um Verdachtsfälle zielgerichtet aus dem Verkehr zu ziehen. Im Dezember 2020 öffnete man mit den Massentests an zwei Wochenenden schließlich die Scheunentore und machte Teststraßen für die Bevölkerung zur Dauerinstitution. Doch genau diese Infektionsraten dienten als Grundlage für die Modellierer und in weiterer Folge Politikentscheidungen. Die Krux dabei: Die statistische Aussagekraft einer Studie hängt stark von der Stichprobe ab, von der man auf die gesamte Bevölkerung schließt. Vereinfacht ausgedrückt: Berechne ich die Sterblichkeitsraten durch Corona aufgrund der positiven Tests in einem Pflegeheim, so sind deren Ergebnisse kaum auf eine Volksschule übertragbar. Doch genau diese Aussagekraft setzen die Modelle voraus. Darum zieht man beispielsweise bei Wahlumfragen repräsentative Stichproben für die Gesamtbevölkerung.
It is the context, stupid
Daneben gibt es noch zahlreiche andere Unschärfen. Zum Beispiel gibt es keine konkrete Definition, was eigentlich ein Intensivbett ist. Was auch in der Logik begründet ist, dass so eine zwar von einem statistischen Standpunkt wichtig wäre, in der Medizin es aber natürlich eine individuelle Entscheidung ist, wie viel Pflege und welche Maschinen notwendig sind, um einen Patienten zu betreuen. Entsprechend diffus ist es auch, wenn Krankenhäuser von einer Überlastung sprechen.
Doch selbst wenn all diese Messfehler ausgeräumt wären, bestünde noch immer massiver Diskussionsbedarf, wie man an das Studiendesign herangeht. Dieses erschließt sich, neben der Gestaltung der vorhandenen Daten, vor allem aus dem Kontext und wie ihn die Forschenden interpretieren. In einem Experiment im Jahr 2018 erhielten 29 Forschungsteams aus 61 Analysten einen einheitlichen Datensatz mit der identen Forschungsfrage: Erhalten dunkelhäutige Fußballspieler häufiger rote Karten wie ihre weißen Kollegen. Deren Resultate sind hier abgebildet (1):
Offensichtlich unterscheiden sie sich nicht nur in den gewählten statistischen Verfahren, sondern auch in den Ergebnissen ganz massiv. Allein was die statistischen Ergebnisse angeht an Mittelwert und Varianz finden sich in den Ergebnissen Kraut und Rüben. Irgendwas scheint an der Annahme schon dran zu sein, aber was genau ist schließlich das Produkt der Interpretation der einzelnen Teams. Signifikanz bedeutet hierbei, dass der Zusammenhang zwischen zwei Variablen deutlich unterscheidbar ist, als würde man einfach den Zufall walten lassen. Zum Beispiel: Gibt es nach der Einführung einer Maskenpflicht in 50 Prozent der Supermärkte in diesen ausreichend niedrigere Ansteckungsraten als in der anderen Hälfte ohne eine solche Maskenpflicht, kann man davon ausgehen, dass dies nicht zufällig ist – der Zusammenhang zwischen Maskenpflicht und Ansteckungsraten wäre also signifikant. Dies sagt dabei jedoch noch nichts über die Größe des Zusammenhanges aus – so kann eine Maskenpflicht die Ansteckungen um 50, 10 oder nur 0,01 Prozent senken – alles kann signifikant sein.
Darüber gibt der Mittelwert Auskunft: Wenn die Masken im einen Supermarkt zu zehn Prozent weniger Infektionen geführt haben, im anderen jedoch lediglich zu zwei – so errechnet sich ein Mittelwert aus sechs Prozent weniger Ansteckungen (in obiger Abbildung sind dies die schwarzen Punkte). Die Varianz sagt mir eben, dass die Wirkung von Masken zwischen zwei und zehn Prozent liegt. In obiger Abbildung wären das die Linien, die links und rechts von den Linien wegführen. Je kürzer diese ausfällt, umso zielgerichteter fällt eine Maßnahme aus – und je länger umso diffuser ist ihre Aussagekraft.
Korrelation ist nicht Kausalität
Bei dem ständig wechselnden Strauß an verschiedenen Maßnahmen zwischen Lockdown und Öffnung und zahlreichen Schattierungen dazwischen, ist längst nicht mehr klar, welche der Maßnahmen noch zu welchem Ergebnis führen. Dies wird auch klar in Herrn Klimeks eigenem Paper „Ranking the effectiveness of worldwide COVID-19 government interventions“. (Klimek et. al. 2020) Auch das ist ein Sammelsurium von Mittelwerten und Varianzen in der linken Spalte (1). Wobei die Stornierung von kleinen Events am wirkungsvollsten erscheint, des Weiteren die Schließung von Schulen sowie der erhöhten Verfügbarkeit von Schutzausrüstung für Betroffene (PPE), die sich auf die Ansteckungszahlen auswirken. Die Kästchen in der rechten Spalte veranschaulichen noch einmal die Übereinstimmung der Wirksamkeit nach diversen Methoden, also nach diversen Studiendesigns. Je röter, umso wirkungsvoller gemäß einer Berechnungsmethode, je weißer, umso wirkungsloser bzw. völlig wirkungslos unter den grauen Kästchen.
Abgesehen von Lockdown und Schulschließungen, die Klimek et. al. in ihrem Paper selbst als nukleare Option bezeichnen, da sie eine Schneise der Verwüstung durch die Gesellschaft ziehen, weiß man also nicht so recht, welche Maßnahmen in welchem Kontext wie wirken. Dies war für unsere Regierung jedoch selten ein Grund, diese nicht einzusetzen, man achte beispielsweise auf die Erweiterung von Laborkapazitäten (Enhance laboratory testing capacity) in der vorletzten Zeile: Wären Österreichs Corona-Maßnahmen auf Evidenz gestützt, müssten hier alle vier Kästchen knallrot aufleuchten bei der Vehemenz mit der diese in Österreich praktiziert wird. Das Gegenteil ist der Fall.
Die politischen Schlüsse daraus
Der wissenschaftliche Prozess ist also schwerfällig, fehlerbehaftet und abhängig von der Interpretation der verschiedenen Akteure. Die Zahlen und Daten in Klimeks Paper sind komplex und für Laien, wie sie Politiker und Journalisten in der Regel sind, schwer nachzuvollziehen. Sie suggerieren diesen eine Präzision und einen Wahrheitsgehalt, den diese jedoch nicht bieten können. Zusammengefasst könnte man sagen: Außer alle Leute in Isolationshaft zu geben, wissen wir nicht so recht, wie wir die Ausbreitung des Virus aufhalten können. Dennoch wurde ständig DIE Wissenschaft bemüht, um alle möglichen Maßnahmen durchzusetzen, mit dem Argument, sie basierten auf wissenschaftlicher Forschung.
2020 prognostizierte Professor Neill Ferguson vom Imperial College mit ähnlichen Methoden Schweden 85.000 Tote, sollte es keinen Lockdown durchführen. Angesprochen darauf, ob man nicht auf dieser Grundlage Gegenmaßnahmen setzen sollte wie der Rest Europas, antwortete Schwedens Chef-Epidemiologe Anders Tegnell, jeder versuche derzeit komplexe Modelle anzuwenden auf sehr limitierte Daten und er somit keine Veranlassung dafür sähe.
Abgesehen vom Verbot von Veranstaltungen über 500 Personen beschränkte man sich in Schweden daher auf Empfehlungen. Vereinfacht ausgedrückt: Man überließ es den Schweden selbst, ab wann es gerechtfertigt ist, ältere Verwandte zu besuchen, um sie zu versorgen oder ab wann es notwendig war, ins Büro zu gehen. Oder aber auch ins Restaurant oder in die Bar. Warum sollte man es jungen Menschen mit einem verschwindend geringen Risiko für einen schweren Krankheitsverlauf nicht selbst überlassen, ob sie nicht unter der Woche eine Bar aufsuchen, und wenn sie ihre Großeltern am Land am Wochenende besuchen, diesen Besuch zu unterlassen? Nichts anderes bestätigt die obige Graphik von Peter Klimek et. al. (2020) selbst.
Ganz anders die Entscheidungsträger in Kontinentaleuropa, deren politische Strategie davon ausging, man könne eine Gesellschaft aus Millionen Individuen mit unterschiedlichsten Voraussetzungen und Lebensumständen so steuern, als wäre sie eine Kompanie Grundwehrdiener, um damit eine vage statistische Größe zu erreichen: seien es Infektionsraten, Hospitalisierungen oder nun Impfquoten. Immer wurde erwartet, dass eine Maßnahme eine gewisse Wirkung auf das Infektionsgeschehen entfaltete. Grundlage bot dafür beispielsweise die Modellierungen von Popper, dessen Aussage schlicht und ergreifend war, man müsse die Bewegungen um 20 Prozent einschränken, um so und so viel Prozent weniger Ansteckungen zu erzielen. Aus den oben beschriebenen Gründen jedoch konnte man schlicht und ergreifend nicht messen, welche Bewegungen es einzuschränken galt. So verbot man einfach alles, und als die Bevölkerung ermüdete, mündete dies in einem Katz-und-Maus-Spiel zwischen Justiz und Polizei einerseits sowie den Bürgern andererseits, deren Lebensumstände nicht in die von der Politik gemachten Regeln passen wollte.
Das Ergebnis beider Strategien ist in 1 abgebildet: Während Schweden seine Maßnahmen einmal hochgefahren hatte und diese relativ konsequent während der ganzen Pandemie aufrechterhalten hat, justierten Österreichs Entscheidungsträger ihre Maßnahmen nach Bedarf und der eigenen Logik folgend. Um die Dimensionen in einen Kontext zu setzen: Das Leben von fast neun Millionen Menschen – unter Ignoranz ihrer persönlichen Lebensumstände – sollten derart reguliert werden, dass rund 1.000 Intensivbetten nicht überlastet würden.
Um es biblisch auszudrücken: Man wollte ein Kamel durch ein Nadelöhr drücken. In der langen Frist sind die Erfolge jedoch minimal, sowohl was Todesraten pro Millionen Einwohner als auch die Infektionszahlen angeht, siehe 2. In der mittleren und langen Frist hat Österreich schlicht und ergreifend die Infektionen nur umso intensiver nachgeholt, die bei Schweden konstant durchgelaufen sind. Während Modellierer die Welt als statisch ansehen, ist die Pandemie jedoch sehr dynamisch. Und zwar nicht über Monate, sondern über Jahre.
Aus den eigenen Fehlern lernen
„Welchen Vorteil hatten all die drakonischen Maßnahmen?“, fragt Tegnell im Gespräch mit der Financial Times daher. Ganz im Gegenteil, als die Maßnahmen nicht griffen, war das Feld frei für gegenseitige Beschuldigungen und Denunziantentum – da hatte doch glatt der Nachbar illegal drei Freunde in seine Garage eingeladen, oder der Dame im Supermarkt war doch glatt die Maske unter die Nase gerutscht und sie hatte keine Hand frei, um sie wieder zurückzuziehen. Kein Wunder, dass die Infektionsraten so durch die Decke gingen. Man kennt dies aus anderen zentral und planwirtschaftlich gesteuerten Gesellschaften zur Genüge, wenn Fünfjahrespläne nicht erreicht wurden, waren auch die Republikfeinde schuld.
Zwar sind österreichische Politiker nun zur Seite getreten und haben das Feld einem Expertengremium namens GECKO überlassen und diese empfiehlt die kommende Omikron-Welle in ähnlicher Weise wie die Schweden zu überstehen. Dennoch ist mit Blick auf die Impfpflicht fraglich, ob die Verantwortlichen aus ihren vorherigen Erfahrungen gelernt haben. Stattdessen wird erneut der Fokus daraufgelegt, mittels Impfpflicht die Bevölkerung in regelmäßigen Abständen zu boostern, um einen konstanten Antikörperspiegel, um eine Herdenimmunität aufrechtzuerhalten, die Modellierer wie Klimek oder Popper für gewisse Ziele errechnet haben. Dies unter völliger Ignoranz, dass selbst längst Länder wie Spanien oder Portugal mit hohen Impfraten bereits wieder Maßnahmen ergreifen, um das Infektionsgeschehen unter Kontrolle zu bekommen.