Alle hier präsentierten Ergebnisse beruhen auf den Daten des Robert-Koch-Instituts zu amtlich bestätigten, neuen SARS-Cov-2 Infektionen in der deutschen Bevölkerung (www.corona.rki.de). Es handelt sich also um das tägliche Wachstum der Zahl aller nachweislich infizierten Personen:

 

  • Neue, positiv getestete Fälle werden von Laboren oder Ärzten an die örtlichen Gesundheitsbehörden gemeldet und von dort an die zuständigen Landesbehörden übermittelt. Die Landesbehörden berichten dann an das RKI (Meldeverzug).

  • Die vom RKI publizierte, tagesaktuelle (Gesamt-) Fallzahl          umfasst alle jemals positiv getesteten Fälle in den Regionen "i " (412 Landkreise und Städte) tagesbezogen vom 28.1.2020 bis heute. Sie ist die Summe aller neu gemeldeten, positiv getesteten Fälle aus Region i und Tag (      ):​

  • Unter Vernachlässigung des Zeitverzugs von Durchführung eines Corona-Tests bis zur (ultimativen) Meldung an das RKI ist die Zahl der neuen, positiv gemeldeten Fälle das Produkt aus Zahl der in durchgeführten Tests und der Wahrscheinlichkeit eines positiven Ergebnisses, gegeben das ein Test durchgeführt wurde:

  • Nach unserem Kenntnisstand sind Daten zu             nicht verfügbar. Das RKI veröffentlicht aggregierte Daten zur Zahl durchgeführter Tests (wöchentlich, über die Regionen aufsummiert). Auch andere wichtige Indikatoren für die Verbreitung von SARS Cov2 sind nicht öffentlich verfügbar oder werden nicht erfasst (Missing Data).

  • Es gilt also:

Datenmerkmale

Die vom RKI veröffentlichten, tagesaktuellen Zahlen zu neuen SARS-Cov-2 Infektionen weisen eine Reihe von Merkmalen auf, die bei der Bewertung von Ergebnissen daraus in Betracht gezogen werden sollten: 

Meldeverzug

Die Zuordnung eines neuen Falls zu t ist das Datum, an dem das lokale Gesundheitsamt Kenntnis vom Fall erlangt.  Der zeitliche Übermittlungsverzug neuer Fälle an das RKI kann nach eigenen Angaben mehrere Tage betragen. Dies bedeutet, dass die Zahl neuer Fälle zum Tag t an den auf t folgenden Tagen z.T. mehrfach nach oben korrigiert wird.  Zum Beispiel hat das RKI für die neuen Fälle zum Stichtag 5.4.2020 (erste Veröffentlichung am durch das RKI am 6.4.2020) an den darauffolgenden 3 Tagen folgende Aktualisierungen vorgenommen:

Die sich für die auf den 6.4.2020 folgenden drei Meldetage auf 4.178 Fälle belaufen. Mit anderen Worten: die Zahl der am 5.4.2020 erfassten, neuen Fälle wurde um (mehr als) den Faktor 4 nach oben korrigiert.  Dabei sind die Korrekturen am 2. Tag nach dem hier betrachteten Stichtag am höchsten.  Auf der Ebene der 412 Melderegionen:

Die Johns Hopkins-Universität veröffentlicht eigenständig und auf der Basis nicht amtlich gemeldeter Daten SARS-Cov-2 Infektionszahlen für Deutschland. Vernachlässigt man aufgrund des Meldeverzugs die letzten beiden Datenpunkte der RKI Daten, sehen die kumulierten Fallzahlen aus beiden Datenquellen für den Zeitraum 7.3.20 bis 6.4.20 wie folgt aus:

Danach veröffentlichen JHU und das RKI sehr ähnliche (kumulierte) Fallzahlen. Da die JHU keine regional differenzierten Daten für Deutschland veröffentlicht, kommt für uns nur das RKI als Datenquelle in Frage. 

Wochentagseffekt

Neue, positiv getesteter Fälle weisen eine Tagesganglinie mit wiederkehrendem Muster auf. Für die Fallzahlen der KW 11-17 auf der Grundlage des Datenbestands vom 21.4.2020 (ohne die letzten beiden Tage aufgrund der zu  erwartenden Korrekturen) ergibt sich folgendes Bild:

Die vertikalen, gepunkteten Linien kennzeichnen Sonntage. 

 

Steigende (Anfang einer Woche) und sinkende Zahlen neuer Fälle (Ende einer Woche) gegenüber dem jeweiligen Vortag sind maßgeblich einem „Wochentagseffekt“ geschuldet, nicht nur Veränderungen in der Verbreitungsgeschwindigkeit von SARS-Cov-2. Das RKI berichtet erst seit kurzem auch das Erfassungsdatum positiver Tests durch Labore bzw. Testeinrichtungen was diesen Einfluss täglicher Fallzahlen verringern kann.

Der Wochentagseffekt in den Daten kann auf verschiedenen Wegen adressiert werden:

  • Vergleich neuer Fallzahlen eines Tag mit gleichem Wochentag der Vorwoche(n): Mo-Mo, Di-Di etc.

  • Aggregation neuer Fälle pro Woche, was die Wochengangslinie beseitigt. 

Missing Data und Testregime

Nach unserem Kenntnisstand ist die (Gesamt-) Zahl der bis heute durchgeführten NAT/PCR Tests auf SARS-Cov-2 unbekannt („Missing Data“). Gleiches gilt folglich auch für die Wahrscheinlichkeit, dass ein Test positiv ist.  Bekannt ist hingegen die Zahl neuer Fälle in Region i zum Tag T (Inzidenz), das Produkt aus beiden Größen:

wobei            die Zahl der in i zum Zeitpunkt durchgeführten Tests ist (wir ignorieren hier den Meldeverzug von bis zu 2 Tagen).        ist  die wahre Zahl neuer, durch den Test  bestätigter Fälle, wenn der Test auf SARS -Cov-2 keine falschen Positivergebnisse erzeugt. Weiterhin:

d.h. die Zahl der durchgeführten Tests entspricht dem Produkt aus lokaler Testrate (oder relativer Testhäufigkeit und Bevölkerungsgröße (=Zahl der Personen die grundsätzlich getestet werden könnten).

Die Testrate ist wiederum:

wenn das Testregime anlassbezogen ist.  

Zurzeit werden in Deutschland (und anderswo) ausschließlich oder vorrangig Personen getestet, die SARS- Cov-2 Symptome aufweisen, die direkten Kontakt zu positiv getesteten Personen innerhalb der letzten 2-3 Wochen hatten. Daneben wird exponiertes medizinisches Personal regelmäßig getestet. Dieses Testregime impliziert:

Da randomisierte Tests (d.h. ohne Anlass) bisher in Deutschland kaum stattfinden, scheinen wir uns in dieser Situation zu befinden. Man beachte, dass in unter diesem Testregime eine Person nicht oder mit nur geringer Wahrscheinlichkeit getestet wird, die nicht symptomatisch ist.

 

Die vom RKI veröffentlichte Fallzahl pro Tag ergibt sich folglich aus:

mit

der Zahl der anlassbezogen indizierten Personen in der Region i zum Zeitpunkt t.

Im Ergebnis publiziert das RKI mit der täglichen bzw. kumulierten Fallzahl (in Relation zur Größe der Bevölkerung) die anlassbezogene Inzidenz von SARS-Cov-2 auf der Basis der gemeinsamen Wahrscheinlichkeit eines positiven Tests und eines Anlasses dafür.

Die Wahrscheinlichkeit eines Anlasses (bei Vernachlässigung aller Gründe zur Durchführung von Tests außer Vorliegen von Symptomen):

setzt sich zusammen aus symptomatischen und nicht-symptomatischen Fällen.

Das Problem eines anlassbezogenen Testregimes ist, dass nicht-symptomatische Personen nicht getestet werden.  Wenn

dann:

Bleiben 50% aller infizierten Personen ohne Symptome, werden diese 50% nicht getestet.  

 

Die vom RKI publizierte Fallzahl erlaubt daher nicht, die tatsächliche Prävalenz von SARS-Cov-2 in der bundesdeutschen Bevölkerung zu messen. Prävalenz ergibt sich aus der marginalen Wahrscheinlichkeit für einen Positivfall, unabhängig von der Frage ob man testet oder nicht und unabhängig auch vom Vorliegen akuter Symptome:

Empirisch wird Prävalenz auf der Basis einer Vollerhebung oder einer randomisierten Auswahl von Testpersonen gemessen, bei der alle Personen in der Stichprobe getestet werden müssen:

Eine Zufallsauswahl von 1.544 Personen mit anschließendem PCR Test auf SARS Cov2 hat in Österreich zu Beginn April 2020 eine Quote von 0,33% akut erkrankter Personen ermittelt.  Bezogen auf die Gesamtbevölkerung ergäbe das eine Zahl von knapp 29.000 aktuell infizierten Personen. Zum gleichen Zeitpunkt wies die Statistik in Österreich auf der Basis überwiegend anlassbezogener Tests eine Zahl von 8.500 Fällen aus.  Das anlassbezogene Testregime erfasst daher ca. 2/3 der aktuellen Infektionsfälle nicht, sofern die Zahl von Genesenen in der Stichprobe vernachlässigt werden kann bzw. wenn es sich bei allen 8.500 bestätigten Fällen um akute Fälle handelt[1].

 

[1] Eine aktuelle Infektionsquote von 0,33% impliziert 5 Positivfälle in der Stichprobe von 1.544 Personen. Es ist klar, dass die ermittelte Quote sehr sensitiv gegenüber einem zufallsbedingt anderen Ausgang ist. Wäre nur ein Positivfall mehr gemessen worden, wäre die (hochgerechnete) Zahl von Fällen um 5.400 Personen höher.  Die Stichprobe von 1.544 ist damit für eine verlässliche Abschätzung der wahren Inzidenz von SARS Cov2 in der österreichischen Bevölkerung aufgrund dieser hohen Sensitivität gegenüber Ausreißern zu klein. 

Datenquelle