Die berechneten Anfänge der Corona-Epidemie
Analysen von öffentlich zugänglichen Genomdaten liefern Hinweise auf die Anfänge der Corona-Epidemie in China. Forschende des Departements für Biosysteme der ETH Zürich in Basel verwendeten dafür ein von ihnen in den vergangenen Jahren entwickeltes statistisches Modell.
Seit Beginn der aktuellen Corona-Epidemie haben Wissenschaftler und Behörden den genetischen Fingerabdruck von Virusproben aus zahlreichen betroffenen Ländern bestimmt. Über 100 dieser Erbgutsequenzen, die in Coronaviren in der Form von RNA vorliegen, sind in öffentlichen Datenbanken verfügbar. Tanja Stadler, Professorin für Computational Biology am Departement für Biosysteme der ETH Zürich in Basel und Expertin für Fragen der molekularen Epidemiologie, hat diese Daten nun ausgewertet. Sie nutzte dazu ein in ihrer Gruppe entwickeltes statistisches Modell zur genetischen Stammbaumanalyse von Krankheitserregern und gewann damit neue Erkenntnisse zu den Anfängen der Epidemie in China.
Stadlers Auswertungen legen nahe, dass die Epidemie in China in der ersten Novemberhälfte 2019 ihren Anfang nahm. Die meisten bisherigen Schätzungen gingen davon aus, dass das Virus erst in der zweiten Novemberhälfte von einem Tier auf den ersten Menschen übergegangen ist. «Die verbreitete Hypothese, wonach sich der erste Mensch im November auf einem Tiermarkt angesteckt hat, ist immer noch plausibel», sagt die ETH-Professorin. «Unsere Daten schliessen mit sehr grosser Wahrscheinlichkeit aus, dass das Virus bereits vor diesem Zeitpunkt während langer Zeit in Menschen zirkulierte.»
Schnelle Ausbreitung vor der Quarantäne
Ausserdem analysierte Stadler die Dynamik der Epidemie, bevor die Stadt Wuhan am 23. Januar 2020 unter Quarantäne gestellt wurde. Die Wissenschaftlerin errechnete aus den genetischen Daten die Basisreproduktionszahl des neuen Coronavirus. Diese Zahl besagt, wie viele Menschen eine infizierte Person im Schnitt ansteckt. In der fraglichen Zeit liegt sie nach Stadlers Schätzungen zwischen 2 und 3,5. Damit bestätigt die Forscherin die bisherigen Schätzungen, welche auf der Anzahl der bestätigten Corona-Fälle beruhten und von einer Zahl zwischen 2 und 4 ausgegangen sind. Das heisst, die Ansteckungen erfolgen deutlich schneller als bei der saisonalen Grippe (mit einer Basisreproduktionszahl typischerweise unter 1,5).
«Die Basisreproduktionszahl ist eine der zentralen Kenngrössen einer Epidemie», sagt Stadler. «Sie liefert wichtige Hinweise auf die Wirksamkeit von Massnahmen wie zum Beispiel einer Quarantäne. Nur wenn Bekämpfungsmassnahmen diese Zahl zu senken vermögen, sind diese auch wirksam.» Interessant wäre es daher für die Wissenschaftlerin, diese Zahl während der Quarantäne von Wuhan ermitteln zu können. Allerdings sei die Datenlage für diese Zeit in Wuhan unübersichtlich, was eine verlässliche Analyse momentan verunmögliche, sagt Stadler.
Dunkelziffer berechnet
Die Virusgenome verändern sich laufend. Basierend auf diesen Veränderungen rekonstruierte Stadler den genetischen Stammbaum des Virus. «Mit statistischen Methoden können wir für jeden Zeitpunkt in der Vergangenheit errechnen, wie viele Personen damals angesteckt waren», erklärt Stadler. Diese Analyse ergab, dass am 23. Januar bereits zwischen 4000 und 19’000 Personen angesteckt sein mussten. Zu diesem Zeitpunkt gab es 581 bestätigte Krankheitsfälle. Das heisst: Im extremsten Fall tauchte nur 1 von 33 infizierten Personen in der offiziellen Statistik auf, im besten Fall 1 von 7 Personen.
Stadler betont, dass es noch andere Methoden als ihre gebe, um epidemiologische Kenngrössen zu ermitteln. Ihre Methode, welche die Genome analysiert, habe jedoch den grossen Vorteil, dass sie auch mit Daten von verhältnismässig wenig Patienten verlässliche Rückschlüsse erlaube. Insbesondere böte ihre Methode Vorteile in Situationen, in welchen nicht mehr klar ist, wer wen angesteckt hat. In unserem Nachbarland Italien ist das derzeit der Fall, in China schon länger.
Echtzeitanalyse wäre möglich
Schliesslich würde ihre Methode sogar die Echtzeitanalyse einer Epidemie ermöglichen. Behörden könnten damit die Wirksamkeit von Bekämpfungsmassnahmen laufend überprüfen und anpassen. Voraussetzung dafür wäre, dass das Virusgenom bei neuinfizierten Personen durch regelmässige Stichproben ermittelt wird. Aus Wuhan werden allerdings derzeit kaum Sequenzdaten von Virusgenomen veröffentlicht.
Stadler und ihre Kollegen haben ihre Analyse auf dem Fachportal «Virological» anderen Wissenschaftlern zugänglich gemacht. Die ETH-Forschenden betonen, dass ihre Arbeit jedoch nicht von anderen Wissenschaftlern begutachtet worden ist, wie das in der Forschung grundsätzlich Standard ist. In einer aktuellen Lage wie dieser würde dies zu lange dauern. Ebenso betont die ETH-Professorin, dass die Qualität ihrer Analyse nur so gut sein kann, wie die Qualität und Anzahl der veröffentlichten Gendaten. In dieser Studie wurden 93 RNA-Sequenzen analysiert, von denen der Grossteil aus China stammt, 38 stammen aus anderen Ländern. Stadler wird ihre Analyse fortsetzen, um neu veröffentlichte Genomdaten zu erweitern.
Literaturhinweis
Scire J, Vaughan T, Stadler T: externe Seite Phylodynamic Analyses based on 93 genomes, hochgeladen am 25. Februar 2020 auf virological.org