Medizin im Datenrausch
Genomik, digitalisierte Patientendossiers und Echtzeit-Gesundheitsüberwachung – noch nie waren so viele Gesundheitsdaten verfügbar. Drei ETH-Forscher erzählen, wie sie aus der Datenflut relevante Informationen gewinnen und welche Chancen dies für die personalisierte Medizin birgt.
Karsten Borgwardt spricht unaufgeregt und bedacht, als wollte er dadurch etwas Ruhe in ein Forschungsgebiet bringen, in dem es turbulent zu und her geht. Die Datenwissenschaften in der biomedizinischen Forschung erleben aktuell einen Boom: mehr Professoren, mehr Fördergelder, mehr Rechenkapazität und mehr Forschungskooperationen. Borgwardts «Machine Learning & Computational Biology Lab» am Departement für Biosysteme in Basel ist seit der Gründung im Juni 2014 auf 15 Mitarbeiter angewachsen – und es werden weitere hinzukommen.
Der 36-jährige Professor verkörpert einen neuen Typus von Data Scientist, wie er in der Medizin der Zukunft einen festen Platz einnehmen dürfte. Er hat Informatik mit Biologie im Nebenfach studiert, wobei er in letzterem in seinem vierten Studienjahr zusätzlich einen Master an der Oxford University absolvierte. Borgwardt ist mit der Entschlüsselung des ersten menschlichen Genoms aufgewachsen und war schon während des Studiums fasziniert von den neuen Möglichkeiten in der Genomik. Doch heute weiss er, dass die anfänglichen Hoffnungen oft überzogen waren: «Wir sind nach wie vor weit davon entfernt, vom Genom einer Person präzise auf das Vorkommen komplexer Krankheiten schliessen zu können.» Eine mögliche Erklärung dafür: Nicht einzelne Veränderungen im Genom, sondern vielmehr die Interaktion von Millionen von Basenpaaren in der menschlichen DNA sind für komplexe Krankheiten wie Krebs oder Diabetes verantwortlich. Und hier kommt die Informatik ins Spiel.
Datenexplosion in der Genomik
Um solche Interaktionen abbilden und simulieren zu können, braucht es Unmengen von Daten. Heute – 16 Jahre nach der Veröffentlichung der Sequenz des menschlichen Genoms – sind diese verfügbar. «Wir erleben aktuell eine Explosion der Datenmengen in mehreren Dimensionen» erzählt Borgwardt. Durch technische Fortschritte in der Genomik können heute Milliarden Basenpaare eines menschlichen Genoms in wenigen Tagen sequenziert werden – und das für weniger als 2000 Franken. Das eröffnet komplett neue Möglichkeiten: Standen früher Fragen auf der Molekularebene des Individuums im Vordergrund, so beschäftigen sich Forschende heute immer mehr mit Fragen auf Populationsebene; letztendlich also mit dem Erbgut der gesamten Menschheit. Zugleich verschiebt sich die Überwachung des Gesundheitszustands von punktuellen Messungen, zum Beispiel beim jährlichen Arztbesuch, zu kontinuierlichen Echtzeitmessungen. Mit «Wearables» und Smartphone-Apps können schon heute jederzeit Puls, Körpertemperatur und Bewegungsmuster aufgezeichnet werden. Zu den neuen Möglichkeiten in Gesundheitsüberwachung und Genomik kommt hinzu, dass Patientendossiers in den Spitälern zunehmend elektronisch verfügbar sind.
In all diesen Daten steckt grosses Potenzial. Gelingt es, sie gezielt zu nutzen, so könnten Therapien personalisiert und deren Wirkung erhöht werden, so die Hoffnung der Forscher. «Dabei wird der Zufall zu einer extrem wichtigen Grösse», erklärt Borgwardt. Denn ein Algorithmus muss unterscheiden können zwischen zufälligen Zusammenhängen zwischen Patientendaten und dem Auftreten einer Krankheit und statistisch-signifikanten. «Aufgrund der Grösse der multidimensionalen Datenräume stellen sich klassische Fragen der Statistik komplett neu.» Mit Hilfe eines SNF-Starting Grants entwickelt seine Forschungsgruppe deshalb neue Algorithmen, die statistisch-signifikante Muster in riesigen Datenbergen entdecken. Die Algorithmen sind schneller, benötigen weniger Rechenkapazität und können relevante von irrelevanten Daten viel effizienter als bisher trennen.
Für die Intensivstation
Durch die Fortschritte in der Genomik und die zunehmende Digitalisierung von Patientendaten wird Data Science für die Medizin relevant. Das «European Bioinformatics Institute» prognostiziert, dass bis in fünf Jahren das Genom von 15 Prozent der Bevölkerung in Industrieländern, also 150 Millionen Menschen, sequenziert sein wird. Gunnar Rätsch, Professor für Biomedizininformatik, rechnet vor: Das wären rund 28 Exabyte (= 28×109 Gigabyte) an Daten. Um aus solchen Datenmengen für Forschung und Patienten Wissen zu gewinnen, das zu präziseren und personalisierten Therapien beiträgt, sind neue, effiziente Algorithmen nötig. Diese sollen zum Beispiel in Milliarden von Basenpaaren nach krankheitsrelevanten Interaktionen suchen. Rätschs Gruppe arbeitet im Rahmen eines Projekts im Nationalen Forschungsprogramm 75 «Big Data» daran, die grossen Genomdatenmengen effizient zu speichern und zu analysieren. «Wir befinden uns mitten in einem Durchbruch!», sagt der Datenwissenschaftler euphorisch.
Doch wie können Patienten konkret von solchen smarten Algorithmen profitieren? Rätsch präsentiert ein praktisches Beispiel: In enger Zusammenarbeit mit dem Inselspital Bern entwickelt seine Gruppe zusammen mit der Gruppe von Borgwardt ein Frühwarnsystem für Organversagen auf der Intensivstation. Während zehn Jahren hat das Spital von nahezu 54 000 Patienten Daten zu Blutdruck, Puls, Temperatur, Medikamenteinnahme, Glukose- und Laktosestand sowie Elektrokardiogramm (EKG) aufgezeichnet. Rätsch entwickelt nun Algorithmen, um diese 500 Gigabyte an Daten mit rund 3,5 Milliarden Einzelmessungen auf Muster hin zu analysieren, die auf einen baldigen Notfall hindeuten. Ärzte und Pfleger könnten dadurch künftig Massnahmen einleiten, bevor sich der Gesundheitszustand eines Patienten sichtbar verschlechtert. Für solche Systeme ist maschinelles Lernen nötig, ein wichtiges Teilgebiet der Data Science. Programme sollen aus einem gegebenen Datensatz Muster und Gesetzmässigkeiten erkennen und dadurch kontinuierlich hinzulernen.
Automatisierte Radiologie
Nicht nur bei der Auswertung von Patientendaten, sondern auch bei der Weiterentwicklung von medizinischen Geräten spielt maschinelles Lernen eine wichtige Rolle. So zum Beispiel bei der Magnetresonanztomographie (MRI), die heute, besonders bei Weichteilen, zu den wichtigsten medizinischen Untersuchungsmethoden gehört. Klaas Prüssmann, Professor am Institut für Biomedizinische Technik, das von der ETH und Universität Zürich gemeinsam betrieben wird, hat sich der Weiterentwicklung der MRI verschrieben. In einem kürzlich publizierten Artikel beschreibt er ein System, das mit 30 Temperatur- und 16 Magnetsensoren eine Selbstdiagnose des MRI-Geräts erstellt. Bei verdächtigen Mustern könnten Techniker künftig frühzeitig gewarnt und so Ausfallzeiten des Geräts im Spital verkürzt und Kosten gespart werden.
Auch Prüssmann spürt in seinem Forschungsbereich aktuell «den Vorabend einer Goldgräberzeit». Er geht davon aus, dass Data Science in Zukunft nicht nur MRI-Geräte, sondern auch die Bildgebung an sich verändern wird. «Wenn es uns gelingt, bei MRI-Aufzeichnungen relevantes Vorabwissen, zum Beispiel, dass wir ein Hirn und nicht ein Herz untersuchen, in eine für unser System verwertbare Form zu bringen, könnten wir die Geschwindigkeit, Effizienz und Aussagekraft der Messungen stark steigern.» Zugleich prognostiziert Prüssmann auch für die Radiologie grössere Umbrüche. In Zukunft wird es nämlich möglich, Millionen von bestehenden MRI-Bildern mit einer aktuellen Messung zu vergleichen. Daraus können wichtige Hinweise auf bestimmte Krankheiten gewonnen werden. Zudem können Algorithmen Muster in MRI-Bildern erkennen, die von blossem Auge nicht sichtbar sind.
Ruf nach Harmonisierung
Eine der grössten Herausforderungen für Data-Science- Anwendungen im Gesundheitswesen, da sind sich die Experten einig, ist die fehlende Harmonisierung der Daten. «Anonymisierte Daten aus unterschiedlichen Spitälern zu Forschungszwecken sind oft nicht direkt vergleichbar », erzählt Borgwardt. Und sein Kollege Rätsch ergänzt: «In Spitälern wurden Daten bislang oft für Krankenkassenabrechnungen gesammelt und nicht für die weitere Analyse.» Er setzt grosse Hoffnungen in das «Swiss Personalized Health Network» (SPHN), an dem sich Schweizer Hochschulen und Kliniken beteiligen, um die Interoperabilität der Daten zu sichern und den Datentransfer zwischen Spitälern und Forschungsinstitutionen zu erleichtern.
Rätsch sieht weitere Herausforderungen: «Im klinischen Alltag stehen die Patienten und die Datensicherheit an vorderster Stelle und nicht das Aufzeichnen aller relevanten Daten für weiterführende Big-Data-Forschung.» Datenwissenschaftler müssten noch klarer aufzeigen, wo sie Mediziner unterstützen können, ohne den klinischen Alltag zu stören oder die Datensicherheit zu gefährden. Deshalb erachtet er den Bachelor Humanmedizin, der im Herbst 2017 zum ersten Mal an der ETH durchgeführt wird und der auch Kurse in Informatik und maschinellem Lernen beinhaltet, als wichtigen Schritt im Zusammenrücken von Datenwissenschaften und Medizin. «Der Einzug von Data Science ins Spital wird auch eine neue Generation von Medizinern hervorbringen», ist Rätsch überzeugt.
Dieser Artikel ist in der aktuellen Ausgabe von «Globe» erschienen.