In den Tiefen des Erbguts

Wenn Algorithmen das vollständige Erbgut eines Tumors analysieren, kann das den Therapieerfolg optimieren. Die Analyse hilft auch herauszufinden, wie Krebs entsteht.

Illustration Künstliche Intelligenz
(Illustration: Ray Oranges)

In wenigen weltweit führenden Kliniken, die sich auf die Behandlung von Krebs spezialisiert haben, ist es bereits Standard: Von jedem Patienten werden Gewebeproben von Tumoren genauestens genetisch untersucht. Fachleute gewinnen aus den Proben DNA und entschlüsseln daraus das vollständige Erbgut des Krebsgeschwürs. Zusammen mit Informationen zur Aktivität der einzelnen Gene hilft dies, die Krebsart genauer zu beschreiben sowie vorherzusagen, auf welche Therapien und Medikamente ein Patient am ehesten ansprechen wird.

Das vollständige Genom eines Krebsgeschwürs zu entschlüsseln, heisst allerdings, mit mehreren hundert Gigabytes an Rohdaten umzugehen, die man zunächst auswerten muss. Möglich ist dies nur dank effizienter Algorithmen des maschinellen Lernens, wie Niko Beerenwinkel sagt. Er ist Professor für Computational Biology am Departement für Biosysteme und spezialisiert in der Analyse von molekularbiologischen Daten.

Moderne DNA-Sequenziergeräte sind zwar leistungsfähig und schnell. Allerdings liefern die Geräte «verrauschte» Rohdaten, die nur mit leistungsfähigen Computeranalysen interpretiert werden können. «Algorithmen reduzieren das Rauschen, indem sie die Rohdaten einer Erbgutanalyse mit einer Vielzahl anderer Erbgutanalysen vergleichen und so entscheiden, was mit grosser Wahrscheinlichkeit Rauschen ist und was nicht», erklärt Beerenwinkel.

Die Nadel im Heuhaufen finden

Damit ist die Analyse jedoch noch lange nicht zu Ende. «Im Erbgut eines Tumors haben sich oft Tausende von kleinen Veränderungen angehäuft, von denen nur wenige relevant sind», so Beerenwinkel. «Ausserdem gibt es Veränderungen, die für sich genommen medizinisch unbedeutend, in Kombination mit anderen Veränderungen jedoch entscheidend sind.» Computeralgorithmen helfen auch hier, aus den grossen Datenmengen medizinisch relevante Informationen herauszuschälen.

Dazu kommt, dass Tumore Anhäufungen von verschiedenen Zelltypen sind, die sich genetisch und hinsichtlich ihrer Funktionsweise stark unterscheiden. Neben den eigentlichen Krebszellen finden sich in Tumoren zum Beispiel auch Zellen von Blutgefässen und des Immunsystems. Da sich das Erbgut der Krebszellen schnell verändert, gibt es in einem Tumor in der Regel mehrere genetisch unterschiedliche Populationen dieser entarteten Zellen, die unter Umständen nicht alle auf dasselbe Medikament reagieren.

Beerenwinkel entwickelt mit seiner Gruppe Methoden des maschinellen Lernens und Software, um die grosse genetische Diversität in Tumoren zu erkennen und zu beschreiben. «In Zukunft wird es möglich sein, bei der Krebsbehandlung alle Zellpopulationen zu berücksichtigen und nicht nur die häufigste, wie das heute in der Regel der Fall ist», sagt Beerenwinkel.

Prognosen und Therapien

Auch Valentina Boeva, Professorin für Biomedizininformatik am Informatikdepartement der ETH Zürich, nutzt Algorithmen des maschinellen Lernens. Ein Schwerpunkt ihrer Forschung sind epigenetische Veränderungen in Tumorzellen. Das sind vorübergehende und umkehrbare Veränderungen des Erbguts im Gegensatz zu den dauerhaften genetischen Veränderungen.

«Als Folge der epigenetischen Veränderungen sind in den Tumorzellen andere Gene aktiv als in den gesunden Ursprungszellen, und es werden andere Proteine hergestellt», erklärt Boeva. Sie nutzt der Forschung zugänglich gemachte Datenbanken mit anonymisierten Patientendaten und wertet diese mit Computeralgorithmen aus.

In einer noch nicht veröffentlichten Forschungsarbeit konnte sie zeigen, warum in bestimmten Tumoren epigenetische Veränderungen mit einer stärkeren Aggressivität einhergehen: Die Tumoren schaffen es dank dieser Veränderungen, der körpereigenen Immunabwehr zu entgehen. Da man die Veränderungen mit Medikamenten rückgängig machen kann, gibt die Erkenntnis Hinweise auf neue Therapiemöglichkeiten.

Ein anderes Beispiel ist die Suche nach Abschnitten auf dem Erbgutstrang, welche die Aktivität von Genen regulieren. Mutationen in diesen Abschnitten sind bei der Entstehung von Krebs ebenfalls relevant. Häufig befinden sich diese Abschnitte in der Nähe des Gens, das sie regulieren. Befinden sie sich aber weiter weg, sind sie schwierig zu finden. «Eine weitere Herausforderung ist es, herauszufinden, welches Gen ein solcher Abschnitt reguliert», sagt Boeva. Sie benutzte eine moderne Methode des maschinellen Lernens, die in der Computerlinguistik entwickelt wurde, um die Bedeutung eines Texts zu erfassen. Damit analysierte Boeva Genomdaten, um die «Bedeutung» einzelner Genomabschnitte zu bestimmen. Und tatsächlich fand sie auf diese Weise bisher unbekannte regulatorische Genomsequenzen.

Nicht immer braucht Boeva für ihre Arbeit die allerneusten Auswertungsmethoden. «Manchmal komme ich auch mit Statistikmethoden zum Ziel, die Wissenschaftler bereits vor mehreren Jahrzehnten entwickelt haben», sagt sie. Die Anzahl an Methoden sei gross, und oft wisse sie nicht von vornherein, mit welcher Methode sich ein Problem am ehesten lösen lasse. Da gelte es, mehrere ausprobieren. «Das maschinelle Lernen wird sich jedoch weiterentwickeln», sagt die ETH-Professorin. Und in Zukunft werde es wohl Algorithmen geben, die automatisch die beste Methode des maschinellen Lernens auswählten.

Fit für den Arbeitsmarkt

Bei den Studierenden ist das Interesse am maschinellen Lernen gross. Und auch die Pharmaindustrie hat das maschinelle Lernen und die künstliche Intelligenz als Schlüsseltechnologien erkannt. Neben dem Bereich der molekularen Biomarker, in dem Beerenwinkel und Boeva tätig sind, kommen sie auch bei der Entwicklung von neuen Wirkstoffmolekülen zum Einsatz. «Ich erlebe ein grosses Interesse der Industrie, einerseits an der Zusammenarbeit mit uns in Forschungsprojekten, andererseits darin, unsere Studienabgänger einzustellen», sagt Beerenwinkel.

Wenn ETH-Professorin Boeva neue krebsrelevante Genomabschnitte findet, kommt das nicht nur den Patienten in den Spitzenkliniken zugute. Denn begrenzte genetische Analysen werden bei Krebspatienten zunehmend auch in weniger spezialisierten Spitälern gemacht. Statt des gesamten Genoms werden dann nur einige Dutzend Genomabschnitte untersucht. Es sind jene Abschnitte und Mutationen, die Boeva, Beerenwinkel und viele andere Forschende weltweit mit Hilfe des maschinellen Lernens entdeckt und deren Funktion sie entschlüsselt haben.

Dieser Text ist in der aktuellen Ausgabe des ETH-Magazins Globe erschienen.

JavaScript wurde auf Ihrem Browser deaktiviert