Wo die Proteinsynthese-Maschinerie andockt

ETH-Forschende können für viele Milliarden verschiedene Abfolgen von RNA-Bausteinen vorhersagen, wie gut die zelluläre Proteinsynthese-Maschinerie an sie andockt. Dieses Andocken hat einen wesentlichen Einfluss darauf, wie viel von einem Protein hergestellt wird. Zur Entwicklung des Vorhersagemodells nutzen die Wissenschaftler eine Kombination von Experimenten der synthetischen Biologie und Algorithmen des maschinellen Lernens.

Ribosom
Ribosomen sind die Proteinsynthese-Maschinen der Zellen. Sie lesen die genetische Information von der Boten-RNA (violett) ab und stellen darauf basierend Proteine (gelb) her. (Grafik: Science Photo Library)

Das Erbgut von Bakterien, Pflanzen bis hin zum Menschen lässt sich heute sehr einfach entziffern, und dennoch birgt es viele offene Fragen. Da sind zum Beispiel die RNA-Abschriften der Gene und die Stellen darauf, an welche die zelluläre Proteinsynthese-Maschinerie (die Ribosomen) andocken, um die genetische Information abzulesen. Ein umfassendes Verständnis zu diesen Andockstellen fehlte bisher.

Ein interdisziplinäres Team von Forschenden des Departements Biosysteme (D-BSSE) der ETH Zürich in Basel hat nun einen Ansatz entwickelt, mit dem es erstmals möglich ist, detaillierte Informationen zu einer unglaublich grossen Zahl solcher Andockungsstellen in Bakterien zu gewinnen. Der Ansatz kombiniert experimentelle Methoden der synthetischen Biologie mit maschinellem Lernen.

Feinsteuerung der Proteinherstellung

Bei den Andockungsstellen handelt es sich um kurze Abfolgen von RNA-Bausteinen vor jedem Gen. In der Vergangenheit haben Biotechnologen auch künstliche Andockstellen entwickelt. An einige davon heften sich die Ribosomen äusserst gut, an andere weniger. Je besser Ribosomen an eine bestimmte Variante andocken können, desto eher lesen sie die Information des Gens ab und desto mehr des entsprechenden Proteins stellen sie her.

Wenn Biotechnologen Bakterien verwenden, um beispielsweise Medikamente herzustellen, können sie mit der Wahl der Ribosomen-Andockungsstellen die hergestellte Menge beeinflussen. «Besonders interessant und wichtig ist eine solche Steuerung, wenn man komplexe Gen-Netzwerke in Zellen bringt, die mehrere Proteine gleichzeitig herstellen sollen. Dann gilt es, ihre Menge optimal aufeinander abzustimmen», erklärt Markus Jeschek. Er ist Senior Scientist und Gruppenleiter am D-BSSE.

Ein Experiment mit 300'000 Sequenzen

Zusammen mit den ETH-Professoren Yaakov Benenson und Karsten Borgwardt sowie Mitgliedern der jeweiligen Gruppen entwickelte er nun eine Methode, um für über 300’000 synthetisch erzeugte RNA-Sequenzen zu bestimmen, wie gut Ribosomen an sie andocken. Bisher war das pro Experiment nur für wenige Hundert Sequenzen möglich.

Der Ansatz der ETH-Forschenden benutzt «Deep Sequencing», die modernste Technik zur Bestimmung von DNA- und RNA-Sequenzen. Im Labor stellten die Wissenschaftler und Wissenschaftlerinnen in einem Schritt mehr als 300'000 verschiedene Ribosomen-Andockungsstellen her und fusionierten diese jeweils mit einem Gen für ein Enzym, das ein Stück DNA verändert. Die entsprechenden Gen-Konstrukte führten sie in Bakterien ein, um im Experiment zu sehen, wie stark sich im Einzelfall die Ribosomen an die RNA heften. Je besser die jeweilige Andockungsstelle funktioniert, desto mehr Enzym wird in der Zelle hergestellt, und umso eher wird das Stück DNA verändert. Diese Veränderung können die Forschenden im Anschluss an das Experiment mittels Sequenzierung zusammen mit der jeweiligen RNA-Sequenz der Andockstelle auslesen.

Universeller Ansatz

Weil 300'000 nur ein kleiner Teil von vielen Milliarden theoretisch denkbaren Ribosomen-Bindungsstellen ist, haben die Wissenschaftler ihre Daten mit Algorithmen des maschinellen Lernens untersucht. «Diese Algorithmen erkennen in grossen Datenbeständen komplexe statistische Zusammenhänge. Mit deren Hilfe können wir vorhersagen, wie gut Ribosomen eine bestimmte RNA-Sequenz binden», erklärt Karsten Borgwardt, Professor für Data-Mining. Diese Vorhersagemodelle stellten die ETH-Forschenden als Software frei zur Verfügung, damit auch andere Wissenschaftler sie nutzen können. Bald werden sie auch einen einfach zu nutzenden Onlineservice veröffentlichen.

Der von den Wissenschaftlern gewählte Ansatz ist universell, wie Benenson und Jeschek betonen. Deshalb planen die Forscher, ihn auch in anderen Organismen zu nutzen bis hin zu menschlichen Zellen. «Der Einfluss von genetischer Information auf die Menge eines Proteins, das in einer Zelle hergestellt wird, ist auch beim Menschen interessant», sagt Benenson. «Gerade auch im Zusammenhang mit genetisch bedingten Krankheiten.»

Literaturhinweis

Höllerer S, Papaxanthos L, Gumpinger AC, Fischer K, Beisel C, Borgwardt K, Benenson Y, Jeschek M: Large-scale DNA-based phenotypic recording and deep learning enable highly accurate sequence-function mapping. Nature Communications 2020, doi: externe Seite 10.1038/s41467-020-17222-4

JavaScript wurde auf Ihrem Browser deaktiviert