Mit dem Geist der japanischen Poesie zur innovativen Datenwissenschaft

Das Swiss Data Science Center der ETH Lausanne und der ETH Zürich ist erfolgreich gestartet. Bereits im September konnten die Wissenschaftler des Zentrums ihre Open-Source Plattform Renga lancieren. Nun wurden auch die ersten Forschungsprojekte bestimmt, die gefördert werden sollen.

SDSC
Benannt nach der japanischen Gedichtform Renga, soll auch bei der neuen Plattform des Swiss Data Science Center die Kollaboration im Zentrum stehen. (Bild: Colourbox / ETH Zürich)

Renga ist eine Form des japanischen Gedichts, das mehrere Dichter gemeinsam schreiben. Dabei wechseln sie sich jeweils Vers um Vers ab. Die einzelnen Beiträge fügen sich zu einem Ganzen zusammen. Renga ist auch der Name einer neuen Open-Software-Plattform, die nach demselben Prinzip funktioniert. Forschende aus den Natur-, Technik- und Sozialwissenschaften erarbeiten im Austausch mit Datenspezialisten neue Lösungsansätze. Entwickelt haben die Plattform Wissenschaftler des Swiss Data Science Centers. Dieses gemeinsame Zentrum der EPFL und der ETH Zürich bildet eine Brücke zwischen Forschenden, die Daten produzieren und jenen, die neue Techniken der Datenanalyse und Datensysteme entwickeln.

Daten teilen, Wissen vermehren

Die neuartige, in der Cloud gehostete Plattform ist für Analysen verschiedenster Art gebaut. Forschende aus unterschiedlichsten Fachgebieten können in ihr geordnete, kalibrierte und falls nötig anonymisierte Daten speichern und analysieren. Der Clou an der Geschichte: die Plattform wächst mit jedem Forschungsprojekt, wird um wertvolle Daten reicher, die dann wieder anderen Wissenschaftlern zur Verfügung stehen. Da auch Datenwissenschaftler die Daten für ihre Forschung nutzen können, kommt ein Austausch über Lösungsansätze in Gang, der neue Erkenntnisse und weitere Forschungsprojekte ermöglicht. So fördert Renga nicht nur eine multidisziplinäre Zusammenarbeit, sondern auch wissenschaftliche Transparenz und Methodenentwicklung.

Seit September steht die Plattform den Wissenschaftlern zur Verfügung, aber auch Unternehmen profitieren: an einem Industrietag wurde ihnen aufgezeigt, wie sie Data Science schnell für ihre Geschäftsbereiche nutzbar machen können. Auch sie können in Zukunft ihre Daten auf die Plattform spielen und für die Analyse auf die Expertise von Datenwissenschaftlern und Informatikern des Swiss Data Science Centers zugreifen.

Kompetenzen verbinden und beflügeln

«Die Plattform, die wir gebaut haben, ist einzigartig, weil sie ganz praktisch die Leistungsfähigkeit und die Exzellenz der Forschung fördert und die Einführung der Open Data Science unterstützt», sagt Olivier Verschure, Executive Direktor des SDSC. Eine besondere Herausforderung sei es gewesen, die Plattform benutzerfreundlich zu gestalten. Schliesslich sollen sie Forschende nutzen, die nicht aus der Informatik oder den Datenwissenschaften kommen. Andreas Krause, Professor für Informatik an der ETH Zürich und Co-Direktor des Zentrums für Datenwissenschaften fügt an: «Wir verbinden datenwissenschaftliche Methoden wie maschinelles Lernen oder Statistik mit den Kompetenzen von datenreichen Wissenschaften wie Lebens- oder Umweltwissenschaften.»

Projekte ausgewählt

Wie die Plattform Renga haben auch die Förderbeiträge des Swiss Data Science Centers das Ziel, interdisziplinäre Projekte aus dem Bereich Datenwissenschaften zu fördern. Die Förderung beläuft sich auf zwei Jahre und beträgt je nach Projekt 300'000 bis 600'000 Schweizer Franken. Die erste Ausschreibungsrunde ist vor kurzem abgelaufen. Beworben haben sich 74 Forschende des ETH-Bereichs (ETH, EPFL, PSI, WSL, Empa, Eawag) aus 10 Disziplinen. Ausgewählt hat das SDSC acht Projekte, wobei an vier von ihnen Forschende der ETH Zürich beteiligt sind. Die ETH-Projekte stammen vor allem aus den Umwelt– und Gesundheitswissenschaften aber auch Deep Learning ist dabei ein wesentlicher Bestandteil.

Deep Learning ist eine Methode des maschinellen Lernens. Dabei wird ein künstliches neuronales Netzwerk eingesetzt, um typische Muster in grossen Datenmengen zu erkennen. Neuronale Netze können auch Muster und Objekte in Bildern erkennen und generieren, etwa Bilder von Gesichtern oder Interieurs, die täuschend echt aussehen.   

Bilder erkennen – im Kosmos und unter dem Mikroskop

Thomas Hofmann, Professor für Datenanalyse der ETH Zürich und Alexander Refregier vom Institut für Teilchen- und Astrophysik setzen die Methode in ihrem SDSC-Projekt für die Kosmologie ein. Sie wollen zum Beispiel Modellvorhersagen über die Masseverteilung im Kosmos miteinander vergleichen und die Gültigkeit eines wissenschaftlichen Ergebnisses überprüfen. In einem aktuellen Beitrag in Science Astronomy zeigen sie etwa, dass es möglich ist, mit neuronalen Netzen Bilder des Kosmos zu generieren, die dessen komplexe Strukturen und Muster korrekt darstellen. Methoden des maschinellen Lernens erweitern so das Instrumentarium der Kosmologie und helfen dabei, die Evolution des Universums zu erforschen.

Auf der gleichen Methode basiert das Projekt von Ender Konukoglu, Professor für medizinische Bildverarbeitung an der ETH Zürich, und Anne Bonnin von der Professur für Röntgenbildgebung der ETH Zürich. Sie untersuchen jedoch nicht Bilder des Universums, sondern mikroskopische Bilder in den Bereichen Medizin und Biologie. Sie erhoffen sich dadurch detailliertere Bildanalysen und ein besseres Verständnis der biologischen Zusammenhänge.

Nationale Initiative für die Datenwissenschaften

Das Swiss Data Science Center ist ein gemeinsames Projekt von der ETH Lausanne und der ETH Zürich. Es wurde im Januar 2017 gegründet mit dem Ziel, die multidisziplinäre Zusammenarbeit in der Datenwissenschaft zu ermöglichen und gleichzeitig zu fördern.

Die Datenwissenschaften gehören zu den strategischen Forschungsgebieten des ETH-Bereichs für die Jahre 2017 bis 2020. Seit September 2017 bieten die EPFL und die ETH Zürich Master-Studiengänge in Datenwissenschaften an, welches zu weiteren Kooperationen mit dem Swiss Data Science Center (SDSC) führen wird.

JavaScript wurde auf Ihrem Browser deaktiviert