Perlen fischen im Datenmeer

Daten sind Schätze: Für Organisationen, die es verstehen, aus der Flut an unstrukturierten Daten sinnvolle Informationen zu schöpfen, eröffnen sich neue Welten. Am Lokaltermin des ETH-Präsidenten zeigten Forscher und Wirtschaftsvertreter wie Daten künftig einer breiten Öffentlichkeit dienen könnten.

Vergrösserte Ansicht: ralph eichler
ETH-Präsident Ralph Eichler begrüsste zahlreiche Gäste zum Lokaltermin über das Thema Big Data. (Bild: Tom Kawara)

Was machen 130 Vertreter aus Industrie, Forschung und Politik in einer kahlen Betonhalle im fünften Untergeschoss des LEE-Neubaus an der Zürcher Leonhardstrasse? Sie suchen die Nähe zu Daten; zu unglaublichen Mengen von Daten. Denn hier werden nach Fertigstellung des Baus im Juni zahlreiche Rechnertürme Unmengen von Forschungsdaten speichern und verarbeiten. «Big Data» nennt sich dies in Neudeutsch – und um Chancen und Risiken bei der aktiven Nutzung von ausufernden Datenmeeren sollte es am zweistündigen Lokaltermin gehen, zu dem ETH-Präsident Ralph Eichler und die ETH Zürich Foundation vergangenen Mittwoch geladen hatten.

Technologische Revolution

Dirk Helbing, ETH-Professor für Soziologie, veranschaulichte die schiere Flut an Daten, die heute weltweit generiert wird, mit einigen eindrücklichen Zahlen: In einem Jahr werden heute mehr Daten produziert als in der gesamten bisherigen Menschheitsgeschichte. Die Prozessorleistung von Computern verdoppelt sich alle 18 Monate und in zehn bis 15 Jahren sind Computer mit der Leistungsfähigkeit des menschlichen Hirns verfügbar. «Wir befinden uns in einer technologischen Revolution», konstatierte Helbing. «Und das wird auch den Arbeitsmarkt durcheinander wirbeln.»

Für Helbing birgt dieses Datenmeer, zusammengesetzt aus E-Mails, Tweets, Youtube-Videos, Geschäftsberichten, Sensordaten und Bildern, unglaubliche Möglichkeiten: Simulationen mit Daten aus Finanzmärkten, der Realwirtschaft, von Epidemien, Konflikten und Umwelt-Veränderungen könnten in Echtzeit Informationen darüber liefern, wie sich politische, ökonomische und ökologische Entscheidungen auf unsere zukünftige Welt auswirken. «Big Data wird uns helfen, wesentlich besser informierte Entscheidungen zu treffen», ist Helbing überzeugt.

Big Data in der Medizin

«Big Data» ist schon heute praktisch nicht mehr aus der Wissenschaft wegzudenken. Alleine von den sechs Forschungsvorhaben, die bis Januar 2013 um EU-Flagship-Projekte und damit um eine Milliarde Euro Fördergelder buhlten, versprachen drei neue Erkenntnisse aufgrund der Analyse riesiger Datenmengen. Egal ob Neurowissenschaften, Krebsforschung oder Soziologie: die meisten Disziplinen werden in Zukunft zumindest partiell auch zu «Big Data»-Wissenschaften.

Ausgesprochen interessiert an Big Data ist derzeit die Medizin, wie Joachim M. Buhmann, ETH-Professor für Informatik, in seinem Inputreferat ausführte. Mediziner sammeln für Diagnosen und Prognosen unzählige Daten. Meist werden diese nach einer partiellen Auswertung archiviert, ohne weiter genutzt zu werden. Das soll sich ändern: Buhmann entwickelt Systeme, um Patientendaten und Diagnose-, Prognose- und Therapiedaten der Mediziner zu verbinden. Algorithmen könnten dann zum Beispiel in Bildern von Gewebeentnahmen berechnen, wo die wesentliche Information im Bild steckt und diese gleichzeitig mit tausenden von ähnlichen Datensätzen vergleichen. Oder die Algorithmen machen sich auf die Suche nach sogenannten Biomarkern, die Hinweise auf bestimmte Krankheiten geben, wie zum Beispiel Krebs. All dies mit dem Ziel, die Information solange zu verdichten, bis möglichst wahrscheinliche Aussagen über den Verlauf einer Krankheit und die Erfolgsaussichten von Therapien möglich sind. Buhmann sprach sich denn auch für die Etablierung einer «Health Data Science» aus, einer Wissenschaft mit Experten, die mit solchen Daten umzugehen wissen.

Technische Hürden und Datenschutz

Martin Erkens, Vizedirektor und Global Head of Pharma Research & Early Development Informatics bei F. Hoffmann-La Roche, warnte jedoch vor allzu hohen Erwartungen: «Die Realität hinkt derzeit noch hinter den Versprechungen her.» Seine Erfahrung in der Pharmabranche hat ihn gelehrt, dass noch sehr viele technische Probleme zu lösen sind, um Patientendaten in «Big Data»-Anwendungen sinnvoll nutzen zu können.

Zusätzlich zu den technischen Problemen stellen sich aber auch Datenschutz-Fragen: Derzeit könne man die Datenauswertung noch im Unternehmen selbst leisten, so Erkens. Das könnte sich künftig jedoch ändern, wenn dermassen ausufernde Datenmengen anfallen, dass das Unternehmen bei Auswertungen auf externe Hilfe angewiesen ist.

Donald Kossmann, ETH-Professor für Informatik, skizzierte in seinem Inputreferat mögliche Lösungen, um Risiken beim Umgang mit persönlichen Daten zu minimieren. Er stellte eine Technologie vor, mit welcher unterschiedliche Datensätze in einer «Cloud» verbunden und Dritten zugänglich gemacht werden können, ohne dass dafür die Rohdaten aus der Hand gegeben werden.

Datenweitergabe aus Not heraus

Besonders in der Medizin ist der Persönlichkeitsschutz oberste Priorität. Doch wer von ausgefeilten Prognosen profitieren will, muss mit eigenen Patientendaten zum Datenpool beitragen. Brigitte Tag, Professorin am Lehrstuhl für Strafrecht, Strafprozessrecht und Medizinrecht an der Universität Zürich, betonte, dass die Weitergabe von medizinischen Daten oft nicht freiwillig, sondern aus einer Notsituation heraus geschieht. Für eine schnelle Genesung ist dem Patienten oft jedes Mittel recht. Für sie gilt deshalb: «Vertrauen ist gut, doch Kontrolle ist besser.» Der Umgang mit Patientendaten müsse einerseits gesetzlich klar geregelt werden, andererseits müssten Nutzer Vertrauen schaffen, dass die Daten tatsächlich zum Wohle der Allgemeinheit eingesetzt werden. Dass die Gesetzgebung heute immer einen Schritt hinter der rasanten technologischen Entwicklung her hinke, liege in der Natur der Sache. Wo das Recht heute noch nicht greife, da komme die Ethik ins Spiel, erklärte Tag.

Dass auch diese nicht immer greift, zeigte unlängst ein Beispiel in England: Hausärzte haben dort eine nationale Datenbank mit Patientendaten gefüttert, ohne die Patienten darüber zu informieren. Das Projekt «care.data» wurde gestöppt, weil sich die Öffentlichkeit empörte. «Es muss klar geregelt sein, wer welche Daten hat und was damit gemacht werden darf», forderte Tag. «Und wir müssen uns stets die Frage stellen: Was wollen die Menschen, von welchen wir unsere Daten erhalten.»

Eine Möglichkeit zur Sicherung der eigenen Datenhoheit skizzierte Soziologieprofessor Dirk Helbing: Über ein persönliches digitales Datenkonto könnte der Nutzer künftig frei über seine Daten verfügen und sie bei Bedarf auch löschen. Persönliche Daten könnten dann auch an eine Art App-Store verkauft werden, so die Vorstellung Helbings, wo sie nach Qualität bewertet werden und Unternehmern für ihre Business-Ideen zur Verfügung stehen.

Drei neue «Big Data»-Professuren

ETH-Präsident Ralph Eichler bekräftigte gegen Ende des Lokaltermins die Absicht, die «Data Science» an der ETH weiter auszubauen. Dafür sollen in naher Zukunft drei neue Professuren geschaffen werden: Eine für «Medical IT» zusammen mit dem Universitätsspital Zürich, eine für «Informationssysteme» und eine für «Social Network Analysis». Das dadurch generierte Wissen zu «Big Data» soll nicht zuletzt auch dem Wirtschaftsstandort Schweiz zugute kommen. Weiter kündigte Eichler an, dass die ETH für die Periode 2017 bis 2020 eine Botschaft ins Parlament bringen werde, die die Vereinheitlichung der Datenstruktur aller Schweizer Universitätsspitäler zum Ziel hat.

JavaScript wurde auf Ihrem Browser deaktiviert