Systemen den Puls fühlen

Schon kleine Störungen in Infrastruktursystemen können fatale Folgen haben. Um das zu verhindern, setzen Forschende und Praktiker auf verschiedensten Ebenen an. Vier Beispiele.

Skyline
Nicht nur in Singapur: Planerische Entscheide beeinflussen die Resilienz urbaner Systeme langfristig. (Bild: Colourbox)

Urbane Systeme: Resilienz erhöhen

Von Haus aus ist Božidar Stojadinović Spezialist für erdbebensicheres Bauen. Heute befasst er sich mit urbanen Systemen und wie man sie resilienter gegen Störungen machen kann. «Systemisches Engineering wurde für die Resilienzforschung immer wichtiger», erklärt der Professor für Strukturdynamik und Erdbebeningenieurwesen. So ist es kein Wunder, dass er nun im Future Resilient Systems Programme in Singapur ein Forschungscluster leitet, bei dem es um alles andere, nur nicht um Erdbeben geht.

Ziel ist vielmehr, die Resilienz von dicht verflochtenen urbanen Systemen, wie Singapur eines darstellt, zu verstehen und im Hinblick auf zukünftige Entwicklungen zu verbessern. Klimawandel und Raumknappheit sind die zentralen Probleme, mit denen Singapur sich für die Zukunft konfrontiert sieht. Deshalb sind langfristig vorausschauendes Planen und eine rechtzeitige Anpassung der städtischen Infrastruktur gefragt.

Mit Forschenden der Nanyang Technological University NTU in Singapur und der National University of Singapore NUS entwickelt Stojadinović ein umfassendes Computermodell, ein digitales Abbild der Stadt, mit dem sich die urbanen Systeme, Veränderungen und ihre Folgen simulieren lassen. Es umfasst alle Gebäude, die damit verbundenen Infrastruktursysteme wie Energie- und Wasserversorgung, aber auch Nutzerinteraktionen. Grundlage des Modells ist eine Computersoftware, die ursprünglich für militärische Kriegsspiele entwickelt wurde und im Gaming breite Verwendung findet.

Die Software erlaubt es, verschiedene Simulationen von unterschiedlichen Systemen selbstständig ablaufen zu lassen und Informationen zwischen ihnen auszutauschen. «Das ist entscheidend», sagt Stojadinović. Denn urbane Systeme sind sehr komplex und die einzelnen Teilsysteme beeinflussen sich gegenseitig. «Einzelne Systeme zu modellieren und zu optimieren, funktioniert heute schon recht gut. Doch wie sich Systeme gegenseitig beeinflussen, verstehen wir oft noch zu wenig.» Das Modell, das Stojadinović und seine Mitforschenden entwickeln, soll das ändern und den Expertenblick über die Grenzen einzelner Infrastruktursysteme hinaus aufs ganze urbane System lenken.

Kritische Netzwerke: Risiken managen

«Das hat niemand vorhersehen können», heisst es oft, wenn Systeme versagen. Giovanni Sansavini, ETH-Professor für Zuverlässigkeits- und Risikoanalyse, arbeitet jeden Tag daran, diesen Satz zu widerlegen. Der Ingenieur erforscht Risiken in komplexen Netzwerken, zum Beispiel in voneinander abhängigen Energienetzen oder grossen Lieferketten.

Risiken in komplexen Systemen sind wissenschaftlich schwer fassbar. Denn die Systeme wachsen oder schrumpfen mit der Zeit, ändern ihre Struktur, umspannen oft den ganzen Globus und haben oft auch keinen fixen Betriebsmodus. Ein Stromnetz etwa ist diversen Einflüssen ausgesetzt. Und unter Last reagieren Systeme anders als im Normalbetrieb. Für ihre Experimente nutzen Sansavini und seine Gruppe deshalb Computermodelle. Risiken identifizieren sie anhand eines wissenschaftlichen Ansatzes, der sich Unsicherheitsquantifizierung nennt.

Dabei berücksichtigen die Forschenden alle erdenklichen Arten von Einwirkungen, Fehlern und Störungen – und beobachten, wie sich das modellierte Netzwerk verhält. Sogenannte Monte-Carlo-Simulationen erlauben es, das Zusammenwirken unzähliger Störungen zu analysieren. Darin liegt ein Schlüssel, um verborgene, sogenannt systemische Risiken zu finden. Denn oft wird in komplexen Systemen die Verkettung von Störungen zum Problem. So geschehen beim grossen Stromausfall in Italien im Jahr 2003, dessen Ursache automatische Systeme waren, die unter der Last kaskadenartig abschalteten.

Anhand von Sansavinis Modellen lassen sich Risiken nicht nur identifizieren, sondern auch quantifizieren. Es lässt sich ermitteln, welche Kombinationen von Störungen die schlimmsten Folgen für ein System haben und wie wahrscheinlich diese sind. Wenn man diese Szenarien kennt, kann man Systeme entsprechend schützen. Bei Energienetzen zum Beispiel, indem man sie flexibler und unabhängiger von einzelnen Quellen macht, indem man Frühwarnsysteme aufbaut, ihre Schwachstellen technisch verbessert oder indem man ihnen die Fähigkeit verleiht, nach Störungen schnell wieder zum Normalzustand zurückzukehren. «Allerdings können wir Systeme noch so robust bauen, Menschen machen Fehler und Unvorhergesehenes geschieht», sagt Sansavini. Das Gute daran: Auch diese Fehler lassen sich virtuell nachbilden, um das System für die nächste Störung besser zu verstehen und zu schützen.

Kompelexe Anlagen: Ausfälle voraussehen

Flugzeugtriebwerk
ETH-Forschende können die Lebensdauer von Flugzeugtriebwerken mit lernenden Algorithmen prognostizieren. (Bild: Colourbox)

Olga Fink und ihr Team befassen sich mit Störungen bei komplexen Anlagen – von Flugzeugen über Gasturbinen bis hin zu Infrastruktursystemen wie Eisenbahnen. Die Professorin für intelligente Instandhaltungssysteme arbeitet dazu mit lernenden Algorithmen. Dabei können die Überwachungssysteme auf verschiedenen Stufen ansetzen: Es kann darum gehen, Fehlzustände einer Anlage zu detektieren, aber auch darum, verschiedene Ausfallarten zu diagnostizieren. Anspruchsvoller ist es, Vorhersagen zu treffen, wann der nächste Ausfall stattfinden könnte. Und schliesslich geht es um die sogenannte präskriptive Instandhaltung. «Wir versuchen dabei, Prognosen zu machen und den Betrieb einer Anlage so zu regeln, dass man ihre Lebensdauer verlängern kann», erklärt Fink. Dazu lernen intelligente Algorithmen von historischen und von in Echtzeit verfügbaren Zustandsüberwachungs- und Betriebsdaten.

Doch lernende Algorithmen brauchen sehr viele Daten. Das ist ein Problem. «Störungsfälle sind in sicherheitsrelevanten Anlagen die Ausnahme – deshalb gibt es dazu eben nicht so viele Daten, wie eigentlich nötig wären», sagt Fink. So greifen die Forschenden zu mehreren Tricks: «Wir arbeiten beispielsweise mit Daten, die den Normalzustand der Anlagen abbilden, und bringen dem Algorithmus bei, auf Abweichungen zu achten.» Manchmal hilft es auch, Daten von ähnlichen Anlagen hinzuzuziehen und sie auf die jeweilige Anlage zu adaptieren. Oft ist es trotzdem nicht möglich, genügende Datenmengen zu erhalten.

Deshalb kombinieren die Forschenden ihre Algorithmen mit physikalischen Modellen, die das zu überwachende System simulieren, oder reichern die KI-Modelle mit physikalischem Expertenwissen an. Damit brauchen die Algorithmen weniger Daten, werden aber auch besser interpretierbar für Fachexperten, die auf Basis der Algorithmen Entscheidungen treffen müssen. So konnten die Forschenden in einem Projekt mit der NASA die Lebensdauer von Flugzeugtriebwerken prognostizieren. Dies ist eines der Projekte, auf das Olga Fink besonders stolz ist. Frühdetektionen von Störungen gelingen nämlich allgemein schon recht gut. Lebensdauerprognosen aber, sagt sie, seien quasi der heilige Gral des Forschungsgebiets.

Heikle Forschungseinrichtungen: auf Redundanz setzen

Für Walter Iten, Leiter der Abteilung Betrieb der ETH Zürich, gehört das Management von Störungen zum Alltag. Seine Abteilung ist verantwortlich für das technische und infrastrukturelle Management aller ETH-Gebäude und -Anlagen. Die grössten Probleme stellen für Iten Stromunterbrüche dar: «Ohne Strom läuft gar nichts.» Deshalb setzt die ETH auf Redundanz. So kann der Betrieb in einem Teil des ETH-Standorts Zentrum von zwei verschiedenen Unterwerken Strom beziehen. Kommt es doch einmal zu einem grösseren Ausfall, kommen Diesel-Notstromaggregate für die wichtigsten Bereiche zum Einsatz. Und für besonders heikle Forschungsanlagen wird mit Hilfe von Batterien eine unterbruchlose Stromversorgung gewährleistet.

Eine vorausschauende Wartung aller Anlagen und Gebäude ist zudem das A und O, wenn es darum geht, Störungen aller Art gar nicht erst aufkommen zu lassen. Ein IT-Wartungstool hat die Betriebsstunden von Anlagen und Wartungstermine im Blick und löst fristgerechte Wartungsaufträge aus. Daneben spielt die Überwachung von Anlagen mittels Sensoren eine immer grössere Rolle, um spontan auftretende Störungen zu erkennen. Die Daten können von den Betriebsmitarbeitenden remote via Computer abgerufen werden, und sie können so auch bis zu einem gewissen Grad in den Betrieb eingreifen. Noch sind das System zur Anlagenüberwachung und das Wartungstool nicht miteinander verbunden. Angesichts der Fortschritte in Sensortechnik und KI ist das jedoch nur noch eine Frage der Zeit.

Dieser Text ist in der Ausgabe 21/01 des ETH-Magazins Globe erschienen.

JavaScript wurde auf Ihrem Browser deaktiviert