AlphaZero will doch nur spielen!
Künstliche Intelligenz wurde immer mal wieder hochgejubelt und geriet ebenso schnell wieder aus dem Fokus. Roger Wattenhofer erklärt, warum das bald anders sein könnte.

In den vergangenen 60 Jahren haben die Forschenden der Künstlichen Intelligenz immer wieder futuristische Prognosen gewagt. Zum Beispiel wurde angekündigt, dass ein Computer Schachweltmeister wird. Erwartet wurde das bis ins Jahr 1968, eingetreten ist es etwa 30 Jahre später. Noch optimistischer war die Vorhersage, dass Computer bis 1985 gar beliebige menschliche Arbeiten erledigen können; davon sind wir heute noch ziemlich weit entfernt.
Ein Auf und Ab in der Geschichte
Die Ernüchterung folgte oft auf dem Fuss, die gross angelegten Forschungsprogramme wurden eingestampft, es folgte der «externe Seite Winter der Künstlichen Intelligenz». Zwischenzeitlich mochten die Forscher nicht einmal mehr von Künstlicher Intelligenz sprechen, man wurde bescheidener und studierte stattdessen Maschinelles Lernen (Machine Learning).
Um die Jahrtausendwende gab es dann einige Erfolge: IBM’s Deep Blue bezwang Garry Kasparov im Schach. Kritiker monierten, dass Schach sowieso kein richtiger Intelligenztest sei, und wiederholten das sogenannte externe Seite Chinesische Zimmer -Argument von John Searle: Deep Blue verstehe das Spiel nicht wirklich, er rechne nur sehr schnell. Ein paar Jahre später schaffte es ein Auto von Stanford autonom zu navigieren. Aber auch das gelang nur in der Wüste. Und schliesslich gewann IBM’s Watson in der Quizshow Jeopardy! – doch war das wirklich intelligent, oder einfach nur googeln für Fortgeschrittene?

Zu oft «Wolf!» gebrüllt?
Ich vermute mal, dass die KI-Forschung und ihre Exponenten zu oft «Wolf!» gebrüllt haben. Mit dem Resultat, dass jetzt Erfolge und echte Durchbrüche nicht mehr wirklich ernst genommen werden. Doch der Wolf ist hier, und er hat einen Namen: externe Seite AlphaZero.
AlphaZero, ein Computerprogramm von DeepMind, kann autodidaktisch lernen, zum Beispiel auch Schach. Seit Deep Blue haben sich die Schachprogramme stetig weiterentwickelt. Die besten Programme wie Stockfish haben seit vielen Jahren ein so hohes Niveau, dass Menschen gegen sie chancenlos sind.
«AlphaZero spielt sehr ungewöhnlich, nicht wie ein Mensch, aber auch nicht wie ein typischer Computer.»Roger Wattenhofer
Stockfish hat viel Schachtheorie intus, kennt jede jemals gespielte Partie. AlphaZero kannte nur die Schachregeln, es lernte das Spiel, indem es einige Stunden gegen sich selbst spielte. Zuerst wird es dabei sehr viele Anfängerfehler gemacht haben, aber nach vier Stunden autodidaktischem Training bezwang AlphaZero Stockfish. (Es gibt allerdings einige externe Seite berechtigte Einwände bezüglich Hardwareeinsatz und unfairen Wettkampfregeln.)
Das Spiel der Profis wird sich verändern
Allen, die etwas von Schach verstehen, empfehle ich, sich die externe Seite zehnte Partie gegen Stockfish anschauen. AlphaZero spielt sehr ungewöhnlich, nicht wie ein Mensch, aber auch nicht wie ein typischer Computer, sondern mit «echter künstlicher» Intelligenz. Da AlphaZero zu Beginn keine Schachtheorie kannte, musste es seine eigene Theorie entwickeln. Grossmeister Daniel King behauptet, dass AlphaZero die Schachtheorie und das Spiel der Profis ändern werde, sobald es öffentlich zugänglich ist.
AlphaZero ist gewissermassen «menschlicher» als normale Computer. Die Deep Network Struktur erinnert an das menschliche Gehirn, und es rechnet langsamer. Es wertet pro Partie tausendmal weniger Stellungen aus als Stockfish. Es wäre interessant zu sehen, wie eine Partie Mensch gegen AlphaZero ausgeht, wenn AlphaZero auf «Menschen-Geschwindigkeit» gebremst würde. Und AlphaZero kann nicht nur Schach. Es kann auch andere Spiele, die es sich selber beigebracht hat.
Ich jedenfalls bin beeindruckt. AlphaZero's Leistung zeigt, dass wir die Künstliche Intelligenz ernst nehmen müssen. Sie beweist, dass wir Zeitzeugen eines gewaltigen Wandels sind. Ich bin überzeugt: AlphaZero & Co. werden die Gesellschaft nachhaltig verändern.
Kommentare
Es sind zusätzliche Kommentare in der englischen Fassung dieses Beitrags verfügbar. Alle Kommentare anzeigen
Also beispielsweise ob der Vierbeiner auf dem Bild ein Pferd oder ein Hund ist. „Das ist genauso, wie Kindern etwas beizubringen“. „Die Algorithmen sind dabei kein Geheimnis, der Schlüssel sind die Daten.“ Denn nur mit riesigen Datenmengen können die neuronalen Netze einer KI-Software sinnvoll trainiert werden. Und die meisten Versicherungen sind Großkonzerne, die riesige Datenmengen besitzen. Künstliche Intelligenz ist eine Technologie mit großem Potenzial – nicht nur in der IT. Autos können dank intelligenter Bilderkennung autonom durch den Stau steuern, Maschinenbauer den richtigen Zeitpunkt für die Wartung vorhersagen, Kanzleien massenhaft Akten zusammenfassen lassen. Drei von vier internationalen Entscheidern erwarten, dass KI für den geschäftlichen Erfolg eine fundamentale Rolle spielt, und die „Elektrizität des 21. Jahrhunderts“ist, die nach und nach alle Branchen revolutionieren werde.
Das weite Feld der KI Unter KI fallen viele Schlagworte, darunter Maschinenlernen, Deep Learning und kognitive Technologien. Manches davon ist reines Marketing, anderes betont eine bestimmte Stoßrichtung. So gibt es rein softwarebasierte KI-Systeme wie Googles lernender Go-Großmeister AlphaGO, der mit jedem gespielten Spiel stärker wird. Andere Anwendungen verwenden spezielle Sensorik, um beispielsweise reale Gegenstände und Sprache kognitiv zu erkennen oder sie greifen sogar selbst in die Umgebung ein, wie wir es von Autonomen Fahrzeugen oder Robotern kennen. KI ist seit über 50 Jahren ein spannendes Forschungsthema. Dass erst jetzt kommerzielle Anwendungen zum Einsatz kommen oder besser gesagt geradezu explodieren, hat gleich mehrere Gründe: Erstens war es früher schwierig, genug Trainingsmaterial in Form von Daten, Bildern oder Videos zu bekommen — das ist heute dank Instagram, YouTube usw. kein Problem mehr. Zweitens ist erst jetzt genug Rechenleistung vorhanden, um KI wirtschaftlich betreiben zu können. Algorithmen sind kein Geheimnis, der Schlüssel sind Daten. Es ist ein Beispiel dafür, wie Künstliche Intelligenz (KI) praktisch eingesetzt wird. Denn im Kern geht es dabei darum, dass Computer selbst lernen, Dinge zu erkennen und Entscheidungen zu treffen.
Lieber Herr Wattenhofer, vielen Dank für Ihren Artikel. Als Historiker könnte ich darauf hinweisen, dass der Mensch Maschinenvergleich eine lange Tradition hat, vom Blutkreislauf Harveys über den Homme Machine von La Mettrie und das Konzept des des menschlichen Körpers als thermodynamische Maschine hin zu den informationstechnischen (telegrafischen) Modellierungen des Nervensystem oder der genetischen Codierung. Den bisherigen Rest dieses Wettbewerbs haben Sie schön beschrieben. Als Historiker kann ich aber auch darauf hinweisen, dass diese Vergleiche immer nur dann interessant sind, wenn der sog. Mensch gerade noch überlegen bleibt. Danach erlischt das Interesse am Vergleich (niemand regt sich mehr über Schachcomputer auf) oder die Regeln des Wettstreits werden neu formuliert, so dass es wieder interessant wird. Und das ist es wohl, was die Welt, das Menschenbild, das Maschinenbild und die Gesellschaft verändert. Herzliche Grüsse, Ihr David Gugerli
Künstliche Intelligenz müssen wir sicherlich ernst nehmen - allerdings nicht in dem Sinne, dass Maschinen jetzt wie Menschen denken würden. Genau das tun sie ja bis jetzt nicht. AlphaZero kann Go oder Schach besser erlernen als ein Mensch, sonst aber kann AlphaZero nichts und während dieses Programm Go spielt, weiss es nicht einmal, was es überhaupt macht. Zu Zitat "Da AlphaZero zu Beginn keine Schachtheorie kannte, musste es seine eigene Theorie entwickeln." lässt sich nur sagen: Das ist höchst irreführend, den es waren menschliche Programmierer, die das Lernverhalten von Alpha Zero implementierten, nicht Alpha Zero selber. Deep Mind ( https://deepmind.com/blog/alphago-zero-learning-scratch/call_made ) schreibt dazu: "As it plays, the neural network is tuned and updated to predict moves, as well as the eventual winner of the games. This updated neural network is then recombined with the search algorithm to create a new, stronger version of AlphaGo Zero, and the process begins again. In each iteration, the performance of the system improves by a small amount, and the quality of the self-play games increases, leading to more and more accurate neural networks and ever stronger versions of AlphaGo Zero." Ein Mensch, der nur zu Leistungen a la "AlphaGo Zero" fähig wäre, würden wir als inselbegabt bezeichnen. Solch ein Mensch könnte seinen Alltag nicht selber bewältigen. Auch AlphaGo Zero kann das nicht.
@Merlin Medici: Alpha Go Zero basiert nach Aussagen seiner Entwickler bei der Firma Deep Mind auf Reinforcement Learning (Bestärkendes Lernen) wobei als Suchstrategie Spielbäume verwendet werden (ein Spielbaum enthält in seinen Ästen die nächsten möglichen Züge). Bei Alpha Go entscheidet ein vielschichtiges neuronales Netzwerk, welcher von den möglichen Zügen gewählt wird und in jedem Verbesserungsschritt wird dieses neuronale Netzwerk auf der Basis des schon Erreichten neu trainiert. Der Nature-Artikel Mastering the game of Go without human knowledge ( https://www.nature.com/articles/nature24270call_made ) geht detailliert darauf ein. In ihrem Kommentar, Merlin Medici, schreiben sie "Wir lernen aus Erfahrungen. Hier sind die Parallelen zum Menschen durchaus vorhanden". Sie haben recht: im Vergleich zu früheren Spielalgorithmen für das Schachspiel, ist der Alpha-Go-Algorithmus sehr viel allgemeiner. Doch letztlich ist es nur ein Algorithmus und erst noch einer, der keine der spezifisch menschlichen Fähigkeiten wie symbolisches Denken, Denken in Zusammenhängen, etc. beinhaltet. Mich selbst erstaunt es vielmehr, dass es so lange gedauert hat, bis ein Algorithmus in der Lage war, 2-Personen-Brettspiele mit perfekter Information ( siehe https://de.wikipedia.org/wiki/Spiel_mit_perfekter_Informationcall_made ) ausgehend nur von den Spielregeln besser als ein Mensch zu spielen. Für die meisten Menschen ist Schach aber nur eine Kuriosität. Wer Schach kann, kann noch lange nicht alles (Wichtige).
Naja, das Lernverhalten von Menschen ist auch vorbestimmt dadurch wie Zellen aufgebaut sind, wie sie aufgrund von biologischen, chemischen und physikalischen Prinzipien verbunden werden und wie sie miteinander interagieren. Darin unterscheidet AlphaZero sich nicht von Menschen und Tieren. Auch die Beschreibung von AlphaZeros Lernverfahren passt ziemlich gut zu einem Makro-Lernverfahren von Menschen: Wir lernen aus Erfahrungen. Hier sind die Parallelen zum Menschen durchaus vorhanden. Was mich mehr interessieren würde, ist, ob AlphaZero - wie seine Vorgänger - im wesentlichen ein Hopfield-Netzwerk ist, oder ob man die Werkzeugkiste inzwischen um ein dem Gehirn näheres Werkzeug ergänzen konnte. Die Hopfield-Netzwerke sind ja wirklich nur ein sehr elementarer Schatten von dem, was im Gehirn vorgeht.