Das Ende aller Theorie?

Vielleicht haben wir den Punkt erreicht, an dem Wissenschaftler aufhören, Theorien zu entwerfen, die sie dann experimentell überprüfen können. Stattdessen begnügen wir uns mit den Daten, die uns ja überreichlich zur Verfügung stehen, und werten diese Daten dann je nach Bedarf aus. Nicht im Hinblick darauf, was für eine Wahrheit hinter diesen Daten verborgen liegt, sondern einzig und allein mit Blick darauf, ob das Resultat für unseren konkreten Zweck funktioniert.
Das meint jedenfalls Chris Anderson auf Wired:
Alle Modelle sind falsch, aber zunehmend können wir ohne sie auskommen.
Peter Norvig (KI-Wissenschaftler, z.Zt. Director of Research bei Google)
Norvigs Motto stellt dabei die augenzwinkernde Erweiterung einer 30 Jahre alten Feststellung von George Box dar: “Alle Modelle sind falsch, einige sind jedoch ganz nützlich.”
Was Google betrifft, so sticht dieses Prinzip unmittelbar ins Auge. Googles Index versucht gar nicht erst, zu verstehen, ob die Inhalte einzelner Seiten richtig oder falsch, wissenschaftlich oder unwissenschaftlich, rechts oder links, nüchtern oder bunt sind. Google sammelt einfach stumpf Daten, z.B. wieviele Seiten in welchem Kontext auf welche anderen Seiten verlinken (und vieles, vieles mehr), und läßt dann mathematische Verfahren auf diese Daten los. Diese Verfahren liefern keine Theorie guter Webseiten, sondern nur (statistische) Vorhersagen darüber, was dem Suchenden weiterhelfen könnte. Google geht nicht lingustisch, kulturell, semantisch vor.
Läßt sich dieses Verfahren auf die Wissenschaften insgesamt übertragen? - Davon ist Chris Anderson überzeugt: Quantenmechanik und Genetik stellen keine vollständigen Theorien zur Verfügung. Und je mehr wir über den Gegenstandsbereich wissen, umso weiter sehen wir uns angesichts der wachsenden Komplexität von einer tatsächlichen Erklärung entfernt. Nichtsdestrotrotz können wir der Komplexität mit den riesigen Datenspeichern und fixen Prozessoren des Petabyte-Zeitalters zu Leibe rücken. Das Ergebnis sind dann aber nicht Erklärungen, sondern bloß nützliche Korrelationen.
Anderson prophezeit, dass solche Korrelationen die Modellbildung in den Wissenschaften ablösen werden - und zwar ohne Nachteile, denn schließlich seien die Modelle ja sowieso nur Annäherungen an die Wirklichkeit, die sie nie vollständig beschreiben. Auf den ersten Blick eine berückende These! Aber stimmt sie auch, wenn man genauer hinschaut?
Anderson führt die Genetik als Beispiel an - und gerade die könnte gute Gegenbeispiele liefern. Ein neuerer Trend ist z.B. die Herstellung von (einfachen) künstlichen Organismen aus Genbausteinen. Dieses “Gen-Lego” funktioniert aber nicht näherungsweise, sondern beruht auf einem wachsenden, genauen, Verständnis davon, welche Aminosäurensequenzen welche Proteine codieren, und wie genau deren Synthese dann in einem fertigen Organismus mündet. Hier ist das Modell also nicht “falsch” (also nur grob angenähert), sondern exakt (wenn auch noch ziemlich unvollständig). Wie funktioniert dann aber Andersons Argument? - Er weist darauf hin, dass zwischen Genetik und menschlichem Verhalten eine Theorielücke klafft:
Weg mit allen Theorien menschlichen Verhaltens, von Linguistik bis Soziologie. Vergessen wir Taxonomie, Ontologie und Psychologie. Wer weiß schon, warum Menschen tun, was sie tun? Der Punkt ist: sie tun es, und wir können das mit hervorragender Genauigkeit verfolgen und messen.
Chris Anderson
Linguistik, Soziologie und Psychologie sind jedoch keine Beispiele für (funktional) modellbildende Wissenschaften. Sie versuchen gar nicht erst, mit naturwissenschaftlicher Genauigkeit zu erklären, warum Menschen tun, was sie tun. Sie können deshalb (die Ausnahme bestätigt hier die Regel) auch keine formalen Modelle liefern, die dann zur Vorhersage menschlichen Verhaltens genutzt werden können - vielmehr ordnen sie bisherige Daten in einen begrifflichen Kontext ein. Die Quantenphysik und die Genetik haben jedoch einen ganz anderen Anspruch. Die Physik soll mir vorhersagen, wie ein Nickel-Silizium-Substrat beschaffen sein muß, in dem ein Quantenconfinement einen Transistor mit einer Gate-Länge von weniger als 35 Nanometern ermöglicht. Die Genetik soll mir verraten, wie membrangebundene P450-Moleküle zu Reduktasen verbunden werden können. - Das sind keine statistischen Fragen nach irgendwelchen Korrelationen, das sind Fragen danach, wie etwas funktioniert!
Anderson berührt in seinem Essay im Vorübergehen viele interessante Fragen zum unterschiedlichen Modellbegriff in Natur- und Kulturwissenschaften, zum aktuellen Mangel an funktionalen Modellen in Ökonomie und Neurowissenschaft, zum Spannungsverhältnis von wissenschaftlichem Positivismus und Poststrukturalismus. Leider geht er auf diese Fragen nicht ein; vermutlich weiß er nicht mal, dass sie seit mehr als einem Jahrhundert ziemlich tiefgehend in der Wissenschaftsphilosophie erörtert werden.
Google kann Sprachen übersetzen, ohne sie wirklich zu “können” (vorausgesetzt, man verfügt über gleiche Text-Korpora, so kann Google ebenso leicht Klingonisch in Farsi übersetzen, wie es das von Französisch nach Englisch vermag).
Chris Anderson
Mir scheint, dass Googles statistische Verfahren in implizitem Wissen münden. Der allergrößte Teil von dem, was Menschen wissen, kann auch nicht gut sprachlich ausgedrückt werden, z.B. wie man auf dem Fahrrad die Balance hält, wie man einen Ball fängt, oder wie man Flamenco tanzt. Das Gehirn sammelt einfach megabyteweise Daten, betreibt darauf eine Art von statistischem “Data Mining” und hat danach eine Repräsentation von dem, was funktioniert. Ohne, dass damit ein Verständnis davon, wie und warum es funktioniert, verbunden sein müßte. Aber reicht das allein aus, um Texte zu übersetzen, oder Transistoren zu entwerfen?
Geben wir Google z.B. folgenden Gedichtanfang zum Übersetzen:
Ein Purzelbaum trat vor mich hin
und sagte: “Du nur siehst mich
und weißt, was für ein Baum ich bin:
Ich schieße nicht, man schießt mich.”
Nach automatischer Übersetzung ins Englische, und anschließender Rückübersetzung erhalten wir:
Ein Purzelbaum kam vor mir
und sagte: “Sie sehen nur mich
und wissen, was ein Baum ich bin:
Ich weiss nicht schießen, erschießen Sie mich.”
Offenbar tut sich die Google-Methode schwer damit, einen Text von Farsi ins Klingonische zu übersetzen. Dazu gehört nämlich auch bewußtes, strukturiertes Umgehen mit Absichten des Autors, der Funktionsweise einzelner Metaphern und so weiter. Das heißt, das implizite Wissen, das sich aus statistischer Analyse von Zeichenketten ergibt, reicht nicht aus - jedenfalls solange nicht, wie es Google nicht gelingt, daraus sehr differenzierte Abstraktionen zu bilden.
Das menschliche Gehirn begnügt sich im Gegensatz zum Google unserer Tage nicht mit implizitem Wissen, sondern es kondensiert dieses so lange, bis sich daraus differenzierte Abstraktionen bilden. Und diese Abstraktionen sind wiederum das, was wir Theorie nennen.
Meine Prognose läuft auf das genaue Gegenteil der Anderson-These hinaus. Die Wissenschaft, und der denkende Mensch wird sich nicht etwa an das heutige, noch recht primitive Google angleichen. Unser Menschengehirn kann man sich aber umgekehrt wie ein privates Google vorstellen - nur viel, viel fortgeschrittener! Und Googles Lernverfahren werden irgendwann bis zu einem Punkt fortschreiten, an dem sie zu Abstraktionen gelangen. Die Vernunft wird nicht vergoogeln, sondern das Googlebrain wird zur Vernunft kommen.
Schlagworte: Data Mining, End of theory, Petabyte Age



28. Juli 2008 um 18:51 Uhr
Gedankensplitter: Korrelationen kann man nur bilden von Dingen, die man schon kennt. Zusammenhänge in Theorien sollen Vorhersagen machen zu Dingen, die noch nicht sind.
(Für uns) implizites Wissen von Maschinen ist (uns) ziemlich nutzlos (Schachprogramme, Vierfarbensatz), weil es (uns) keine weiteren Erkenntnisse gestattet. Das tun nur die Teilergebnisse, die wir explizieren können.
Bei mir auf dem Tisch liegt ein (noch ungelesenes) Büchlein: “Sandra Mitchell: Komplexitäten. Warum wir erst anfangen, die Welt zu verstehen.” Das könnte zum Thema passen.
Vielleicht ist bei implizitem Wissen das Wort “Wissen” irreführend, es sollte eher “Können” verwendet werden: Fahrrad fahren, tanzen. Das erklärt auch die Diskrepanz von typisch menschlichen Fähigkeiten und ihren maschinellen Nachahmungen. Den Maschinen fehlt schlicht der Körper, der einerseits für diese Fähigkeiten notwendig ist und sie andererseits erst möglich macht. Mit Ausnahme der Übersetzungen sehe ich auch wenig Notwendigkeit dafür, warum Maschinen das machen sollten, was nur für uns eine Bedeutung hat und wir sowieso viel besser können.
28. Juli 2008 um 20:08 Uhr
Aus Informatikersicht muß man keinen Unterschied zwischen Wissen und Können machen. Ein Roboter, der balancieren kann, verfügt sozusagen über Balancewissen, und ein Roboter, der weiß, wie man balanciert, kann es. Ob man das Balancemodell implizit (z.B. als Gewichte in einem neuronalen Netz) oder explizit (als Regelmenge) realisiert, ist lediglich eine technische Frage. Für Menschen sind Regelmengen natürlich leichter zu handhaben als Netze, weil sie sich leichter und vollständiger versprachlichen lassen.
Eine Aussage wie “den Maschinen fehlt schlicht der Körper” halte ich für irreführend - schließlich bin ich selbst eine (biologische) Maschine. Und natürlich gibt es heute schon eine ganze Menge Roboter, die besser balancieren oder Bälle fangen können als ich.
Andersons Ansatz läuft auf etwas ganz anderes hinaus: er vermutet, dass das versprachlichbare (regelhafte) Wissen zugunsten von nichtversprachlichbarem (korrelativen, bayesischem, vagem, implizitem, nur maschinell handhabbaren) Wissen zum primären Gehalt der Naturwissenschaften wird.
29. Juli 2008 um 19:31 Uhr
Mit der Aussage, “schließlich bin ich selbst eine (biologische) Maschine”, nimmst du einen ganz bestimmten Standpunkt ein: Den eines Anhängers der harten KI, die es für sicher halten, dass a) Menschen sich vollständig als informationsverarbeitende Systeme beschreiben lassen und b) Maschinen dieselbe Komplexität wie Menschen erreichen können. Zum jetzigen Zeitpunkt ist das noch eine Glaubensüberzeugung, da der praktische Beweis fehlt. Ich vermute zwar auch, dass beides richtig ist, aber ich wollte auf etwas anderes hinaus: Wenn heutige Maschinen balancieren oder Bälle fangen, dann entspricht das nicht ihren eigenen Intentionen, bei uns aber schon. Aufgrund unseres Körpers haben wir Bedürfnisse, die wir mit den uns zur Verfügung stehenden geistigen und körperlichen Möglichkeiten befriedigen wollen und können. Hinter jeder Maschine steht heute aber immer ihr Programmierer, seine Wünsche bestimmen ihre Fähigkeiten.
Dein letzter Absatz ist missverständlich formuliert. Er kann auch so gelesen werden, als ob Anderson die Zukunft der Wissenschaft im regelbasierten und versprachlichbaren Wissen sieht.
29. Juli 2008 um 20:43 Uhr
Natürlich nehme ich persönlich den Standpunkt der harten KI ein - aber nicht unbedingt mit dieser Aussage. “Maschine” meint nicht unbedingt ein tutendes, knatterndes Rumpelding, das irgendwann von Leuten in Blaumännern montiert wurde, sondern ist ein sehr weiter Begriff.
Grundsätzlich ist jede naturwissenschaftliche Theorie eine Menge von Informationen (Messungen, Beobachtungen), die in eine regelhafte Struktur gebracht wurden. Eine naturwissenschaftliche (formale) Theorie, die ihren Gegenstandsbereich vollständig beschreibt, ist praktisch ein lauffähiges Computerprogramm, also eine Maschine. Selbst dann, wenn man nicht daran glaubt, dass sich ein Bereich der Natur vollständig wissenschaftlich beschreiben läßt, gilt:
1. Jede Beschreibung ist computational - einfach deshalb, weil jede Sprache und Schrift aus Informationseinheiten besteht.
2. Alles, was erkennbar (sichtbar, wahrnehmbar) ist, besteht aus Informationseinheiten, ist also gleichfalls computational.
Theorien, Modelle, Ontologien, Weltbilder… sind Verdichtungen von Erkennbarem. Sie nehmen die Informationen, aus denen sich unsere Wahrnehmung der Welt zusammensetzt, und strukturieren sie dergestalt, dass die Beschreibung kompakter wird. Um ein grob vereinfachtes Bild zu bemühen: die Astronomen komprimieren die Pixel ihrer Himmelsaufnahmen in Modelle des Weltraums (die sie als Computersimulationen ablaufen lassen können, sobald sie vollständig genug und die Computer groß genug sind). Die Biologen komprimieren die Pixel ihrer Mikroskop-Aufnahmen in Modelle von Zellen und Organismen (die sie als Computersimulationen ablaufen lassen können, sobald sie vollständig genug und die Computer groß genug sind). In diesem Sinne sind wir biologische Maschinen.
Ich denke nicht, dass die Beschreibung der Welt als Maschine auf irgendwelchen Glaubensüberzeugungen beruht. Im Gegenteil! Wenn ich nämlich behaupte, dass die beobachtbare Welt sich nicht als (computationale) Maschine beschreiben läßt, dann postuliere ich etwas, das sich weder beobachten noch formulieren läßt, also lediglich etwas Geglaubtes.