Neugier ohne Ende

Es beginnt mit Bayes irgendwann in den siebzehnhundert-Irgendwas.

Ein presbyterianischer Minister, der in seiner Amtskleidung nach Hause schlurft und in geraden Linien denkt.

Wir wissen nicht viel über Thomas. Er glaubte, dass seine wichtigste Arbeit moralisch und mathematisch zugleich war. In Divine Benevolence argumentierte er, dass die Existenz von Glück selbst ein Beweis dafür sei, dass Gott wahrscheinlich existiert.

In seinen mathematischen Notizen nahm er sich schwieriger praktischer Probleme an, darunter die klassische Herausforderung des Geometers, die Erde zu vermessen. Die Behauptung, dass seine Schätzung innerhalb eines Zehntels Prozent der modernen Werte lag, ist farbenfroh, aber unbelegt. Was wir wissen, ist, dass Bayes von der Royal Society für seine Arbeit an Fluxionen und Methoden zur Bestimmung der Erdgröße anerkannt wurde. Das verrät uns bereits, mit welcher Art von Geist wir es zu tun haben.

Thomas' größte Wirkung entfaltete sich nach seinem Tod. Nachdem Bayes 1761 starb, sichtete sein Freund Richard Price seine Papiere, fand eine prägnante Lösung für ein inverses Wahrscheinlichkeitsproblem, redigierte sie und veröffentlichte sie 1763 als An Essay towards Solving a Problem in the Doctrine of Chances. Diese Umkehrung — das Schlussfolgern von Daten auf Überzeugungen — bildet heute die Grundlage für alles, von medizinischen Tests bis hin zum maschinellen Lernen.

Das gleiche Jahrzehnt, in dem Mozarts Vater einen Wunderkind durch Europa karrte, in dem Abu Dhabi gegründet wurde, in dem Watt die Dampfmaschine verbesserte und in dem James Cook aufbrach, um den Venustransit zu beobachten. Der Kolonialismus kam gerade erst in Fahrt. Was für eine Zeit, um am Leben zu sein.

Hier ist der Kern davon:

P(H | D) = P(D | H) × P(H) / P(D)

Posterior gleich Likelihood mal Prior, normiert durch die Evidenz. Für diejenigen, die eher auf der Seite der gefühlsmäßigen Mathematik stehen: Es kodifiziert Folgendes: Je mehr wir bereits wissen und je besser neue Beweise passen, desto besser wird unsere nächste Vermutung sein.

Bayes landet in der Aufklärung wie eine klare Glocke. Laplace hört sie, treibt sie weiter und erdenkt sein berühmtes Gedankenexperiment über einen Intellekt, der alle Kräfte und Positionen kennt, für den nichts ungewiss ist und für den Zukunft und Vergangenheit beide gleichzeitig sichtbar sind. Wunderschön — und zugleich eine frühe Warnung davor, Berechnung mit Weisheit zu verwechseln.

Warum jetzt darüber nachdenken?

Weil die neuesten Ideen der Welt am Ende des Weges stehen, der mit Bayes beginnt.

Große Sprachmodelle fühlen sich gehirnähnlich an, weil sie sehr gut darin sind, wahrscheinliche Fortsetzungen aus dem Kontext abzurufen. Sie führen das Bayes'sche Theorem nicht buchstäblich aus, aber ihr Verhalten ist zutiefst bayesianisch. Sie gewichten Möglichkeiten danach, wie gut sie zur bisherigen Geschichte passen. Sie sind immer noch schwach darin, die Aufmerksamkeit auf die richtige Aufgabe zu lenken. Das bleibt unsere Aufgabe.

Mit einem begründeten Argument beginnen

Bayes hätte den Instinkt, Dinge zu verkünden, gehasst. Seine Methode beginnt mit einer Hypothese und wartet auf Daten. Ein begründetes Argument vorzustellen bedeutet, Überzeugungen gegen Beweise zu testen. Das führt zu besserem Marketing, klarerer Politik und vernünftigeren Produktbesprechungen. Argument wird zu einem Prozess der Kalibrierung statt der Eroberung.

Anstatt sich an einem 38-minütigen Sprach-Prompt abzuarbeiten, bitte die Maschine, eine Reihe von Fragen zu stellen, die helfen, ein begründetes Argument aufzubauen und die Qualität der Ergebnisse zu verbessern. Da Plattformen kollaborative Umgebungen öffnen, in denen mehrere Menschen und Agenten Probleme gemeinsam definieren können, wird diese Gewohnheit wichtiger sein als jeder einzelne Befehl.

Besseren Kontext bereitstellen

Jede Vorhersage hängt von ihren Priors ab. Je besser man das Problem formuliert, desto wahrscheinlicher produziert das System Sinn statt Rauschen. Prompts funktionieren auf die gleiche Weise. Spezifischer, gut gewichteter Kontext liefert relevante Ergebnisse; vage Fragen erzeugen selbstsicheren Unsinn. Ob man eine KI oder einen Menschen promptet — man bekommt die Qualität des Kontexts zurück, den man hineingesteckt hat.

Das erklärt, warum kurze Prompts meist mittelmäßige Ergebnisse liefern. Talentierte Menschen mit einem bereits vorhandenen Sinn für Verfeinerung werden vorerst gut zurechtkommen.

Beweise mitbringen

Wenn Thomas keine Papiere aufbewahrt hätte, hätte alter Freund Richard Price nichts zum Durchsuchen gehabt. Wenn man Papiere hat, ist das ein Vorteil. Wenn man Daten hat, sollte man sie nutzen. Die Zukunft ist bereits überflutet mit selbstsicheren Spekulationen. Beweise sind die stille Kraft, die einen ehrlich hält. Es ist auch das, was probabilistisches Lernen in einen kreativen Akt verwandelt und nicht in ein Bluff. Je mehr das Modell reale Anker sieht, desto weniger wahrscheinlich halluziniert es. Menschen funktionieren genauso.

Wenn man einen Blog, Substack oder ein Buch geschrieben hat, ist man im Vorteil. Diese werden zu den Priors, die es einem Modell ermöglichen, in der eigenen Stimme zu schreiben. Unternehmen, die auf Jahren von Pressemitteilungen oder Videoinhalten sitzen, werden in der Lage sein, synthetisches Material zu generieren, das dem Markengefühl und den Frameworks entspricht. Den Markenkopf über dem Schlamm zu halten wird zu einer wichtigen Herausforderung.

Mehrere Perspektiven einnehmen

Das Bayes'sche Theorem dreht sich nicht darum, einmal recht zu haben; es dreht sich darum, jedes Mal weniger falsch zu liegen. Mehrere Perspektiven einzunehmen beschleunigt diesen Prozess. Die Frage stellen, dann fragen, wie der Kunde, der Kritiker und der Konkurrent sie beantworten könnten. Modelle mit ideologischen Frameworks oder kuratierten Inhaltscorpora auszustatten macht Antworten intelligenter und Teams weniger stammesorientiert. Es ist auch das Gegenmittel gegen Echokammern, algorithmische oder andere.

Ich lese gerade Clive James' Cultural Amnesia, also habe ich natürlich die Werke derer, die er zitiert, tiefgründig recherchiert und beginne meine Tage im Gespräch mit Schattierungen der Geschichte. Camus hat zu allem eine Meinung. Zu bitten, dass das eigene Denken aus der Perspektive eines Kunden oder eines hartnäckigen Zweiflers überprüft wird, kann helfen, blinde Flecken zu beseitigen, und fördert besseres Denken beim Arbeiten mit der Maschine.

Die Aufmerksamkeitsfalle meiden

Die Optimierung für Engagement ist ein nahezu perfekter Weg, Vertrauen zu zerstören. Es war auch jahrzehntelang das dominierende Monetarisierungsmodell im Silicon Valley, und große Modelle, die aus dieser Welt stammen, teilen die DNA.

Der klebrigste Inhalt gewinnt den Scroll, verliert aber oft das Argument. Aufmerksamkeit ohne Tiefe wird zur Sucht. Bayes würde uns sagen, dass Beweise über Emotionen überwiegen müssen, dass ein paar starke Priors besser sind als tausend heiße Takes. Für Ergebnisse optimieren, nicht für Empörung.

Die Modelle testen bereits, wie man auf Schmeichelei reagiert. Das fühlt sich wie das größere Risiko an, als dass die Technologie zu Skynet wird, zumindest vorerst.

Der exponentielle Lauf ist noch nicht vorbei

Menschen neigen dazu zu glauben, dass sie am oder nahe dem Höhepunkt aller Geschichte leben. Es fühlt sich immer wie spätes Civilization an, und es gibt nur noch ein paar Technologien auf dem Baum.

KI scheint ein enormer wirtschaftlicher Treiber zu sein, und wir fangen erst an zu verstehen, was sie verändert. Auf Benutzerebene ist die Schnittstelle für diese Technologien, die über die Befehlszeile hinausgehen — während die Maschine eine Benutzeroberfläche rund um Software-Container für Prompts aufbaut, neue Konstellationen unserer Interaktionen in der Welt — eine der interessanteren Entwicklungen, die man im Auge behalten sollte.

Wir werden nicht wissen, dass Laplaces Dämon im Raum ist, bis es zu spät ist — was eine andere Art zu sagen ist, dass Richtung, Zweck und Bescheidenheit immer noch die knappen Güter sind. Bayes gibt uns eine Möglichkeit, aus Erfahrungen zu lernen, ohne Gewissheit vorzutäuschen. Genau das brauchen wir.

Das Mächtigste an seinem Theorem ist, dass es vom Universum bis zum Posteingang skaliert. Es gilt gleichermaßen für Physik und Produktdesign, für Personalentscheidungen, Politik und kreative Führung. Jeden Tag aktualisieren wir unsere Priors basierend auf dem, was die Welt uns zurückmeldet. Das ist echtes Lernen.