Fields-Medaille-Träger testet ChatGPT 5.5 Pro: KI löst offene Mathematik-Probleme auf PhD-Niveau

Timothy Gowers, Träger der Fields-Medaille, hat ChatGPT 5.5 Pro auf offene Probleme der Zahlentheorie losgelassen — mit erschütterndem Ergebnis. Die KI produzierte in unter zwei Stunden mathematische Forschung auf PhD-Niveau. Sein eigener mathematischer Beitrag: null. „Wir werden sehr bald eine Krise erleben“, warnt Gowers.

Was ist passiert?

Der britische Mathematiker Sir Timothy Gowers — einer der renommiertesten Kombinatoriker der Welt und Inhaber des Combinatorics-Lehrstuhls am Collège de France — bekam frühzeitig Zugang zu ChatGPT 5.5 Pro, dem neuesten Modell von OpenAI. In einem Blogbeitrag vom 8. Mai 2026 beschreibt er detailliert, was dann geschah.

Gowers fütterte das Modell mit offenen Problemen aus einer aktuellen Arbeit des Zahlentheoretikers Mel Nathanson. Die Fragen drehen sich um Summenmengen von ganzen Zahlen — ein klassisches Gebiet der additiven Zahlentheorie. Konkret ging es darum, wie effizient man Mengen mit bestimmten Summeneigenschaften konstruieren kann.

Das Bemerkenswerte: Gowers gab keinerlei mathematische Hilfestellung. „Ich habe nicht einmal etwas Cleveres mit den Prompts gemacht“, schreibt er. Seine Eingaben beschränkten sich auf Aufforderungen wie „Versuch das mal“ oder „Schreib das als LaTeX-Preprint“.

Die Ergebnisse im Detail

ChatGPT 5.5 Pro lieferte in mehreren Schritten beeindruckende Resultate:

17 Minuten und 5 Sekunden: Für ein erstes Problem fand die KI eine quadratische obere Schranke — die bestmögliche Verbesserung gegenüber Nathansons ursprünglicher exponentieller Schranke. Der Trick: Sie ersetzte eine ineffiziente Sidon-Menge in Nathansons Konstruktion durch eine effizientere Variante.
2 Minuten und 23 Sekunden: Auf Nachfrage schrieb die KI den Beweis als sauberen LaTeX-Preprint.
16 Minuten und 41 Sekunden: Für die deutlich schwierigere Verallgemeinerung auf beliebige k-fache Summenmengen verbesserte sie eine bestehende Arbeit von Isaac Rajagopal (MIT) von exponentiell zu einer ersten Teilverbesserung.
Nach etwa einer Stunde Gesamt-Denkzeit: Die finale Verbesserung: von exponentiell zu polynomial — ein dramatischer Sprung in der Beweisqualität.

Rajagopal, der die Ergebnisse prüfte, nannte die zentrale Idee der KI „completely original“ — also vollständig originär. „Es ist die Art von Idee, auf die ich nach ein oder zwei Wochen Nachdenken sehr stolz wäre — und ChatGPT hat sie in weniger als einer Stunde gefunden und bewiesen“, schrieb der MIT-Forscher in seinem Gastbeitrag auf Gowers‘ Blog.

Was war die geniale Idee?

Die KI nutzte sogenannte k-dissoziierte Mengen, um algebraische Beziehungen niedriger Ordnung zu kontrollieren. Vereinfacht gesagt: Sie fand einen Weg, bestimmte mathematische Strukturen so zu „komprimieren“, dass sie in einen viel kleineren Zahlenbereich passen, ohne ihre entscheidenden kombinatorischen Eigenschaften zu verlieren. Rajagopal beschreibt es als „eine halbe geometrische Reihe, zusammengequetscht in ein polynomiales Intervall“ — eine äußerst kontraintuitive Konstruktion.

Das Preprint mit dem vollständigen Beweis ist hier einsehbar.

Die Krisenwarnung: „Die Untergrenze steigt“

Gowers zieht weitreichende Schlüsse aus diesem Experiment. Die zentrale These: Die Untergrenze für einen sinnvollen Beitrag zur Mathematik wird nicht länger sein, etwas zu beweisen, was noch niemand bewiesen hat — sondern etwas zu beweisen, was eine KI nicht beweisen kann.

Für die Ausbildung von Doktoranden hat das gravierende Folgen:

„Es scheint mir, dass die Ausbildung von Doktoranden in der Forschung, die schon immer schwierig war, gerade noch schwieriger geworden ist. Ein naheliegender Weg, jemandem den Einstieg zu erleichtern, war, ihm ein Problem zu geben, das relativ sanft aussieht. Wenn KIs an dem Punkt sind, an dem sie ‚sanfte Probleme‘ lösen können, ist das keine Option mehr.“

Gowers stellt sogar die provokative Frage: Angenommen, ein Mathematiker löst ein großes offenes Problem durch einen langen Austausch mit einer KI — wobei die KI die gesamte technische Arbeit und die Hauptideen liefert. Würden wir das als große Leistung des Mathematikers ansehen? Seine eigene Antwort: „Ich glaube nicht.“

Einordnung: Die rasante Entwicklung der KI in der Mathematik

Der Durchbruch von ChatGPT 5.5 Pro steht nicht isoliert. Die Entwicklung der letzten Monate verlief atemberaubend:

GPT-5: Konnte Erdos-Probleme nur „lösen“, indem es existierende Lösungen in der Literatur fand — kein eigenständiges Denken.
GPT-5.2 Pro: Löste Erdos-Problem #728 „mehr oder weniger autonom“, wie Terence Tao bestätigte. Keine entsprechende Lösung in der Literatur.
GPT-5.4 Pro: Knackte ein seit Langem offenes Erdos-Problem in unter zwei Stunden.
ChatGPT 5.5 Pro: Produziert jetzt originäre mathematische Ideen, die ein MIT-Forscher als „completely original“ einstuft, und schreibt vollständige PhD-würdige Beweise.

Der Star-Mathematiker Terence Tao hatte KI-Modelle noch vor Kurzem mit „mittelmäßigen, aber nicht völlig inkompetenten Forschungsassistenten“ verglichen. Gowers‘ Experiment zeigt: Dieses Urteil ist bereits überholt. Taos jüngste Aussagen sind deutlich positiver – er spricht von einer „industrialisierten Mathematik“, bei der die Ideengenerierung nahezu kostenlos wird, sich der Engpass aber auf die Verifikation verschiebt.

Was bedeutet das praktisch?

Die unmittelbaren Konsequenzen sind vielschichtig:

1. Für die Forschung: Die Messlatte für „publikationswürdige“ Mathematik steigt. Was gestern noch eine respektable PhD-Leistung war, ist heute eine KI-Aufgabe von einer Stunde. Das stellt das gesamte wissenschaftliche Publikationssystem infrage. Gowers selbst fragt: Wohin mit KI-produzierten Resultaten? arXiv lehnt KI-geschriebene Inhalte ab — aber die Ergebnisse sind mathematisch korrekt und wertvoll. Brauchen wir ein neues Repository?

2. Für Doktoranden: Wer heute ein Mathematik-Promotion beginnt und frühestens 2029 abschließt, wird eine Forschungswelt vorfinden, die „bis zur Unkenntlichkeit verändert“ ist, so Gowers. Die Fähigkeit, mit KI zu kollaborieren und Probleme zu identifizieren, die jenseits der KI-Fähigkeiten liegen, wird zur Kernkompetenz.

3. Für die KI-Entwicklung: Der Sprung von GPT-5.4 Pro zu 5.5 Pro zeigt, dass die Grenzen mathematischen Reasonings immer weiter verschoben werden. Modelle entwickeln originäre Ideen, nicht nur Rekombinationen von Bekanntem. Wer das bisher für unmöglich hielt, muss umdenken.

4. Die offene Frage der Kreativität: Rajagopals Urteil — „completely original“ — ist vielleicht das beunruhigendste Detail dieser Geschichte. Wenn eine KI in einer Stunde eine Idee produziert, die ein brillanter junger Mathematiker als „genial“ und „völlig originär“ bezeichnet, müssen wir unsere Definition von mathematischer Kreativität grundlegend überdenken.

Fazit

Timothy Gowers‘ Experiment mit ChatGPT 5.5 Pro ist mehr als eine beeindruckende Tech-Demo. Es ist ein Weckruf. Die KI hat nicht einfach ein Problem gelöst — sie hat eine originäre Forschungsleistung erbracht, die von einem unabhängigen Experten als PhD-würdig eingestuft wurde. Ohne menschliche mathematische Führung. In unter zwei Stunden.

Die Mathematik steht vor einer Identitätskrise. Wenn das Lösen offener Probleme keine exklusiv menschliche Domäne mehr ist — was bleibt dann? Gowers‘ Antwort ist nüchtern: Die Fähigkeit, bessere Probleme zu stellen als die KI, und die Kreativität, mit der KI Dinge zu erreichen, die sie allein nicht schafft. Die Zukunft der Mathematik liegt nicht im Wettbewerb mit der KI, sondern in der Symbiose.

Die Frage ist nur: Wie lange noch, bis die KI auch darin besser wird?

FAQ

Wer ist Timothy Gowers?

Sir Timothy Gowers ist ein britischer Mathematiker, der 1998 die Fields-Medaille erhielt — die höchste Auszeichnung der Mathematik. Er ist Professor am Collège de France und Fellow des Trinity College in Cambridge. Bekannt wurde er durch fundamentale Beiträge zur Funktionalanalysis und Kombinatorik sowie durch sein Eintreten für offene Wissenschaft und das Polymath-Projekt.

Was genau hat ChatGPT 5.5 Pro gelöst?

Die KI verbesserte obere Schranken für ein Problem aus der additiven Zahlentheorie — konkret die Frage, wie groß der Durchmesser einer Zahlenmenge sein muss, damit sie eine bestimmte Summenmengen-Größe erreicht. Sie verbesserte eine existierende exponentielle Schranke auf eine polynomiale — ein dramatischer Fortschritt.

War das wirklich originäre Forschung oder nur Reproduktion?

Laut Isaac Rajagopal, dem MIT-Forscher, auf dessen Arbeit die KI aufbaute, war die zentrale Idee „completely original“ — also vollständig neu. Die KI nutzte ein bekanntes Konzept (k-dissoziierte Mengen) auf eine völlig unerwartete und geniale Weise, die selbst Rajagopal überraschte.

Was bedeutet das für die Zukunft der Mathematik?

Die Untergrenze für bedeutsame mathematische Beiträge steigt. Doktoranden müssen lernen, mit KI zu arbeiten und Probleme zu identifizieren, die jenseits der KI-Fähigkeiten liegen. Das Publikationssystem steht vor grundlegenden Fragen, wohin KI-generierte, aber korrekte Forschung gehört.

Kann ChatGPT 5.5 Pro jedes offene Mathematikproblem lösen?

Nein. Gowers betont, dass es sich um ein Problem handelte, das eine relativ überschaubare Struktur hatte und auf bestehenden Arbeiten aufbaute. Für fundamentale Durchbrüche wie die Riemannsche Vermutung reichen die Fähigkeiten aktueller KIs bei Weitem nicht. Die Entwicklung beschleunigt sich jedoch rapide.

Ist das das Ende des menschlichen Mathematikers?

Nein — aber es verändert die Rolle radikal. Gowers sieht die Zukunft in der Mensch-KI-Kollaboration. Mathematiker werden zu Kuratoren, Problemlösern auf Meta-Ebene und Verifikatoren. Die rein technische Beweisführung wird zunehmend automatisiert, aber die Frage, welche Probleme überhaupt relevant und interessant sind, bleibt eine zutiefst menschliche.