Wie gut prognostizieren die vier KI-Modelle wirklich? Hier siehst du transparente Bewertungen anhand von Ergebnis-Score, Konfidenz-Kalibrierung und Begründungsqualität – für jeden Spieltag der Saison 2025/26.
Ergebnis-Score-3 bis +5
Konfidenz-Kalibrierung-1.0 bis +1.0
Begründungsqualität0.0 bis 1.0
Schwierigkeitsbonus0.8 bis 1.5
🧮 So funktioniert das Metrik-Framework
Ergebnis-Score (ES)
·Volltreffer (exakt): +5
·Differenz-Treffer: +4
·Teil-Treffer: +3
·Tendenz-Treffer: +2
·Nahe Verfehlung: -1
·Fehlprognose: -2
·Grobe Fehlprognose: -3
Konfidenz-Kalibrierung (KS)
·Bewertet Ehrlichkeit der Konfidenz
·Richtig + hohe Konfidenz: Bonus
·Falsch + hohe Konfidenz: Malus
·Bereich: -1.0 bis +1.0
·Qualitäts-Modifikator bei korrekter Tendenz
Begründungsvalidierung (BVS)
·Prüft Schlüsselfaktoren nach Spiel
Modell-Ranking
Saison 2025/26 · nach Spieltag 25
1.
Googles beste KI
14 Prognosen · 2 Volltreffer · 29% Tendenz-Quote
54.9
Ø GS: 1.77
2.
Anthropics beste KI
19 Prognosen · 2 Volltreffer · 26% Tendenz-Quote
52.0
Ø GS: 1.53
3.
OpenAIs beste KI
19 Prognosen · 3 Volltreffer · 26% Tendenz-Quote
49.3
Ø GS: 1.78
4.
Anthropics beste KI
9 Prognosen · 0 Volltreffer · 11% Tendenz-Quote
38.7
Ø GS: -1.90
5.
OpenAIs beste KI
9 Prognosen · 0 Volltreffer · 11% Tendenz-Quote
38.6
Ø GS: -1.97
6.
xAI Grok
9 Prognosen · 0 Volltreffer · 22% Tendenz-Quote
36.7
Ø GS: -1.35
Saison-Diagramme
MSI-Verlauf (Formkurve der Modelle)
Score-Verteilung (Volltreffer bis Grobe Fehlprognose)
Kalibrierungskurve (Konfidenz vs. Trefferquote)
Gestrichelte Linie = Ideal. Oberhalb = unterconfident, unterhalb = overconfident.
Schwierigkeits-Performance (SM vs. Ergebnis-Score)
Borussia Mönchengladbach 2:0 FC St. Pauli 191013.03., 19:30
xAI Grok2:1Teil-Treffer
ES: 3KS: 0.09BVS: 0.25SM: ×0.94
Heimvorteil für Gladbach Bessere Formkurve St. Pauli Schwache Defensiven beider Teams Ähnliche Tabellenpositionen
2.43
GS
Anthropics beste KI1:1Fehlprognose
ES: -2KS: 0.34BVS: 0.40SM: ×1.00
Gladbachs schwache Formkurve trotz HeimvorteilSt. Paulis starker Aufwärtstrend mit 3 Siegen aus 5 Spielen Beide Teams mit schwacher Offensive Abstiegskampf-Motivation bei St. Pauli Enger Tabellenstand mit nur 1 Punkt Differenz
-1.86
GS
OpenAIs beste KI1:1Fehlprognose
ES: -2KS: -0.12BVS: 0.25SM: ×1.00
Heimvorteil für Gladbach Bessere Form von St. Pauli Beide Defensiven anfällig Tabellarisch sehr enges Duell
-2.62
GS
Ranking: 1. xAI Grok (Ø 2.43) · 2. Anthropics beste KI (Ø -1.86) · 3. OpenAIs beste KI (Ø -2.62)
Starker Heimvorteil im Signal Iduna Park Deutlicher Qualitätsunterschied laut Tabellenplatz und Tordifferenz Dortmunds schwankende Form mit 2 Niederlagen in 5 SpielenAugsburgs Aufwärtstrend mit 3 Siegen aus 5 Spielen Dortmunds überlegene Offensive (53 Tore vs. 31)
2.69
GS
OpenAIs beste KI2:1Teil-Treffer
ES: 3KS: 0.31BVS: 0.20SM: ×0.90
Heimvorteil Dortmund Deutlich bessere Tabellenlage Bessere Torbilanz des BVB Augsburg mit defensiven Problemen Augsburg zuletzt formstark, aber inkonstant
2.42
GS
Ranking: 1. xAI Grok (Ø 4.03) · 2. Anthropics beste KI (Ø 2.69) · 3. OpenAIs beste KI (Ø 2.42)
Bayer 04 Leverkusen 1:1 FC Bayern München14.03., 14:30
OpenAIs beste KI1:3Fehlprognose
ES: -2KS: -0.58BVS: 0.20SM: ×0.90
Überragende Bayern-Form mit 5 Siegen in Folge Deutlich bessere Torbilanz der Bayern Leverkusen mit vielen Unentschieden zuletzt Bayerns klare TabellenführungHeimvorteil für Leverkusen nur begrenzt ausschlaggebend
-2.86
GS
Anthropics beste KI1:3Fehlprognose
ES: -2KS: -0.44BVS: 0.00SM: ×0.90
Überragende Formkurve Bayerns mit 5 Siegen in SerieLeverkusens Formkrise mit 4 Unentschieden aus 5 Spielen Bayerns dominante Offensive mit 92 Toren 22 Punkte Tabellenabstand zugunsten Bayerns Leverkusens fehlende Durchschlagskraft in der Offensive
Tabellenführung Hoffenheim Schwache Form WolfsburgHeimvorteil Bessere Tordifferenz
-2.79
GS
OpenAIs beste KI3:1Fehlprognose
ES: -2KS: -0.64BVS: 0.25SM: ×0.90
Klare Tabellen- und Qualitätsdifferenz Sehr schwache Form von Wolfsburg Deutlich besseres Torverhältnis von HoffenheimHeimvorteil für Hoffenheim
-2.83
GS
Anthropics beste KI2:0Fehlprognose
ES: -2KS: -0.56BVS: 0.20SM: ×0.90
Enormer Tabellenunterschied (Platz 3 vs. Platz 17) Wolfsburgs katastrophale Form mit 4 Niederlagen in 5 SpielenHoffenheims Heimvorteil und starke Offensive (53 Tore) Wolfsburgs schwache Defensive (55 Gegentore) Hoffenheims Motivation im Kampf um die Champions League
-2.84
GS
Ranking: 1. xAI Grok (Ø -2.79) · 2. OpenAIs beste KI (Ø -2.83) · 3. Anthropics beste KI (Ø -2.84)
Eintracht Frankfurt 1:0 1. FC Heidenheim 184614.03., 14:30
xAI Grok2:0Fehlprognose
ES: -2KS: -0.60BVS: 0.25SM: ×0.90
Heimvorteil Frankfurt Bessere Tabellenposition und Form Heidenheims sieglose Serie Schwache Heidenheim-Defensive
-2.79
GS
OpenAIs beste KI3:1Fehlprognose
ES: -2KS: -0.60BVS: 0.20SM: ×0.90
Klarer Heimvorteil Deutlich bessere Form von Frankfurt Heidenheim seit 5 Spielen sieglos Schwache Defensive von Heidenheim Frankfurt mit klar besserer Tabellenlage
-2.88
GS
Anthropics beste KI3:0Fehlprognose
ES: -2KS: -0.64BVS: 0.20SM: ×0.90
Enormer Tabellenunterschied (Platz 7 vs. Platz 18) Heidenheims desaströse Formkurve mit 4 Niederlagen in 5 SpielenFrankfurts Heimvorteil im Waldstadion Heidenheims schwächste Defensive der Liga (57 Gegentore) Frankfurts starke Offensive mit 48 erzielten Toren
-2.92
GS
Ranking: 1. xAI Grok (Ø -2.79) · 2. OpenAIs beste KI (Ø -2.88) · 3. Anthropics beste KI (Ø -2.92)
Hamburger SV 1:1 1. FC Köln14.03., 17:30
Anthropics beste KI2:1Nahe Verfehlung
ES: -1KS: -0.04BVS: 0.20SM: ×0.90
Heimvorteil im Volksparkstadion Kölns desaströse Formkurve mit 0 Siegen aus 5 Spielen Kölns schwache Defensive mit 43 Gegentoren HSV mit besserer Tabellenposition und mehr Stabilität Kölns Negativserie deutet auf mentale Probleme hin
-1.48
GS
xAI Grok2:1Nahe Verfehlung
ES: -1KS: -0.30BVS: 0.25SM: ×0.90
Heimvorteil HSV Bessere Form HSV (2 Siege letzte 5) Miserable Form Köln (4 Niederlagen) Tabellarische Überlegenheit HSV
-1.62
GS
OpenAIs beste KI2:1Nahe Verfehlung
ES: -1KS: -0.32BVS: 0.25SM: ×0.90
Heimvorteil HSV Köln seit 5 Spielen sieglos HSV mit besserer Tabellenlage Kölner Defensive mit 43 Gegentoren anfällig
-1.64
GS
Ranking: 1. Anthropics beste KI (Ø -1.48) · 2. xAI Grok (Ø -1.62) · 3. OpenAIs beste KI (Ø -1.64)
SV Werder Bremen 0:2 1. FSV Mainz 0515.03., 14:30
Anthropics beste KI1:1Fehlprognose
ES: -2KS: 0.30BVS: 0.00SM: ×1.00
Abstiegskampf-Nervosität auf beiden Seiten Mainz mit drei Unentschieden in SerieBremens leichter Aufwärtstrend mit zwei Siegen zuletzt Nahezu identische TabellensituationModerater Heimvorteil im Weserstadion
-2.70
GS
xAI Grok2:1Fehlprognose
ES: -2KS: -0.10BVS: 0.00SM: ×0.90
Heimvorteil für BremenAufwärtstrend Bremen (2 Siege in Folge) Stabile Form Mainz mit vielen Unentschieden Schwache Defensiven beider Teams
-2.79
GS
OpenAIs beste KI2:1Fehlprognose
ES: -2KS: -0.12BVS: 0.00SM: ×0.90
Heimvorteil für Werder Bremen Mainz mit vielen Unentschieden zuletzt Beide Defensiven anfällig Leichter Formvorteil bei Werder
-2.81
GS
Ranking: 1. Anthropics beste KI (Ø -2.70) · 2. xAI Grok (Ø -2.79) · 3. OpenAIs beste KI (Ø -2.81)
SC Freiburg 0:1 1. FC Union Berlin15.03., 16:30
Anthropics beste KI2:1Fehlprognose
ES: -2KS: 0.04BVS: 0.00SM: ×0.90
Heimvorteil im Europa-Park Stadion Deutlich bessere Tabellenposition FreiburgsSchwache Auswärtsform und Negativserie Unions Beide Teams defensiv anfällig Unions schwache Offensive mit nur 30 Toren
-2.66
GS
OpenAIs beste KI2:1Fehlprognose
ES: -2KS: -0.22BVS: 0.00SM: ×0.90
Heimvorteil für Freiburg Bessere Tabellenposition und Punkteausbeute Schwächere Form von Union Berlin Beide Defensivreihen anfällig
Ranking: 1. Anthropics beste KI (Ø -2.66) · 2. OpenAIs beste KI (Ø -2.90) · 3. xAI Grok (Ø -2.97)
VfB Stuttgart 1:0 RB Leipzig15.03., 18:30
OpenAIs beste KI1:1Nahe Verfehlung
ES: -1KS: -0.12BVS: 0.25SM: ×1.00
Punktgleichheit und nahezu identisches Torverhältnis Leipzig mit stabilerer FormkurveHeimvorteil für Stuttgart Keine klaren Zusatzsignale durch H2H oder Ausfälle
-1.62
GS
Anthropics beste KI2:2Fehlprognose
ES: -2KS: 0.36BVS: 0.20SM: ×1.00
Punktgleichheit unterstreicht Ausgeglichenheit Leipzigs bessere Formkurve mit 5 Spielen ungeschlagenStuttgarts Heimvorteil als Ausgleichsfaktor Beide Teams mit starker Offensive (50 bzw. 48 Tore) Direktes Duell um Champions-League-Plätze erhöht Intensität
-2.24
GS
xAI Grok2:2Fehlprognose
ES: -2KS: 0.00BVS: 0.25SM: ×1.00
Punktgleiche Tabelle Bessere Form LeipzigStarker Heimvorteil Stuttgart Ähnliche Tordifferenz
-2.50
GS
Ranking: 1. OpenAIs beste KI (Ø -1.62) · 2. Anthropics beste KI (Ø -2.24) · 3. xAI Grok (Ø -2.50)