Wie gut prognostizieren die vier KI-Modelle wirklich? Hier siehst du transparente Bewertungen anhand von Ergebnis-Score, Konfidenz-Kalibrierung und Begründungsqualität – für jeden Spieltag der Saison 2025/26.
Ergebnis-Score-3 bis +5
Konfidenz-Kalibrierung-1.0 bis +1.0
Begründungsqualität0.0 bis 1.0
Schwierigkeitsbonus0.8 bis 1.5
🧮 So funktioniert das Metrik-Framework
Ergebnis-Score (ES)
·Volltreffer (exakt): +5
·Differenz-Treffer: +4
·Teil-Treffer: +3
·Tendenz-Treffer: +2
·Nahe Verfehlung: -1
·Fehlprognose: -2
·Grobe Fehlprognose: -3
Konfidenz-Kalibrierung (KS)
·Bewertet Ehrlichkeit der Konfidenz
·Richtig + hohe Konfidenz: Bonus
·Falsch + hohe Konfidenz: Malus
·Bereich: -1.0 bis +1.0
·Qualitäts-Modifikator bei korrekter Tendenz
Begründungsvalidierung (BVS)
·Prüft Schlüsselfaktoren nach Spiel
Modell-Ranking
Saison 2025/26 · nach Spieltag 28
1.
Anthropics beste KI
1 Prognosen · 0 Volltreffer · 100% Tendenz-Quote
50.5
Ø GS: 1.34
2.
OpenAIs beste KI
1 Prognosen · 0 Volltreffer · 100% Tendenz-Quote
46.8
Ø GS: 0.79
3.
Googles beste KI
1 Prognosen · 0 Volltreffer · 100% Tendenz-Quote
36.4
Ø GS: 0.87
Spieltag-Detailansicht
Gaziantep FK 1:1 Alanyaspor04.04., 14:00
Trabzonspor 2:1 Galatasaray04.04., 17:00
Fatih Karagümrük 2:1 Caykur Rizespor05.04., 11:30
Samsunspor 2:2 Konyaspor05.04., 11:30
Antalyaspor 3:0 Eyupspor05.04., 14:00
Anthropics beste KI1:1Tendenz-Treffer
ES: 2KS: -0.28BVS: 0.25SM: ×1.10
Keine statistischen Daten verfügbarFehlende Formkurven-Informationen Kein direkter Vergleich vorhandenMinimaler theoretischer Heimvorteil Hohe Prognoseunsicherheit
1.34
GS
Googles beste KI1:1Tendenz-Treffer
ES: 2KS: -0.21BVS: 0.00SM: ×1.10
Keine historischen Daten verfügbar Früher Saisonzeitpunkt ohne Formkurve Ausgeglichene Ausgangslage beider Teams Taktisches Abtasten zu Saisonbeginn
0.87
GS
OpenAIs beste KI1:1Tendenz-Treffer
ES: 2KS: -0.28BVS: 0.00SM: ×1.10
Keine aktuellen Spieldaten Fehlende Head-to-Head-Daten Neutraler Tabellenstand
0.79
GS
Ranking: 1. Anthropics beste KI (Ø 1.34) · 2. Googles beste KI (Ø 0.87) · 3. OpenAIs beste KI (Ø 0.79)
Saison-Diagramme
MSI-Verlauf (Formkurve der Modelle)
Score-Verteilung (Volltreffer bis Grobe Fehlprognose)
Kalibrierungskurve (Konfidenz vs. Trefferquote)
Gestrichelte Linie = Ideal. Oberhalb = unterconfident, unterhalb = overconfident.
Schwierigkeits-Performance (SM vs. Ergebnis-Score)