Statistiques globales

Performance agrégée du modèle Dixon-Coles sur la saison 2024-25 (Big 5, 3017 matchs prédits).

Tous Ligue 1 Premier League La Liga Serie A Bundesliga

Précision par championnat

Comparaison modèle vs marché (cotes football-data closing-avg). Validation ADR-011 : modèle dans ±3 % du marché sur les 5 championnats — confirmé en gros sur le tableau ci-dessous. Log-loss et Brier mesurent la qualité de calibration : plus bas = mieux. Référence pure-hasard sur 1X2 : log-loss ≈ 1.099, Brier ≈ 0.667.

Championnat	N	Acc. Modèle	Acc. Marché	Écart	Log-loss	Brier
Big 5 (toutes)	3017	52.8%	54.5%	-1.8 pt	0.9951	0.5935
Ligue 1	560	55.2%	55.5%	-0.4 pt	0.9874	0.5876
Premier League	656	50.0%	53.5%	-3.5 pt	1.0195	0.6115
La Liga	648	53.5%	55.9%	-2.3 pt	0.9775	0.5801
Serie A	657	53.3%	53.4%	-0.2 pt	0.9926	0.5938
Bundesliga	496	52.0%	54.4%	-2.4 pt	0.9978	0.5938

Calibration 1X2

Une probabilité est bien calibréesi, quand le modèle dit 70 %, l'événement arrive vraiment ~70 % du temps. Chaque point bleu représente un bin de 10 % de proba prédite ; la taille du point est proportionnelle au nombre de matchs dans ce bin (label n=...). La diagonale pointillée = calibration parfaite.

Au-dessus de la diagonale : modèle sous-confiant (réalité dépasse la proba prédite).
Sur la diagonale : calibration parfaite.
En-dessous : modèle sur-confiant (proba prédite plus haute que la fréquence réelle).

Distribution des erreurs sur les matchs prédits

Pour chaque match, on calcule un score d'erreur : log-loss (= -ln de la proba modèle au résultat réel) et Brier 1X2(= somme des écarts proba/indicateur au carré). Plus le score est bas, mieux le modèle a prédit. La ligne pointillée marque le score d'un modèle pur-hasard ; tout ce qui est à gauche = mieux que le hasard.

Log-loss par match

Brier 1X2 par match

Lecture : la queue droite (log-loss > 2 ou Brier > 1) regroupe les vraies surprises de la saison. Tu peux les trouver via le leaderboarddans la section "Le modèle s'est trompé".

Top/flop équipes prédites

Pour chaque équipe ayant joué au moins 20 matchs prédits sur la saison 2024-25, on calcule le log-loss moyen et le Brier moyen sur leurs matchs. Une équipe avec un log-loss bas est bien modélisée par Dixon-Coles ; une équipe avec un log-loss haut surperforme ou sous-performe ses fondamentaux (équipe en reconstruction, joueurs clés blessés en série, dynamique imprévue, etc.). C'est précisément le genre de signal contextuel que le baseline N1 ignore — voir les niveaux N2/N3 dans la méthodologie.

Top 5 — équipes les mieux modélisées

Log-loss moyen le plus bas. Le modèle sait à quoi s'attendre quand elles jouent.

#	Équipe	Comp.	N	Acc.	Log-loss	Brier
1	Barcelona	SP1	68	74%	0.713	0.394
2	Southampton	E0	36	83%	0.713	0.399
3	Valladolid	SP1	36	78%	0.716	0.398
4	Bayern Munich	D1	60	77%	0.724	0.391
5	Paris SG	F1	64	73%	0.758	0.435

Top 5 — équipes les moins bien modélisées

Log-loss moyen le plus haut. Candidates idéales pour bénéficier du contexte N2/N3.

#	Équipe	Comp.	N	Acc.	Log-loss	Brier
1	Lorient	F1	30	33%	1.223	0.758
2	Bournemouth	E0	69	39%	1.175	0.712
3	Parma	I1	69	42%	1.166	0.717
4	Leeds	E0	33	36%	1.153	0.717
5	Girona	SP1	68	37%	1.150	0.704

Méthode

Toutes ces métriques sont calculées out-of-sample: le modèle a été entraîné sur les saisons 2020-21 → 2023-24 et testé sur 2024-25 qu'il n'avait jamais vue. Pour la définition complète et le rationale du critère de validation, voir la page méthodologie et l'ADR-011 dans le repo.