Algorithme pour la coupe du Monde 2022
Salutations les clés,
J'ai développé depuis quelques années un algorithme qui pronostique les scores des matchs en compétition internationale. Et pour ce mondial, je me suis dit pourquoi pas vous partager ses résultats
En gros, cet algorithme :- estime les cotes à partir d'un historique de matchs ;
- simule les matchs en fonction de ces estimations ;
- et sélectionne un pronostique selon deux critères :
- les biais identifiés parmi les cotes des bookmakers ;
- et une prise de risque évaluée selon l'avancement de la compétition.
- une "de bout en bout" qui pronostique à date toute la compétition, disponible juste en-dessous ;
- et une "de fil en aiguille" qui pronostiquera les matchs petit à petit, tout au long de ce mondial.
1 / Il vaut quoi cet algorithme ?
Je vous raconte ici comment cet algorithme a été conçu. Si vous souhaitez voir directement les pronostiques, je vous invite à passer aux chapitres suivants
Tout commença au mondial 2018 : je participais à un concours de pronostiques, et un collègue était haut dans le classement juste en générant des lois uniformes. Je me suis donc dit pourquoi pas faire un truc aussi
- Au mondial 2018, l'algorithme pronistiquait à partir des cotes de bookmakers et donnait les scores les plus probables :
43% d'issues trouvées, 15% de scores exacts trouvés, mais que sur des petites cotes donc gains minimes. C'était bof - À l'euro 2020, j'ai modifié la méthode de simulation des matchs et j'ai rajouté une méthode de prise de risque :
56% d'issues trouvées, 6% de scores exacts trouvés mais sur des grosses cotes. Là on se mettait bien
Par contre, il a fait n'importe quoi sur les phases finales. Un nouveau calibrage là-dessus sera expérimenté pour ce mondial
- Calcul des rangs Elo relatifs entre les pays qui sont en lice. Indirectement, ça traduit la forme des équipes à date.
Toutes les équipes commencent avec le même rang Elo, et tout leur historique est parcouru pour déterminer leur évolution. Les biais causés par les matchs à faibles enjeux (amicaux) et le farm du rang Elo sur des équipes hors compétition sont gommés.
Voici le classement Elo à date selon l'algorithme et les données qui ont été saisies :
J'ai rentré et vérifié 4 385 matchs à la main pour établir ce classement Elo - Estimation des cotes selon les rangs Elo, puis simulation de dix millions de matchs par confrontation. Le nombre de buts est généré par des lois de Poisson
- Édition de statistiques et sélection du pronostique selon :
Par exemple, pour le match Qatar - Équateur qui aura lieu tout à l'heure, l'algorithme dit ceci :
Le score le plus probable serait 1 - 1, mais il serait suggéré de miser 0 - 2 pour l'Équateur principalement parce que la cote du bookmaker serait trop haute
2 / Les pronostiques de bout en bout
Cette nuit, j'ai longuement fait tourner l'algorithme pour estimer un premier classement final de cette compétition
En gros, à date, l'algorithme dit :- le Qatar ne fera rien
- il y aura une égalité parfaite entre la France et le Danemark dans les poules
- l'Allemagne et la Suisse ne sortiront pas des poules
- et les Pays-Bas seront vainqueurs alors qu'ils galèrent face à l'ogre gallois
Pour moi, c'est un scénario improbable. Mais si c'est vraiment ça. . . non mais franchement, ce ne serait plus un algorithme mais un ORACLE
3 / Les pronostiques de fil en aiguille
Pour avoir une vision plus "juste" et obtenir des résultats potentiellement plus cohérents, l'algorithme sera relancé régulièrement et il se projettera moins loin
Pour les matchs qui auront lieu jusqu'à jeudi prochain, l'algorithme dit :Qatar 0 - 2 Équateur
Angleterre 3 - 0 Iran
Sénégal 1 - 2 Pays-Bas
États-Unis 1 - 2 Pays de Galles
Argentine 1 - 0 Arabie saoudite
Danemark 3 - 0 Tunisie
Mexique 0 - 2 Pologne
France 3 - 0 Australie
Maroc 1 - 2 Croatie
Allemagne 0 - 0 Japon
Espagne 1 - 0 Costa Rica
Belgique 2 - 1 Canada
Suisse 2 - 1 Cameroun
Uruguay 2 - 1 Corée du Sud
Portugal 3 - 0 Ghana
Brésil 3 - 0 Serbie
Je ne suis pas tout à fait convaincu de ces résultats non plus mais bon, laissons l'algorithme parler.
Plus qu'à attendre les résultats désormais
Nous verrons s'il prend les bons risques. . . ou s'il dit n'importe quoi
Merci d'avoir lu, à votre disposition pour toute observation, remarque ou question
Ca aurait pas été plus efficace (et rapide) en deep learning ?
Qatar 0 - 2 Équateur
Angleterre 3 - 0 Iran
Sénégal 1 - 2 Pays-Bas
États-Unis 1 - 2 Pays de Galles
Argentine 1 - 0 Arabie saoudite
Danemark 3 - 0 Tunisie
Mexique 0 - 2 Pologne
France 3 - 0 Australie
Pea sur ce maxi-combiné
J'y ai songé, mais je pense que :Le 20 novembre 2022 à 16:38:29 Evantilateur a écrit :
C'est super intéressant
Ca aurait pas été plus efficace (et rapide) en deep learning ?
- on perdrait en interprétabilité des pronostiques comparé à un modèle statistique classique où tous les paramètres sont maîtrisés et justifiés ;
- et surtout, on ne gagne pas nécessairement en performance sur les résultats avec du deep learning parce que les matchs de foot restent trop aléatoires ;
Le 20 novembre 2022 à 16:38:36 ChatDuForom a écrit :
Qatar 0 - 2 Équateur
Angleterre 3 - 0 Iran
Sénégal 1 - 2 Pays-Bas
États-Unis 1 - 2 Pays de Galles
Argentine 1 - 0 Arabie saoudite
Danemark 3 - 0 Tunisie
Mexique 0 - 2 Pologne
France 3 - 0 AustraliePea sur ce maxi-combiné
Ayaaaaa je te déconseille, ce n'est pas une boule de cristal cet algorithme
Données du topic
- Auteur
- ActuaireEcoPlus
- Date de création
- 20 novembre 2022 à 16:30:02
- Nb. messages archivés
- 94
- Nb. messages JVC
- 94