Parier le match nul au football : Les limites des modèles de Poisson

Parier le match nul au football

Comment fonctionnent les modèles de Poisson ?

Les limites des modèles de Poisson

Comment augmenter ou réduire la probabilité d’un match nul au football

L’une des limites des modèles de Poisson est leur manque d’efficacité prédictive en ce qui concerne la probabilité des matchs nuls sans buts. Cet article explique comment ajuster un modèle de Poisson de façon à gérer les matchs nuls sans buts. Lisez la suite pour en savoir plus.

Le modèle de base utilisé pour prédire les scores au football ou dans d’autre sport est le modèle de Poisson (ou ses variantes). L’approche la plus simple consiste à définir un paramètre de buts prévus pour chacune des équipes, puis à prédire les scores en conséquence et éventuellement le match nul football.

Loi de Poisson : prédire le score dans le cadre d’un pari au football
Pour résumer le modèle de Poisson, le paramètre de l’équipe locale correspond à sa propension moyenne à marquer multipliée par son facteur d’attaque. Un facteur de défense calculé pour l’équipe visiteuse. Le premier ajuste l’avantage de l’équipe locale en fonction de la capacité de défense des visiteurs. (plus la défense est forte, plus les chances de marquer sont faibles) ; le second tient compte de la capacité à marquer de l’équipe locale. Le taux de buts prévus de l’équipe visiteuse se calcule de la même façon, mais avec son propre facteur d’attaque et le facteur de défense de l’équipe locale.

Les limites des modèles de Poisson

Comme pour tous les modèles, prédire le score d’un match de football avec un modèle de Poisson présente quelques limites ; notamment,lesrésultats sont sensibles aux modifications des paramètre utilisés.

La véritable probabilité d’un match nul 0-0 est bien plus forte pour les équipes coutumières des scores élevés, car celles-ci risquent de ralentir le rythme si le match reste sans buts après un certain temps.

Le modèle de Poisson suppose également que, une fois les paramètres de buts prévus définis, le nombre de buts marqués par une équipe est indépendant du nombre de buts marqués par l’autre. Même si cet aspect est légèrement tempéré par les capacités d’attaque et de défense, peut-on vraiment s’attendre à ce que la probabilité qu’une équipe visiteuse marque cinq buts soit la même, que ses adversaires en totalisent cinq ou zéro ?

La limite la plus importante est l’hypothèse selon laquelle la variance des buts marqués par équipe est égale au nombre de buts prévus, qui est un trait de la loi de Poisson. Il existe des moyens ingénieux de régler ce problème, comme les modèles de Poisson à surdispersion (ou à sous-dispersion) et à deux variables, mais ceux-ci débordent le cadre de cet article.

Ces limites ont pour effet conjoint d’entraver la capacité du modèle de Poisson à évaluer la probabilité des matchs nuls 0-0, qui peut être supérieure ou inférieure au résultat obtenu. Mon intuition est que le modèle de Poisson a tendance à minimiser la possibilité d’un match nul 0-0 chez les équipes affichant un paramètre de buts prévus élevé.

La véritable probabilité d’un match nul 0-0 est bien plus forte pour les équipes coutumières des scores élevés, car celles-ci risquent de ralentir le rythme si le match reste sans buts après un certain temps. À l’inverse, les équipes qui marquent peu maintiendront peut-être une cadence plus soutenue jusqu’au premier but. Le modèle de Poisson standard ne reflèterait pas cette tendance, et surprédirait ainsi la probabilité d’un match nul 0-0. Cela étant, cette intuition ne s’appuie sur aucun test ; si quelqu’un souhaite la vérifier, qu’il n’hésite pas à me contacter.

Comment augmenter ou réduire la probabilité d’un match nul

Pour ajuster la probabilité des matchs nuls 0-0, une approche consiste à l’augmenter ou à la réduire, puis à adapter les prédictions en conséquence. Expliquons ce processus en cinq étapes à l’aide d’un exemple simple :

Étape 1 : Calculer les paramètres de buts prévus pour chaque équipe

C’est probablement la partie la plus chronophage, sauf si elle est automatisée. Benjamin Cronin l’explique on ne peut mieux dans son les résultats sont sensibles aux modifications des paramètre . Dans un souci de concision, nous supposerons que les paramètres finaux de moyennes de buts valent 1,7 pour l’équipe locale et 1,2 pour les visiteurs (chiffres pris au hasard).

Étape 2 : Calculer la probabilité du nombre de buts marqués par équipe

Il existe pour cela une formule, dont le lien ci-dessus donne un exemple développé. Dans notre cas, voici la distribution de probabilité du nombre de buts marqués, calculée suivant cette formule, que nous utiliserons :

– – Probabilité du nombre de buts
Équipe Paramètre de buts prévus 0 1 2 3 4
Locale 1,7 18,30 % 31,10 % 26,40 % 15,00 % 6,40 %
Visiteuse 1,2 30,10 % 36,10 % 21,70 % 8,70 % 2,60 %
Étape 3 : Calculer la distribution de probabilité des scores

Nous pouvons à présent multiplier les probabilités des différents scores. Par exemple, un score 0-0 a une probabilité de 18,3 % x 30,1 % = 5,5 %. Les résultats sont indiqués ci-dessous. À noter qu’ils ne donnent pas 100 % au total, car d’autres scores sont possibles (par exemple, 5-1). Signalons que la probabilité des autres scores s’élève à 3,7 %.

– – Buts de l’équipe locale – – –
– – 0 1 2 3 4
Buts de l’équipe visiteuse 0 5,50 % 9,40 % 8,00 % 4,50 % 1,90 %
– 1 6,60 % 11,20 % 9,50 % 5,40 % 2,30 %
– 2 4,00 % 6,70 % 5,70 % 3,20 % 1,40 %
– 3 1,60 % 2,70 % 2,30 % 1,30 % 0,60 %
– 4 0,50 % 0,80 % 0,70 % 0,40 % 0,20 %
Étape 4.a : Calculer le paramètre d’inflation/de déflation des matchs nuls 0-0

C’est ici qu’une certaine subjectivité est susceptible de s’immiscer. Supposons par exemple que les statistiques passées semblent impliquer qu’une égalité 0-0 ait une probabilité de 10 %. Il faudrait donc passer de 5,5 % à 10 %.

Le paramètre d’inflation se calcule ainsi :

(probabilité présumée d’une égalité 0-0) / (probabilité prédite) = (probabilité présumée) / (probabilité(0,0))

Ce qui donne avec le symbole α :

α = 10 / 5,5 = 1,82

Cela signifie en somme que l’on augmente de 82 % la probabilité d’un match nul sans buts. Sachant qu’elle est passée de 5,5 % à 10 %, le cumul des autres probabilités doit baisser d’autant, de sorte que le total de toutes les issues soit égal à 100 %.

Étape 4.b : Calculer le paramètre d’inflation/de déflation des autres scores

Si l’on utilise le symbole β pour ce facteur, on peut partir de l’équation suivante :

β = (1 – α[probabilité(0,0)]) / (1 – [probabilité(0,0)]) = (1 – probabilité présumée) / (1 – probabilité prédite)

Dans notre cas, on obtient : β = (1 – 0,1) / (1 – 0,055) = 0,95

Étape 5 : Remplir le tableau des scores augmentés

Nous pouvons à présent recalculer la probabilité des différents scores, en multipliant la probabilité de match nul 0-0 par α et le reste par β. On obtient alors les résultats suivants, la probabilité des autres scores étant égale à 3,5 %.

Buts de l’équipe locale

– – 0 1 2 3 4
Buts de l’équipe visiteuse 0 10,00 % 8,90 % 7,60 % 4,30 % 1,80 %
– 1 6,30 % 10,70 % 9,10 % 5,10 % 2,20 %
– 2 3,80 % 6,40 % 5,50 % 3,10 % 1,30 %
– 3 1,50 % 2,60 % 2,20 % 1.20 % 0,50 %
– 4 0,50 % 0,80 % 0,70 % 0,40 % 0,20 %
Qu’avons-nous appris sur l’ajustement du modèle de Poisson ?

Tout au long de cet article, nous avons tenté d’ajuster le modèle de Poisson classique pour modifier la probabilité d’un match nul sans buts. Il est possible de l’étendre pour adapter tous types de scores, tant que la probabilité de l’ensemble des issues est également ajustée de façon à donner 100 %.

Ce n’est pas la seule méthode qui soit pour changer la probabilité de certains résultats. Par exemple, Alun Owen a décrit, lors de la conférence MathSport de juin dernier, une approche potentiellement meilleure, qui met en jeu un modèle de Poisson tronqué.

L’ajustement ne minimise pas les limites des modèles de Poisson que nous avons en partie mentionnées. En effet, il ajoute d’autres hypothèses : la probabilité supposée d’un match nul sans buts, de même que le fait que toutes les autres probabilités sont ajustées d’autant (β). Cela étant, il peut représenter une amélioration notable par rapport aux modèles classiques, qui tendent à sous-/surestimer les matchs nuls sans buts.