15 juin 2009

Football : Le calendrier détermine-t-il le résultat ?

Objectif de l'étude : expliquer en quoi le calendrier d'une équipe peut favoriser ou défavoriser celle-ci. Pour cela, nous proposerons de créer un indice de difficulté des matchs, et ainsi de dégager un indice moyen de difficulté pour chaque équipe, voire de permettre un classement "en temps réel" de celles-ci. Nous verrons ensuite en quoi cette indice peut expliquer une partie du succès ou de l'infortune des clubs de Ligue 1 au cours de la saison 2008-2009. ----> l'étude complète est ICI (le principal onglet s'intitule "sur 5 matchs - comparatif (5)")

Le calendrier de la Ligue 1 pour la saison 2009-2010 a a été dévoilé la semaine dernière, avec pour tête d'affiche en 1ère journée les deux champions face-à-face, Lens (L2) et Bordeaux (L1). Ce dernier doit son titre de champion 2009 à un extraordinaire sprint final, qui l'aura vu enchaîner 11 victoires au cours des 11 dernières journées. Certains ne manqueront pas de considérer la relative facilité de leur fin de calendrier comme un avantage décisif dans la lutte pour le titre. Mais dans quelle mesure le calendrier d'une équipe peut-il l'avantager ?

Une saison, ce sont 10 mois et 38 matchs de championnats entrecoupés de matchs de coupe : la forme, la confiance et la qualité de jeu d'une équipe peuvent varier considérablement pendant cette période, et ce indépendamment de tous les aléas du jeu (blessures, erreurs d'arbitrage, conditions de jeu, etc.). Et en fonction de ce niveau général de l'équipe, affronter tel ou tel adversaire ne présente plus la même difficulté : entre affronter le Lyon serein d'octobre 2008 et le Lyon abattu de mars 2009, la différence est énorme, même si l'adversaire est nominalement le même.

Personne ne peut prévoir avec certitude au début d'une saison quelles seront les équipes qui joueront le titre et celles qui lutteront pour le maintien. Toulouse a fini le championnat 2008-2009 à la 4ème place, et Saint-Etienne a fini 17ème. Au début de la saison, compte-tenu de leurs effectifs (départ d'Elmander de Toulouse) et de leur saison 2007-2008 (Saint-Etienne 5ème et Toulouse 17ème), beaucoup auraient parié l'inverse ! Si on ne peut donc pas prévoir en début de saison la difficulté qu'il y aura à affronter telle ou telle équipe, on peut en revanche constater après coup qu'en raison des aléas de l'état de forme de leur adversaire du jour, toutes les équipes du championnat n'auront pas eu un championnat d'égale difficulté.

 

432photomontagefinL1.jpg

Quelques exemples issus du championnat de Ligue 1 2008-2009...

  • Après la 25ème journée, l'OL comptait 6 points d'avance sur son dauphin : qui aurait pu prévoir que les Lyonnais ne prendraient que 9 points au cours des 9 matchs suivants ? Si ces résultats étaient imprévisibles, on peut néanmoins souligner que ce fut un avantage pour Bordeaux que d'affronter Lyon à la 32ème journée, en plein dans le creux des Gones. A l'inverse, on peut supposer que Bordeaux aurait connu plus mauvaise fortune s'ils avaient dû affronter Lyon entre la 22ème et la 25 journée, période où les Girondins ne prirent que 3 points en 4 matchs, contre 10 (sur 12 possibles) pour l'OL.
  • Le Mans : après 10 journées, les Manceaux pointaient en 3ème place du classement... début de saison tonitruant, qui contraste fortement avec leur fin de parcours, puisque les Sarthois n'ont sauvés leur tête qu'à la dernière journée, terminant à 3 longueurs du premier reléguable, et pointant même à la 18ème place du classement des matchs retour. Affronter le Mans en début de championnat ou à la fin de celui-ci ne présentait donc pas la même difficulté.
  • Le PSG : après leur lourde défaite à Bordeaux, les hommes de Paul Le Guen avaient brillamment relevé la tête, en prenant 19 points (sur 21 possibles) au cours des 7 journées suivantes... loin de leur fin de saison où, incapables de gagner leurs 3 derniers matchs à domicile, ils laissèrent filer une place européenne...

Mais comment juger de la difficulté d'un match ? Est-il possible de faire un classement "en temps réel" des équipes, afin de déterminer quelle est la réelle difficulté d'un match ? C'est ce que nous nous proposons d'essayer, en mettant au point un indice de difficulté du match, et de déterminer l'indice moyen de difficulté d'un match pour une équipe. Nous pourrons ainsi voir si le calendrier d'une quipe peut prendre une part importante à l'explication de ses résultats.

Détermination d'un indice de difficulté du match

Nous pouvons considérer que la difficulté intrinsèque d'un match pour une équipe (indépendamment donc de son propre état de forme) réside dans 3 facteurs :

  • à Domicile ou à l'Extérieur ? Statistiquement, il est évidemment plus intéressant de jouer à domicile. Sur les 380 matchs disputés dans le championnat de Ligue 1 lors de la saison 2008-2009, 165 se sont soldés par une victoire à domicile (43,4 %), contre 103 victoires à l'extérieur (27,1 %) et 112 matchs nuls (29,5 %).
  • Quel est la classement de l'adversaire ? Affronter le 2ème ou le 19ème ne présente bien sûr pas la même difficulté. Mais le classement prend en compte une trop longue historique des résultats... quand on affronte une équipe lors de la 25ème journée, les résultats des matchs entre la 1ère et la 10ème journée influent bien peu sur ses performances du moment.
  • Sur quel dynamique est l'adversaire ? Vient-il d'enchaîner les bons résultats, ou est-il au contraire en plein doute après une série de revers ?

Partant de ces considérations, nous avons donc créé un indicateur de difficulté d'un match, qui sera le produit des 3 paramètres cités :

  • Pour chaque match joué à domicile, l'indicateur de difficulté sera la probabilité d'une victoire à l'extérieur, et inversement ;
  • Pour déterminer la difficulté liée au classement, nous avons compté le nombre total de points distribués lors du championnat 2008-2009 (1028 en tout), et regarder quelle part de point représentait chaque rang. Par exemple, le 1er (ici, Bordeaux) a marqué 80 points, soit 7,78% de l'ensemble des points distribués ; le dernier (ici, Le Havre) a marqué 26 points, soit 2,53% des points distribués. On considèrera donc que jouer le 1er permet de multiplier l'indice de difficulté par 7,78%, alors que jouer le dernier le fait multiplier par 2,53%. Nous avons fait de même pour déterminer l'indice de chaque rang (ex. la 6ème place vaut 6,23%, la 15ème place 4,09%, etc.), en fonction du classement final --> important : le classement figurant dans le tableau est bien entendu le classement avant le match (ex. pour la 15ème journée, le classement affiché est celui de l'équipe au soir de la 14ème journée)
  • Pour déterminer l'état de forme de l'adversaire, nous avons pris en compte le nombre de points accumulés par l'adversaire au cours des 5 derniers matchs, le tout divisé par 15 (le nombre de points maximal que puisse obtenir une équipe). Cet indicateur est privilégié, car il est le plus circonstanciel. Ainsi, toute équipe ayant perdu 5 matchs consécutifs aura un indice de difficulté global de 0 au match suivant (car multiplication par zéro).

On additionne ensuite tous ces indices, on divise par le nombre de journées, et on obtient une difficulté moyenne par match ----> IMPORTANT : nous prenons en compte ici les 33 dernières journées, et non l'ensemble des 38. En effet, pour pouvoir prendre en compte le critère "dynamique de l'adversaire", il faut les résultats des 5 matchs précédents... par ailleurs, le classement des 5 premières journées est souvent bien aléatoire, il change très vite, et il faut attendre un minimum de temps avant qu'un semblant de hiérarchie stable se dégage.

BILAN pour l'exercice 2008-2009

Voici le tableau des résultats que l'on obtient :

classement indice difficulté.png

 

Le haut du tableau : un calendrier favorable pour Bordeaux, plus difficile pour Lyon

Dans le haut du classement de la Ligue 1, on constate que Bordeaux (ind. : 0,784) semble avoir eu un championnat plus facile que ses rivaux Marseille (ind. 0,859) et Lyon (ind. 0,861). Il faut différencier les matchs aller et retour : 0,86 de moyenne à l'aller contre 0,73 au retour. Marseille a également eu une série de matchs aller plus difficile que les matchs retour (0,93 contre 0,81), ce qui n'est pas le cas de Lyon (0,83 à l'aller contre 0,89 au retour). Ceci peut (en partie) expliquer l'essoufflement du septuple champion de France, qui avait déjà pris un coup sur la tête à Barcelone.

Les décrochés du sprint final : le PSG et Rennes

Quant au PSG, il a lâché prise à partir du match perdu contre Marseille au Parc : le PSG venait de prendre 19 points en 7 matchs, mais ces matchs présentaient un indice moyen de difficulté faible (seulement 0,48), alors que le match de Marseille et les 5 qui suivirent présentaient un indice moyen de difficulté fort (1,14). Autre décrochage symptomatique : celui du Stade Rennais. A la fin des matchs aller, les hommes de Guy Lacombe étaient sur le podium, derrière Lyon et Bordeaux. Ils finissent le championnat 7ème, la faute aussi à une finale de Coupe de France qui a monopolisé les esprits, et à la blessure d'une de leurs pièces maîtresses, Jimmy Briand. Mais l'indice moyen de difficulté ne les aide pas non plus : 0,88 pour les matchs aller contre 1,03 pour les matchs retour (le 2ème plus élevé après Le Mans).

La lutte pour le maintien

Selon nos calculs, c'est donc Le Mans qui aurait eu le championnat le plus difficile. On note d'ailleurs qu'après 17 journées, l'indice de difficulté des Manceaux ne s'élevait toujours qu'à 0,84, ce qui peut donc aussi expliquer leur bon début de saison : ils avaient un championnat plus facile. Sur l'ensemble des matchs retour, l'indice moyen de difficulté des matchs du Mans est en revanche de 1,06, d'où la douloureuse lutte pour le maintien... et une 18ème place sur les matchs retour.

De son côté, Auxerre a eu une série de matchs retour légèrement plus facile en termes d'indice (0,92 contre 0,96 à l'aller). Mais la remontée fulgurante des hommes de Jean Fernandez (qui étaient encore 17ème soit premier non-reléguable après 22 journées !) s'explique heureusement plus par le terrain que par les chiffres : la défense a été un peu plus solide au retour (19 buts encaissés à l'aller, 16 au retour), et l'attaque a fait un bond de +7 au retour (21 buts marqués contre 14 seulement à l'aller), grâce au retour d'un certain Jelen.

Concernant les relégués, on constate l'effet inverse de Bordeaux et de Marseille : des matchs retour plus faciles n'ont pas favorisé leur maintien. Caen (A : 0,92 et R : 0,82), Nantes (A : 0,95 et R : 0,85 ) et Le Havre (A : 0,78 et R : 0,74) n'ont pas profité d'un calendrier a priori favorable. Au regard de nos statistiques, Le Havre a même eu un des championnats les plus faciles ; mais, malgré un retour un peu meilleur (14 points pris contre 12 à l'aller), la cause des Normands était entendue depuis longtemps. Quant aux Caennais et aux Nantais, l'explication de leur descente est à chercher auprès des joueurs et des techniciens eux-mêmes...

Conclusion

Chaque supporter trouvera ici matière à crier au scandale, prétextant que son équipe a été défavorisée. Il n'y a pas d'intention de ma part de polémiquer ou de supposer l'existence d'un quelconque complot (autrement dit : non, Jean-Michel Aulas n'y est pour rien !). Je suis d'ailleurs prêt à débattre de la validité "scientifique" de ce genre d'indicateur et sur son utilité avec quiconque aura de la matière à avancer. Mais je reste persuadé que ne pas tenir compte de l'impact du calendrier pour analyser après-coup les résultats d'une équipe revient à négliger un élément important... surtout au moment de choisir de reconduire un entraîneur ou pas.