Collaboration spéciale de Bob Sullivan, SportingCharts (sportingcharts.com) - Durant la présaison, dans une analyse pour SportingCharts.com, j’ai cherché quelle(s) statistique(s) d’équipe de la dernière saison peu(ven)t servir le plus efficacement à prédire le total final de points que chaque formation de la LNH aura en 2015-2016. Pour accomplir cela, j’ai utilisé des méthodes d’analyse de régression linéaire simple (une seule variable) et de régression linéaire multiple (plusieurs variables).

J’ai commencé par effectuer une analyse de régression linéaire simple et j’ai déterminé que le différentiel de buts, le Corsi (la part du total des buts marqués, tirs au but, tirs manqués et tirs bloqués par une équipe au cours d’un match sous forme de pourcentage) et le Fenwick (comme le Corsi excluant les tirs bloqués) sont les variables qui ont la plus forte corrélation avec le total de points pour la prochaine saison. Pour tester un modèle prévisionnel, cela constituait un excellent point de départ une fois ces variables combinées à d’autres ayant moins de corrélation comme les mises en jeu, les mises en échec, les pénalités, etc.

Il s’avère que le différentiel de buts et le Fenwick forment la combinaison la plus significative. Cependant, une combinaison Fenwick et pourcentages cumulés (PDO), soit le cumul du pourcentage d’arrêts d’une équipe à son taux de conversion de tirs en buts, ne sont pas très loin derrière, tout comme la combinaison différentiel-PDO.

Avant de finaliser l’analyse de régression, il est crucial de comprendre comment les variables interagissent entre elles. La combinaison de variables comme le différentiel de but et le PDO ne sont peut-être pas aussi révélatrices lorsqu’analysées séparément puisqu’elles dépendent l’une de l’autre. Le différentiel de buts est directement lié à la précision des tirs et à la capacité d’arrêter les rondelles. En conséquence, vous pouvez examiner ces trois statistiques ensemble dans une analyse de régression, mais en tant que variable indépendante. Comment transformer deux variables en une? Dans le cas présent, j’ai multiplié le différentiel de but par le PDO. Après avoir analysé plusieurs des statistiques de cette façon, j’ai observé que le taux d’efficacité sur les mises en jeu et la possession de rondelle sont des variables qui sont aussi interreliées.

La dernière étape dans l’établissement d’un modèle prévisionnel était de déterminer dans quelle situation sont obtenus les meilleurs résultats. Mon étude initiale était basée sur des scénarios à 5 contre 5, mais j’ai aussi analysé des scénarios à 5 contre 5 alors qu’il y a un but d’écart dans les deux premières périodes ou que le pointage est égal lors de la dernière (dit « Within 1 »). Il en résulte que pour établir le meilleur modèle, il faut se baser sur la possession de rondelle selon un scénario à 5 contre 5 Within 1 tout en utilisant le différentiel de buts et le PDO toutes situations confondues. Au final, la formule à utiliser pour prédire le total de points de chaque équipe est la suivante :

Points de l’équipe en 2015-2016

=

37.77

+

216.30 x

5 contre 5 avec 1 but d’écart ou moins en 2014-2015

Fenwick x mises en jeu

+

0.13 x

2014-2015

Différentiel de buts x PDO

Puisque dans les faits les équipes performent parfois au-delà des attentes et parfois en-dessous, j’ai utilisé des méthodes d’interpolation linéaire pour ajuster les résultats et effectuer les prédictions finales qui sont plus représentatives de la réalité.

Par exemple, Montréal avait les statistiques suivantes en 2014-2015 :

·         5-on-5 Within 1, Fenwick = 50,1 %

·         5-on-5 Within 1, mises en jeu = 51,4 %

·         Différentiel de buts  = +30

·         PDO = 101,7 %

Ces données mènent à une projection 2015-2016 de 97,5 points en respectant la formule mathématique de régression. Après les ajustements d’interpolation linéaire (détermination approchée d'une valeur à partir de valeurs voisines faisant partie d'une série succincte, Le Robert), le total augmente à 98,3, soit près de 12 points de moins que la saison dernière.

SportingChartsVoici à droite les résultats obtenus pour les équipes de l’Association Est cette saison.

La saison dernière, Montréal a fini avec 110 points, au premier rang de la division Atlantique et au deuxième rang dans la LNH.

Pourquoi l’analyse de régression prédit-elle donc aux Canadiens une perte de terrain en faveur des Capitals, des Islanders et des Red Wings?

Le tableau suivant, qui inclut toutes les équipes de la ligue, explique cette diminution.

 

SportingChartsLes points dans le graphique se situent à l’intersection entre le Fenwick et le taux de réussite dans les mises en jeu en situation de 5 contre 5 Within 1 la saison passée. Le CH se situe dans la portion supérieure droite, mais environ au centre de ses compétiteurs.

Ce n’est pas mauvais, mais pas vraiment indicatif d’une équipe aspirant au trophée des Présidents non plus.

Le prochain graphique tient compte de deux autres variables impliquées dans la formule de régression, soit le différentiel de buts et le PDO.

SportingChartsCes statistiques sont grandement influencées par les performances de Carey Price. Price n’a pas d’impact sur les buts marqués, mais certainement sur les buts encaissés. Price a aussi une influence sur le PDO de l’équipe, qui était classée deuxième à ce chapitre la saison passée.

Ce graphique est beaucoup plus positif pour les Habs. Comme indiqué, Montréal est parmi les meneurs en termes de PDO et est aussi bien placé en termes de différentiel de buts.

Les deux précédents graphiques sont un bon indicateur que l’équipe devrait participer aux séries. Les chiffres ne démontrent pas que cette saison sera digne d’un autre trophée des Présidents, mais les Canadiens devraient être en bonne posture pour les séries dans ce qui sera assurément une Association de l’Est compétitive.