Ici, dans la salle d’étude du football, les « cinq facteurs » sont souvent cités et étudiés. Quels sont les cinq facteurs ? L’explosivité, l’efficacité, la position sur le terrain, les arrivées et les rotations : les facteurs jugés les plus importants au cours d’un match. Pour plus d’informations sur le football américain, lisez cet article.

Les équipes qui remportent les cinq facteurs dans un match particulier ont beaucoup plus de chances de gagner ce match, entre 70 et 85%.

L’essentiel de mon approche a consisté à utiliser les statistiques cumulées de la saison pour les cinq facteurs de chaque équipe arrivant dans un match particulier et à comparer la corrélation entre ces statistiques et les résultats finaux. Il existe de nombreux paramètres appropriés pour mesurer chacun des cinq facteurs ; pour cette étude, j’utilise le PpP (explosivité), le taux de réussite (efficacité), la position moyenne de départ sur le terrain (position sur le terrain), les points par déplacement dans les 40 (entraînements d’arrivée) et le pourcentage de jeu Havoc (rotation). Les jeux Havoc sont les jeux qui se terminent par un TFL, un sac, un PBU, un hurry, un int ou un tâtonnement forcé.

L’ensemble de données que j’ai utilisé pour cette analyse comprenait tous les matchs réguliers de la semaine 7 et des années suivantes de 2005 à 2014 (3 612 matchs). Je n’utilise les matchs après la semaine 7 que pour permettre aux statistiques cumulées de la saison de se stabiliser un peu. Pour chaque match, nous avons les statistiques de la saison O et D de chaque équipe pour chacun des cinq facteurs entrant dans ce match. Je voulais une seule valeur pour chacun des cinq facteurs au lieu de quatre (équipe à domicile O, équipe à domicile D, équipe à l’extérieur O, équipe à l’extérieur D), alors je les ai combinés en une seule métrique. La métrique pour chacun des facteurs est construite de telle sorte que les valeurs positives impliquent que l’équipe locale sera meilleure dans le jeu et, par conséquent, les valeurs négatives impliquent que l’équipe à l’extérieur sera meilleure. Par conséquent, nous avons ajouté les statistiques de l’équipe locale O et de l’équipe absente D (plus la valeur est élevée, mieux c’est pour l’équipe locale) et soustrait les statistiques de l’équipe locale D et de l’équipe absente O (moins la valeur est élevée, mieux c’est pour l’équipe locale). Prenons l’exemple de Kansas @ Kansas State de la 14e semaine de 2014 :

UNIT PpP NCAA Moyenne Différence
Attaque fixe du Kansas 0,4284 0,345 +0,0834
Défense du Kansas 0,3715 0,345 +0,0265
Défense fixe du Kansas 0,2783 0,345 -0,0667
Attaque du Kansas 0,2137 0,345 -0,1313
Simple métrique (SOMME avec + + – -) 0,3079   +0,3079

La mesure unique est positive, ce qui indique que le PpP choisirait l’État du Kansas comme vainqueur. Cette valeur indiquerait également que, selon les totaux non ajustés de la saison, l’État du Kansas devrait avoir une valeur PpP de 0,345 + 0,3079 = 0,6529 (0,3079 de mieux que la moyenne) dans ce jeu particulier.

Quels ont été les résultats ? Commençons par les choses les plus simples…

Le projet de loi accorde plus de poids à l’Explosivité et à l’Efficacité qu’aux autres facteurs, et lorsqu’on pense aux facteurs de manière prédictive, cela a du sens. Ces deux statistiques sont plus stables d’un jeu à l’autre – la position sur le terrain, les arrivées et les rotations sont beaucoup plus délicates.  C’est également ce qui ressort de l’examen des cinq facteurs individuels en tant que facteurs de prédiction :

Facteur Gain comme prédicteur%
PpP (Explosivité) 71,1%
Taux de réussite (efficacité) 70,0%
Position sur le terrain (Position de départ moyenne sur le terrain) 63,1%

 

Entraînements de finition (Pts. par entraînement à l’intérieur de 40) 53.0%

 

Taux de rotation (taux d’Havoc) 51.0%

Rien qu’en utilisant les PpP O et D de deux équipes, vous pouvez vous attendre à choisir 71% des jeux correctement. Ce n’est pas si mal ! Les algorithmes suivis par Prediction Tracker sont en moyenne d’environ 75% et peuvent être beaucoup, beaucoup plus complexes.

Il est également pertinent d’examiner combien de facteurs sont associés à une équipe. Dans les jeux où les 5 facteurs sont du côté de la même équipe, le choix était correct 79,1% du temps. Lorsque 4 ou 5 facteurs sont en accord, le choix des 5 facteurs est correct dans 75,4 % des cas.

Qu’en est-il d’une approche plus complexe ?

J’ai également essayé d’adapter un arbre de décision aux données. Les résultats et les variables sélectionnés par l’algorithme n’étaient pas surprenants (en utilisant uniquement le PpP et le taux de réussite), mais cela permet d’isoler des scénarios où les cinq facteurs peuvent être encore meilleurs pour choisir les gagnants.

Si l’on s’en tient aux jeux qui se situent en dehors des nœuds de l’arbre de décision encerclés, le % de réussite passe à 83,3 %. Ces nœuds représentent 49,7 % des jeux, donc sur environ la moitié des jeux, on peut s’attendre à choisir correctement 83,3 % des jeux ; encore une fois, c’est plutôt bien – si vous ne vous souciez pas de choisir tous les jeux.

Les résultats sont-ils surprenants ? Non. Mais cela montre une fois de plus l’intérêt d’identifier des statistiques de base importantes décrivant les performances d’une équipe, sans trop compliquer les choses. Longue vie aux cinq facteurs.