Il y a un bout de temps, lors d’un cours sur la maîtrise de la qualité, un de mes professeurs avait formulé un affirmation suffisamment marquante pour que je m’en rappelle aujourd’hui : “si vous ne deviez retenir qu’une seule chose de vos études d’ingénieurs, c’est le principe de Pareto”. Cette pseudo-loi de la nature qui stipule que 20% des causes engendrent 80% des effets n’est pourtant ni un objet mathématique, ni une loi physique. Il s’agirait plutôt d’un principe, d’un pattern qui – comme le nombre d’or – se vérifierait par l’observation récurrente de proportions se répétant vaguement dans le monde qui nous entoure. J’y vais d’un ton sarcastique mais présenté de la sorte, le concept sent l’arnaque non ?

Le principe de Pareto est-il une grosse arnaque ?

Disclaimer

Lorsque je parlerai de Pareto, ou de principe de Pareto dans cet article, ce ne sera pas pour faire référence à la Loi de Pareto – une loi de répartition statistique – mais bien au pseudo-corrolaire qui en dérive et qui propose que 20% des causes à un phénomène suffiraient (trop) souvent (pour que ce soit un hasard) à expliquer 80% de ce phénomène. Quelques exemples souvent utilisés : 

  • 20% de vos clients génèrent 80% de votre chiffre d’affaire
  • 20% de la population est à l’origine de 80% des frais de [insérez ce que vous voulez] (soins de santé, justice, assurance…)
  • 20% de vos tâches professionnelles produisent 80% de la valeur
  • 20% de vos interactions sociales / de vos amis font 80% de votre bonheur (je vous promets que je l’ai déjà entendu…)
  • Vos exemples en commentaire !

Je m’apprête donc à supputer, fomenter, conspirer contre ce principe du 80/20 qui se retrouve même dans des “tuto productivité” sur fond de développement personnel et qui, sans aller jusque là, est souvent un « théorème » prégnant en entreprise. Nous mêmes à ISLEAN, nous utilisons souvent les méthodes qui en dérivent (résolution de problème, Méthode ABC…) pour nos clients. Cet article n’est pas l’objet d’une étude approfondie mais d’un questionnement critique dont je vous encourage à malmener les fondements.

Le principe de Pareto frôle la tautologie

Imaginez. Vous êtes face à un problème et vous cherchez à le résoudre. Pour cela vous faites le diagnostic des causes à votre problème et, chaque situation étant différente, chacun d’entre vous arrive à des ventilations causes / problèmes différentes où : 

  • parfois 21% des causes expliquent 79% du problème
  • parfois 40% des causes expliquent 60% du problème
  • parfois 5% des causes expliquent 95% du problème

Je me suis demandé pourquoi, pour qualifier une répartition causes / effets, on choisit souvent le point de la courbe cumulée des causes tel que la somme des proportions des causes (p) et des effets fait 100% ? Une réponse possible vient de la relation existant entre p et k (nommé « alpha » ci-dessous)l’indice Pareto : 

Source

Cette relation vaut donc pour le point (X,Y) de la courbe Pareto où X = p et Y=1-p, d’où certainement le choix récurrent des points tels que la somme des causes et des effets fait 100%.)

Dès lors, à partir de quels seuils peut-on considérer que le principe de Pareto s’est appliqué ? La valeur “discrète” de 80/20 ne s’appliquant pas dans le monde continu qu’est le nôtre, quelles bornes doit-on fixer à cette proportion pour que l’on puisse raisonnablement se dire : “là, une forme d’entité organisatrice s’est mêlée de mes affaires et a paretoïsé mon problème” ?

On propose souvent qu’entre 70/30 et 90/10, on est encore dans le principe de Pareto (c’est arbitraire mais je ne suis pas le seul à le dire ; voyez plutôt ici, ici ou ici). Si on accepte ces bornes, comment cela se traduit-il ? Schématisons :

Dans ce schéma je propose de n’observer que la moitié du champ des cas de répartition effets/causes possibles, la moitié manquante étant symétrique (si 70% des causes expliquent 30% des effets, c’est que les 30% restantes expliquent 70% de l’effet).

Une autre manière de visualiser ce “périmètre d’applicabilité” est de reconstruire la courbe de Lorentz pour différentes valeurs de k l’indice Pareto :

Abscisses : part cumulée croissante des causes ; Ordonnées : part cumulée croissante des effets

chaque point L(F) des courbes est calculé tel que : 

Où F est la part des causes cumulées croissantes, k est l’indice de Pareto

Le rapport entre k et les cas de répartition effet (p) / causes (1-p) (20%/80%, 30%/70%…) est dérivé de la courbe de Lorentz : 

En somme, et avec les bornes couramment choisies pour parler d’effet “Pareto”, on voit que le principe adresse de fait 40% de la totalité des cas de figure imaginables a priori pour la répartition causes / effets. Pour parler d’un véritable “effet” Pareto, particulièrement récurrent – ou d’une loi de la nature – il faudrait donc que l’on observe son application dans bien plus que 40% des cas où l’on cherche à ventiler un effet par des causes.

De mon expérience personnelle, à travers l’ensemble des analyses que j’ai été amené à conduire, je ne peux pas affirmer que j’ai retrouvé cet effet (dans l’acception bornée 70/30-90/10) dans une proportion significativement supérieure à 40%… Ça vaut ce que ça vaut, c’est-à-dire peu de chose – en tout cas certainement pas un résultat d’étude – mais qu’en est-il de vous ?

Quoiqu’il en soit, le principe du 80/20 ne vient pas non plus d’un résultat d’étude, la charge de la preuve revient donc à ceux qui le mettent en avant ! D’ici là et étant donné que le phénomène couvre de fait la quasi-moitié du champ des possibles, je ne peux pas m’empêcher de penser qu’on est face à une forme de tautologie

Pourquoi je m’acharne contre Pareto ?

Jusqu’ici, j’ai fait un peu le naïf. Aujourd’hui, dans la boîte à outils du Lean, le principe de Pareto n’est pas tant mis en avant comme une “loi de la nature” mais plutôt comme une forme de règle à avoir en tête pour attaquer un problème par ses causes les plus importantes. On parle alors de Méthode Pareto ou de méthode ABC. Le but de ces méthodes est de classifier les causes à un phénomène par groupes d’importance, dimensionnés en fonction du coefficient de Gini (dérivé de k l’indice Pareto) de la courbe Pareto obtenue. 

En d’autres termes, le principe de Pareto nous dit qu’il y a un déséquilibre quasi-systématique dans la pondération des causes contribuant à un phénomène. C’est peut-être en cela que le principe est “naturel” : sans régulation ou sans forme d’intervention, du déséquilibre, il y en a partout dans la nature et dans les organisations humaines.

Mais pourquoi le 80/20 précisément ? Et bien principalement parce que V. Pareto l’a théorisé en premier dans une démarche empirique qu’il n’a jamais vraiment réussi à généraliser  (fin XIXe, Pareto observait qu’environ 20% des personnes possédaient environ 80% des terres dans beaucoup de pays). Depuis, le 80/20 nous est resté mais je n’ai trouvé aucune étude permettant de faire passer cette Hypothèse au rang des Théories. Et comme je vous le disais, mon expérience personnelle ne le confirme pas non plus. (encore une fois : qu’en est-il de vous ?)

Au passage, on pourrait presque considérer la répartition des causes/effets comme un quantificateur de l’absence de régulation / d’intervention sur le phénomène observé. Le danger serait que le 80/20 s’imposerait dès lors comme un seuil d’alerte arbitraire et donc – au moins un peu – idéologique (et qui aime l’idéologie ?).

On se fiche du 80/20, l’important c’est la rigueur

En réalité, ce que je redoute c’est qu’à force de penser que le 80/20 est une loi de la nature qui doit se retrouver “un peu partout”, nous infligions d’emblée à notre observation un biais de raisonnement qui consisterait à vouloir retrouver systématiquement ce 80/20. On pourrait même être amené à penser que le fait de ne pas obtenir un 80/20 est signe d’un mauvais découpage / d’une mauvaise description du phénomène que l’on observe. Pour ma part, je pense qu’il ne faut surtout pas affubler nos observations d’un tel a priori : l’important c’est avant tout d’adopter une démarche d’observation rigoureuse.

Car en effet, et en tant qu’observateur dans un exercice de classification des causes, nous influons au moins de 3 manières sur la manipulation des données et donc sur les résultats de nos analyses : 

Exemple : pour déterminer mon top des ventes de véhicules je décide de regrouper mon parc par couleur de véhicules plutôt que par marque constructeur.

Exemple : pour déterminer mon top des ventes de véhicules, je décide d’exclure les trafics et les SUV.

Exemple : pour déterminer mon top des ventes de véhicules, je décide de m’attribuer quelques ventes d’un collègue commercial parce qu’après tout, c’est moi qui ai finalisé ses dossiers et de toutes manières j’ai clairement contribué plus que lui aux ventes ce mois-ci…

Pour en apprendre plus sur nos biais cognitifs, voici deux conseils de lecture sur notre blog :

Dès lors et connaissant ces facteurs d’influence de l’observateur sur le phénomène observé, on pourrait même imaginer que la loi du 80/20 ne soit pas une loi de la nature mais plutôt une contingence due à l’observateur. Une théorie un peu fumeuse ? Tout de même pas improbable… Mais après tout, le mieux est certainement de tester ces facteurs d’influence. Je vous propose ici d’observer les conditions d’apparition (ou de non apparition) de “l’effet Pareto” selon les choix que l’on fait en tant qu’observateur du phénomène. Pour cela nous allons utiliser les données nationales des crimes et délits enregistrés par les services de gendarmerie en 2020. Promis j’ai choisi ces données au hasard.

1. Je fais varier les catégories de classification pour la ventilation des crimes.

Ici, à partir des données à disposition, on peut proposer 3 manières de ventiler le nombre de crimes commis en 2020 (on pourrait en trouver beaucoup plus) : 

2. Je fais varier le périmètre d’observation pour la ventilation des crimes par type de crime

On prendra ici deux exemples : les crimes enregistrés par le DCPJ (Direction Centrale de la Police Judiciaire) et ceux enregistrés par la Direction de l’Ordre Public et de la Circulation :

Pour conclure

Nous avons parcouru ensemble plusieurs points de critique du principe du 80/20 :

  • Le principe de Pareto, tel qu’il est couramment employé, adresse de fait la quasi-moitié du champ des possibles dans la répartition causes / effets : le concept frôle donc la tautologie.
  • Le principe de Pareto peut apparaître ou ne pas apparaître selon la manière dont on observe le phénomène, c’est-à-dire en faisant varier le périmètre d’observation et les catégories de qualification des causes : le concept est donc (au moins un peu) une contingence.

Jusqu’à preuve du contraire, et un peu par esprit de contradiction, je considèrerai donc le principe du 80/20 comme une tautologie contingente !