Il y a quelques mois seulement, seuls les grands groupes pouvaient se permettre de se lancer dans le développement d’applications à la pointe de l’apprentissage automatique : calculs coûteux, entraînements longs, équipes dédiées. L’une des applications les plus alléchantes reste la prévision. L’enjeu ? Inventaire et OPEX plus bas, meilleurs rendements. Les conditions sont aujourd’hui réunies pour vous permettre à vous aussi de vous lancer dans l’aventure : les géants du Web mettent à disposition leurs apprentissages et leurs infrastructures à la demande.

A vos marques, pré… voyez !

Mes collaborateurs tiennent chacun leur fichier Excel individuel, avec un historique des ventes des références et des clients qui les concernent. Mes directeurs de magasin reçoivent des prévisions de vente sorties dans la douleur du centre de calcul mais ils tiennent à avoir une marge de manoeuvre sur les commandes, parce qu’ils savent eux, que la référence X est un peu plus demandée en cette période de l’année. Mes approvisionneurs sont tous les ans dans le mal, parce qu’un gros client créé des pics sans savoir quand ils interviendront. Je ne sais pas si je peux faire confiance à un outil informatique de prévisions, peut-il prendre en compte les subtilités complexes qu’un humain peut s’approprier ?

Vous vous reconnaissez dans l’un de ces exemples. Vous envisagez peut-être un Proof of Concept (POC). Mais vous n’avez soit pas les compétences pour un développement spécifique, soit pas la taille qui justifie d’investir dans des capacités et temps de calcul énormes.

Surtout ne pas partir de zéro

Les meilleurs algorithmes sont capables de prendre en compte plusieurs éléments, qui constituent des critères de choix :

  • Saisonnalité :
    • L’exemple classique est la vente de bière, qui augmente en été
  • Métadonnées :
    • Le trafic réseau au niveau de routeurs dépend des caractéristiques de ces routeurs
    • La demande pour des vêtements dépend de leur couleur, du style, de la marque
  • Facteurs extérieurs :
    • Jours fériés
    • Evénements promotionnels
  • Les séries sans historique :
    • Lancement d’un nouveau produit
    • Pas de données collectées sur une grandeur qui nous intéresse

La première bonne nouvelle c’est que vous n’avez (probablement) pas tout à refaire. Revue de la littérature, choix d’architectures, implémentation, entraînements, tests comparatifs… Tout ces défis ont été relevés par des géants comme Amazon, car eux aussi ont été confrontés à des besoin de prévision. Et pour cause, gérer des dizaines de millions de références est un exercice fastidieux. Y ajouter tous les entrepôts qui accueillent les stocks, les travailleurs, le trafic sur ses sites webs… cela fait beaucoup d’éléments qui intéragissent et que l’entreprise a appris à dompter et à packager pour un usage facile, à la demande : c’est le rôle de services comme Amazon Forecast.

La deuxième bonne nouvelle c’est que c’est relativement bon marché, surtout sur un périmètre réduit. Avec un pricing à la consommation, il n’est pas choquant de se retrouver avec une facture ne dépassant guère les quelques centaines d’euros pour les plus modestes, quelques milliers pour les ambitieux pour son POC.

Je reprends deux exemples donnés ici :

Premier exemple :

Imaginons que vous possédiez une entreprise de vêtements et que vous vendez 2000 références dans 50 magasins partout dans le monde. Chaque référence combinée à un magasin représente une série, vous aurez donc 100k (2000 références x 50 magasins) séries à prévoir. Supposons que vous chargiez 5Go de données pour cette tâche, et qu’un modèle s’entraîne sur ce jeu de données pendant 20h.

Coût total : 185,24$

Deuxième exemple :

Imaginons que vous fassiez du conseil financier. Votre client a 2000 points de vente de crème glacée, et veut prévoir le flux de trésorerie de chaque point de vente. Chaque combinaison d’un flux et d’un point de vente correspond à une série. Vous avez donc 2000 séries à prévoir. Imaginons que vous chargiez 1Go de données pour réaliser cette tâche, et que le modèle choisi s’entraîne pendant 4 heures sur vos données.

Coût total : 4,65$

 

Vos coûts seront donc principalement liés à la charge consommée par vos collaborateurs ou au consultant qui devra trouver les données à fournir et mettre en place la tuyauterie nécessaire pour fournir les historiques et mettre en valeur les prévisions.

 

Concrètement, comment ça se passe ?

Ca y est, mon compte est créé sur Amazon Web Services.

En terme d’ergonomie, pas besoin d’un programmeur aguerri pour s’y mettre. Je choisis de m’attaquer à la prévision des prix de l’avocat dans certains marchés aux US pour tester.

En quelques clics et quelques minutes, je suis déjà capable d’entraîner un modèle et de sortir mes première prévisions (apparemment c’est un modèle de type ARIMA qui me conviendra le mieux !)

Je suis également en mesure d’y combiner d’autres séries ou des métadonnées qui pourraient influer sur les prix pour affiner les prévisions et tirer partie des corrélations qui n’attendent que d’être exploitées. Ces données seront exportées vers un espace de stockage, ou directement appelées par mon ERP grâce aux API proposées.

Je créé un groupe de données, je renseigne quelques informations sur le format et je dis où se situe mon fichier csv en quelques clics. Les champs sont quasiment tous pré-remplis

Je créé un groupe de données, je renseigne quelques informations sur le format et je dis où se situe mon fichier csv en quelques clics. Les champs sont quasiment tous pré-remplis

Mes données sont bien chargées !

Mes données sont bien chargées !

Je laisse Amazon décider de ce qui sera le mieux pour prédire le prix de mes avocats

Amazon décidera de ce qui sera le mieux pour prédire le prix de mes avocats

 

 

 

 

 

Une fois mon modèle entraîné, je n'ai plus qu'à exporter les données et commencer à les exploiter

Une fois mon modèle entraîné, je n’ai plus qu’à exporter les données et commencer à les exploiter

Conclusion

Il n’y a plus d’excuses pour ne pas se mettre à exploiter ses données, quelle que soit la taille de son entreprise, seul ou accompagné. J’ai choisi aujourd’hui l’exemple d’une brique élémentaire, Amazon Forecast, parce que sa simplicité m’a marqué après avoir passé des semaines à écrire moi-même des modèles, les entraîner et les comparer par le passé. Je viens de faire la même chose en un peu plus d’une heure en manipulant l’outil pour la première fois.

Mais la vraie leçon à tirer est ailleurs : l’Amazon Marketplace est une boutique en ligne pleine de services développés par des entreprises qui s’appuient sur ces briques élémentaires fournies par Amazon Web Services, et qui sont tout aussi faciles à mettre en oeuvre. CRM, ERP, comptabilité, … il n’y a plus qu’à exprimer son besoin et la solution est probablement à portée de mains.