Il y a bien longtemps dans une galaxie pas si lointaine que ça, les données des entreprises étaient considérées comme des sous-produits liés aux activités et aux process sans qu’aucune capitalisation ne soient réalisée sur ces dernières. Organisées en silos hermétiques, seules quelques applications communiquaient entre elles et ce uniquement dans des domaines bien spécifiques tels que le marketing ou les finances.

Alors que la transformation digitale des entreprises est plus prégnante que jamais, la « Data » est devenue un actif à part entière, incontournable dans le processus de création de valeur et d’aide à la décision. Il est désormais commun de voir les données d’une application métier partagées avec au moins 10 autres systèmes. Une fois stockées, croisées et analysées, elles constituent une mine d’informations à haute valeur ajoutée.

Seulement voilà, si l’importance de la Data est désormais unanimement reconnue, on ne peut pas capitaliser efficacement sur cette dernière sans avoir défini une stratégie claire. Ses principes sont simples : s’assurer que toutes les données d’un groupe puissent être utilisées, partagées et déplacées d’un système à un autre. Pour ce faire, elle définit des méthodologies et des process communs afin de gérer, manipuler et partager les données de manière pérenne.

Les quatre composants clés d’une stratégie Data réussie

1) L’identification

Identifier les données et comprendre leur usage en faisant abstraction de leur structure, leur point d’origine ou même leur localisation.

Pour ce faire il convient de créer un système de référencement au travers de métadonnées servant à décrire les données brutes quels que soient leurs supports (e.g : associer une date à une valeur, des coordonnées GPS à une photo, etc.). Une bonne approche est de cartographier l’ensemble des sources de données utilisées par les différents métiers dans leurs process et de les segmenter par typologie. Cette segmentation peut se faire par niveau d’importance à la bonne continuité des opérations du groupe puis par types (e.g : savoir faire métier, technique, juridique, financier, commerce, RH, etc.).

La mise en place d’un portefeuille de données est cruciale à ce stade.

2) Le stockage

Stocker sur une plateforme permettant de centraliser de grandes quantités de données.  Elles doivent être aisément accessibles et exploitables par tous.

Zoom : Data Lake vs Data WareHouse

Les Data Warehouse reposent sur une « modélisation à l’écriture » (on définit au préalable la manière dont la donnée va être stockée et organisée avant de l’écrire), alors que le Data Lake repose sur une « interprétation à lecture » (les données brutes sont chargées sans traitement préalable puis elles sont relues et interprétées selon les besoins dans le Data Lake). Le DataLake est un système bien plus agile, nécessitant moins de planification et de spécifications en amont.

3) La normalisation

Packager les données afin qu’elles soient réutilisables et partageables entre différents systèmes sources. Les données peuvent être issues de systèmes sources externes ou internes à l’entreprise. Le raffinement des données brutes en produits finis nécessite plusieurs étapes  (e.g : transformation, mise en qualité, mise au format souhaité, définition de pivot, …). Le but est d’avoir des données « ready to use » par n’importe quel utilisateur sans nécessiter l’intervention des SI.

4) La gouvernance

Définir, gérer et communiquer des règles et des mécanismes pour un usage efficace de la donnée

Le déploiement des outils se conjugue avec la mise en place d’une organisation. La DSI et les métiers doivent être responsabilisés quant à la qualité des données qui vont alimenter les outils ainsi qu’à leur gouvernance.  A cette étape, la création d’un poste de CDO (Chief Data Officer) est opportune. Il est aussi important de formaliser de contrats d’usages visant à borner l’utilisation de la donnée entre les sources, l’hébergeur et les utilisateurs finaux. Le but étant de palier à tous risques d’abus (e.g : accès à des données à caractère personnel).