Excel : à force d’en faire et d’en refaire pour nos clients (il faut dire que j’adore ça !), j’ai désormais intégré quelques techniques structurantes pour mener une analyse de données en toute sérénité dans cet outil. Je partage ces techniques avec vous. Un guide à garder sous le coude !
Dans cet article je vais donc partager avec vous mes conseils pour mener une analyse de données efficace dans Excel, où efficace veut dire : connaître, utiliser les fonctionnalités adaptées et adopter une démarche structurée pour être productif et limiter les erreurs.
La démarche que je vous propose est la suivante :
Je divulgache d’emblée : bien analyser des données, c’est avant tout bien les préparer, et surtout, bien les nettoyer !
Collecter les données
95% du temps, les données que l’on traite sont compilées dans des Excel produits à la sueur de notre front, de celui de nos collègues ou d’un robot quelque part. Dans ce cas là, le premier savoir technique est de savoir copier / coller des données !
Le reste du temps, vous aurez peut-être affaire à des formats de données plus atypiques, dont certains sont amenés à se démocratiser. Retenez donc ce schéma pour connaître les fonctionnalités d’Excel pour exploiter des données aux formats exotiques :
CSV et TXT sont des formats de données tabulaires, comme dans Excel. La fonction Convertir permet, une fois les données collées dans un tableau, de séparer les colonnes par information en identifiant le séparateur utilisé par le format (, ; _ etc.)
JSON et XML sont des formats de données structurées. Cette structure doit être mise au format tabulaire pour être exploitée dans Excel : on parle de “dénoyautage”. La fonction « Obtenir des données » permet de faire cela. N’ayez donc plus peur lorsque quelqu’un vous demandera “ça te va si je t’envoie un JSON ?”.
Les fonctions à connaître :
- Copier / Coller
- “Convertir”
- “Obtenir des données” (PowerQuery)
Structurer les données
Vos données sont désormais collectées
Une analyse de données se mène dans un environnement où on y voit clair, il faut structurer les données dans une base et, selon moi, il n’y a qu’une structure de base qui vaille dans un outil tableur / fichier plat :
Cela peut paraître anecdotique mais voici quelques exemples d’implications :
- Aucune fusion de cellule
- Aucun calcul effectués directement dans la base
- Un seul et unique tableau par onglet pour les bases de données (et une seul onglet par base de données)
- Chaque ligne doit décrire exactement le même objet et chaque colonne doit contenir le même type d’information de la première à la dernière ligne
Testons cela avec un petit exercice :
Nettoyer les données
A ce stade, nous ne sommes pas encore prêts à analyser les données. Il est d’abord primordiale de faire place NETT, c’est-à-dire :
- Nommer ou renommer les colonnes si nécessaire après s’être assuré de comprendre leur contenu
- Eliminer les colonnes et lignes inutiles (vides, doublons notamment)
- Typer les données, c’est-à-dire leur donner un format (date, €, heure, nombre…) et harmoniser les informations qui peuvent l’être (cf. schéma ci-dessous)
- Traiter les cellules en erreur (vides, NaN [= not a number] ou autres erreurs de format de valeur…) : parfois il est judicieux de laisser vides les cellules vides, parfois il est préférable de les compléter avec une valeur. C’est à vous de voir en fonction du sens de vos données mais quoiqu’il en soit posez-vous la question de la signification des cellules vides / en erreur !
Traitez / Enrichissez vos données
Vous disposez maintenant de données propres et structurées. Cette structuration vous permet désormais d’élargir le champ des possibles en vue de vos analyses : croiser des informations (avec de l’open data ou d’autres données de votre entreprise), enrichir les données (géolocalisation par exemple) est beaucoup plus simple dans ces conditions. Quelques fondamentaux à connaître dans Excel pour l’enrichissement de vos bases :
A cette étape, si vous cherchez des données externes pour décupler la valeur de votre base, je vous conseille la lecture de cet article.
Analyser les données
90% du job est fait : il reste maintenant à fouiller, calculer, extraire une matière intelligible et mettre en forme cette matière. Deux conseils ici :
- Faites tous vos calculs en dehors de votre base (ouvrez un onglet calcul)
- N’hésitez pas à lire cet article pour en apprendre plus sur les enjeux autour de la datavisualisation, ou celui-ci pour connaître d’autres bonnes pratiques dans l’utilisation d’Excel