Les limites d’Excel à l’orée du Big data
4 mars 2022 – Temps de lecture : 3 minutes
Une transition s’opère aujourd’hui avec de nombreuses plateformes qui fleurissent et qui viennent remplacer Excel dans divers domaines. Cette mutation s’explique par plusieurs facteurs qui sont en lien avec la rapidité d’exécution, l’efficacité opérationnelle et la fiabilité des données.
Excel a été pendant de longues années la solution préférentielle pour organiser efficacement de grands volumes de données et en produire des analyses. Mais les ordres de grandeurs ont changé. La croissance exponentielle des données produites (et donc des données à analyser) met en évidence les limites de cette solution.
Tout d’abord, Excel se heurte à une limite physique puisque le nombre maximum de lignes qui peuvent être importées dans un classeur (hors recours à des modules complémentaires) s’élève à 1 048 576. Mais même dans le cadre de cette limite, l’import de fichiers très volumineux peut provoquer des ralentissements ou des bugs. Nous avons tous connu l’écran figé qui vient anéantir plusieurs heures de travail.
Enfin, si Excel permet de réaliser un grand nombre de manipulations sur la donnée, ces manipulations peuvent engendrer des erreurs. Par conséquent, un plus grand nombre de données traitées augmentera ces manipulations et donc le risque d’erreur associé. Plusieurs études révèlent d’ailleurs que la grande majorité des fichiers Excel en entreprise contiennent des erreurs (c’est le cas notamment de l’
European Spreadsheet Risk Interest Group qui met en avant ce phénomène).
Traçabilité des opérations
Un fichier Excel comporte souvent plusieurs onglets et un grand nombre de formules. Or l’augmentation du nombre d’onglets et de formules peut nuire sérieusement à la compréhension de la structure globale du fichier et de sa construction.
De la même manière, un tableur Excel n’intègre pas une chronologie ou un suivi des opérations réalisées. Dès lors, certaines cellules d’un fichier peuvent potentiellement être modifiées (et donc altérées) par un utilisateur sans que cela puisse être repéré par un tiers. Il devient alors extrêmement compliqué de s’assurer de la fiabilité des informations et d’identifier quelles données ont été modifiées par rapport à la version originale.
Multiplication des fichiers
Comme nous l’avons vu, les onglets peuvent se multiplier au sein d’un fichier, mais les fichiers eux-mêmes peuvent rapidement devenir nombreux. Que ce soit pour créer des versions à différentes dates ou horaires, lorsqu’un fichier devient trop lourd ou lorsque des contributeurs différents veulent se partager la gestion d’un fichier.
Ces différentes versions ajoutent de la complexité dans le suivi des modifications et peuvent favoriser l’occurrence d’erreurs. Là encore, nous avons tous dû recommencer des travaux en nous rendant compte que nous étions repartis de la mauvaise version d’un fichier.
Une autre manifestation de cette limite est le fameux « lien externe ». En effet, l’existence de plusieurs fichiers et de la volonté de les lier entre eux va donner lieu à des liens externes qui pourront facilement être rompus. Cela aura de nouveau pour effet d’altérer la traçabilité des opérations.
Collaboration
Les « Excel Sheets » sur la suite Google ont en partie résolu ce problème, mais la collaboration sur la version bureautique d’Excel peut vite devenir une épreuve.
Un phénomène connexe à l’accroissement du volume de données est l’augmentation du nombre de contributeurs à l’analyse de ces données. Par conséquent, les solutions de traitement des données doivent aujourd’hui faire en sorte de faciliter les interactions entre ces différents contributeurs. Le fait de passer par une plateforme web pour collaborer sur des mêmes informations offre des options de travail en collaboration qui peuvent être plus limitées sur Excel. (Sur ce sujet, voir notre article :
La Business Intelligence au service des communications financières)
Excel reste évidemment un outil de traitement de l’information extrêmement utile dans plusieurs cas de figure. Toutefois, les plateformes SaaS (Software as a Service) qui s’appuient sur des technologies Big Data, qui assurent un degré maximal de fiabilité des données et qui offrent des fonctionnalités de collaboration toujours plus performantes semblent aujourd’hui bien armées pour proposer une alternative crédible au tableur.