Définition d’un data lake et usages possibles pour les professionnels du chiffre
La terminologie de data lake est apparue avec celle du Big Data. Ce système de stockage de données en quantité importante se distingue du classique entrepôt de données ou data warehouse. C’est une source aujourd'hui essentielle pour les métiers de la comptabilité et de la gestion. Acteur du processus, Finthesis vous explique dans cet article la définition du data lake, ses atouts et les utilisations pratiques envisageables pour les missions financières. Vous découvrirez aussi comment notre plateforme cloud apporte une solution simple à ses utilisateurs afin de stocker des données structurées d’entreprise et de créer leur propre data warehouse.
1 - Quelle est la définition d’un data lake ou lac de données ?
Le data lake se distingue de la simple base de données ainsi que de l’entrepôt de données. Cette notion correspond à un mode de stockage bien spécifique de grandes quantités d’informations.
1.1 - Signification du data lake
Le Big Data correspond à des données massives ou des mégadonnées. Ce type d’information exige des modes de traitement et des capacités de stockage spécifiques. Avec l’explosion de la quantité de données, notamment numériques, le data lake ou lac de données en français vient répondre à ce besoin de stockage de mégadonnées.
Les systèmes de data lake sont assez récents. Alors que le Big Data apparaît à la fin du siècle dernier, le data lake date seulement de 2010. Wikipédia explique pourquoi le terme “lac” a été retenu. “Différentes sources peuvent l'alimenter de manière naturelle et brute, et les utilisateurs peuvent y plonger pour l'explorer et en rapporter des échantillons à examiner”.
Ces lacs peuvent entreposer des données non structurées, souvent conservées sous une forme brute, sans hiérarchisation, traitement ou analyse. Ce mode de stockage à plat rend le système très souple.
1.2 - Caractéristique des données hébergées dans un lac
Le fait que le data lake peut accepter de multiples sources de données structurées ou non, de formats différents, etc. exige toutefois de l’organisation. Le risque sinon serait de rendre l'utilisation de ce lac de données cauchemardesque. Clairement, pour les cabinets d’expertise-comptable, alimenter ce type d’entrepôt XXL avec les FEC des entreprises permet d’en limiter la complexité.
2 - Quels sont les avantages des data lakes pour les experts-comptables?
Avec les
data lakes, les financiers accèdent à plus d’informations que celles comprises dans la seule comptabilité de chaque client. C’est une excellente solution pour enrichir l’accompagnement de chaque entreprise et pour améliorer sa connaissance d’un secteur d’activité. Ils progressent ainsi dans la valorisation et
l’exploitation des données.
2.1 - Améliorer sa connaissance du marché
En accédant à des données plus massives que celles d’une seule entreprise, un cabinet d’expertise comptable acquiert une vision plus globale du marché sur lequel il intervient. C’est une manière de mieux explorer les informations relatives à un secteur d’activité par exemple.
L’open data signifie la faculté d’accéder et d’utiliser librement des données numériques privées ou publiques. Ainsi, Pappers constitue un exemple de plateforme open data très utile pour la profession comptable.
2.2 - Disposer de données pour du benchmarking
L’expert-comptable peut affiner ses conseils aux clients grâce à l’accès à des informations similaires à celles des entreprises qu’il accompagne. Il peut alors réaliser des études comparatives. Il peut aider les entrepreneurs dans leurs décisions stratégiques et opérationnelles, afin de maximiser la performance, par rapport aux moyennes de leur secteur d’activité.
2.3 - Enrichissement des analyses financières et des tableaux de bord
Le tableau de bord comptable de l’entreprise reste souvent centré sur les données brutes internes issues de la comptabilité. S’y ajoutent parfois les objectifs définis dans le prévisionnel d’exploitation. Les cabinets comptables qui exploitent les
data lakes peuvent enrichir les reportings. Par exemple, ils font figurer des
moyennes sectorielles à côté des KPI du client. En adoptant ce type de présentation des comptes, ils se démarquent de la concurrence.
2.4 - Accéder à des informations rapidement pour la valorisation d’une entreprise
Avec autant d’informations stockées dans les
data lakes, les experts-comptables qui exploitent ces données sont en position de force pour
évaluer une entreprise. Cet exercice exige d’appliquer diverses méthodes en fonction des cas. Avec la technologie de l'
open data, ils accèdent à des données comparables, par exemple les
prix de vente de fonds de commerce.
Les cabinets d’expertise-comptable sont au cœur de l’information financière. Avec diverses technologies et applications, ils manipulent de grandes quantités d’informations, factures, flux financiers, données sociales, etc. Ils les traitent d’abord pour la production comptable, notamment grâce à l’automatisation des écritures que permet le machine learning.
3.1 - Le data lake de chaque cabinet constitué avec les FEC de ses clients
Le schéma actuel de traitement comptable qui prévaut part de la pré-comptabilité, grâce à des outils hébergés souvent sur le cloud. Il permet d'obtenir en bout de chaîne, en comptabilité, le
fichier des écritures comptables ou FEC. Les écritures comprises dans ces fichiers FEC constituent une mine d’or à exploiter et à analyser pour les missions de conseil.
L’ensemble des FEC auxquels accède un expert-comptable enrichit l’analyse de chaque dossier client. Par définition, le
data lake est donc à leur portée. Il leur faut toutefois savoir collecter toutes ces informations pour ensuite y piocher les données intéressantes selon les besoins. En adoptant la
plateforme de Business Intelligence Finthesis, les experts-comptables
utilisent ainsi leur propre data lake. Ils peuvent explorer les données de tous les FEC de leur portefeuille. Il leur suffit de
connecter par API leur outil comptable à Finthesis. Non seulement le cabinet automatise la création et l’actualisation des reportings de chaque entreprise, mais il peut catégoriser les clients dans des projets. Ainsi, il est en capacité de comparer plusieurs entreprises d’une même activité.
3.2 - Un data lake enrichi par de l’open data grâce à la connexion par API avec Pappers
En outre, avec les outils que propose la plateforme hébergée sur le cloud de Finthesis, les financiers peuvent enrichir davantage leur data lake. Nous offrons en effet une connexion à Pappers par API. C’est l’occasion d’identifier de nombreuses entreprises aux données similaires ou intéressantes pour de la comparaison avec les clients du cabinet. Cette manière simple de stocker sur le cloud des données externes à leur portefeuille met à la portée des cabinets la puissance des data lakes du type open data. Un clic suffit pour extraire les informations utiles de ce data warehouse géant que constitue Pappers.
Notre outil BI pour la finance vous donne de multiples possibilités d’accompagnement des entreprises.
Gestion de trésorerie, exploitation régulière de la
comptabilité en temps réel,
prévisions budgétaires, voilà quelques utilisations pratiques qu’offre Finthesis. Si vous pensez aux
données des data lakes, voici deux types d’analyse que notre solution de Business Intelligence vous propose de mener en ligne.
4.1 - Les analyses sectorielles
Nous avons conçu le module de
comparatif sectoriel pour vous faciliter la vie. La réalisation d’une étude sectorielle peut constituer un nouveau type de missions pour votre cabinet. Le fait de disposer des bons outils sur le
cloud pour effectuer ces
analyses sectorielles vous aide à proposer ce service au client. Avec une telle solution web, vous accédez en quelques clics aux
données d’un secteur d’activité, soit dans le
data lake de votre cabinet, soit dans celui de Pappers. Vous avez la faculté d’industrialiser les demandes clients et même de suggérer le service de façon proactive.
Your text here
4.2 - La fonctionnalité de scoring et la notion de moyenne selon le secteur d’activité
Tout récemment, nous avons ajouté un
module de scoring à notre solution de Business Intelligence orientée finance. Ce système permet d’obtenir à partir des données comptables d’une entreprise le
calcul automatisé d'indicateurs de performance. Ce scoring financier s’accompagne d’une analyse générée par la technologie de l’intelligence artificielle. Le commentaire rédactionnel précise les indicateurs satisfaisants et ceux à surveiller.
Le scoring compare les données moyennes obtenues pour chaque indicateur à une valeur maximum et une valeur minimum. Ces deux bornes font l’objet d’une saisie par l’utilisateur, KPI par KPI. Nous vous suggérons ainsi d’exploiter la puissance du
data lake pour
identifier les entreprises comparables à votre client et déterminer ces ratios à utiliser pour le scoring.
La data rend possibles l’analyse financière ou prédictive, le scoring, l’évaluation d’entreprise, etc. La difficulté est de parvenir à y accéder simplement. Équipez-vous d’un outil polyvalent comme Finthesis et
constituez votre propre data lake avec votre portefeuille de clients. Associez aussi l’
open data avec Pappers et vous disposez d’une architecture de données structurées, facile à manipuler. Pour mieux percevoir toutes les missions que vous pouvez envisager avec notre solution BI et un
warehouse personnalisé,
contactez nos experts.