À l’ère du numérique, le big data règne en maître. Les entreprises collectent et analysent désormais d’énormes quantités de données afin de mieux piloter leurs performances et prendre de meilleures décisions. C’est cette tendance qui a conduit à l’émergence d’une approche dont vous avez certainement entendu parler : le Data Mesh. Ce nouveau type d’architecture de données promet de transformer la façon dont les entreprises gèrent leurs données. Une énième pseudo-révolution me direz-vous ? Oui…mais non. Nous allons ici explorer les grands principes du Data Mesh, les défis (notamment RH) auxquels il répond, ses principaux composants et l’état de sa mise en œuvre dans les entreprises. Let’s go…
Pour commencer : définition du Data Mesh
Littéralement, le Data Mesh est une nouvelle approche du traitement et de la culture des données qui vise à simplifier la manière dont les entreprises gèrent leurs données. Il s’appuie sur le concept de « Data as a product » (ou « données en tant que produit ») et vise à mettre davantage l’accent sur les données en tant qu’actif de l’entreprise. Elle repose sur l’idée que les données doivent être traitées comme n’importe quel autre produit, avec son propre cycle de vie, sa propre valeur et son propre modèle économique.
L’approche Data Mesh promeut le concept d’ « autonomie axée sur les données », selon lequel chaque équipe a la possibilité de décider comment gérer et utiliser ses données. Cela permet à chaque équipe de se concentrer sur ses besoins commerciaux spécifiques…tout en permettant la collaboration entre les équipes, et donc une meilleure expérience collaboateur (vous le voyez le lien RH ?).
Les données doivent être gérées dans un « maillage » (« Mesh » en anglais donc), où toutes les données et les composants connexes sont connectés et partagent le même contexte. Ce maillage est composé de différentes couches, toutes connectées entre elles, telles que l’infrastructure, le stockage des données, le traitement des données et la gouvernance des données.
Les défis auxquels répond le Data Mesh
Mais alors pourquoi le Data Mesh me direz-vous ? Eh bien l’émergence du Data Mesh répond à cette fameuse complexité croissante de la gestion des données à l’ère du numérique. Avec l’essor du big data, les entreprises collectent et analysent plus de données que jamais. Il en résulte un besoin accru de gestion efficace des données, et forcément une meilleure collaboration entre les équipes. Le Data Mesh permet en effet de répondre au défi des silos de données. Ces satanés silos créés lorsque différentes équipes collectent et stockent leurs données chacun de leur côté…
2e défi auquel répond le Data Mesh, et pas des moindres : la gouvernance des données. Comme les entreprises gèrent de plus en plus de données, il devient nécessaire de s’assurer que ces datas sont traitées de manière responsable et sécurisée. Le Data Mesh cherche fournit donc un système unifié pour la gouvernance des données, permettant un meilleur contrôle et une meilleure visibilité de la gestion des données.
Les principaux composants du Data Mesh selon Dan Garfield
Le fondateur de l’approche Data Mesh, Dan Garfield, a décrit les quatre composants principaux du Data Mesh :
- Le composant « infrastructure des données », responsable de la mise en place du maillage de données et de la connexion des différentes couches, il permet de mettre en place les systèmes de stockage et de traitement des données, ainsi que le système de gouvernance des données.
- Le composant « stockage des données », responsable de la gestion des données et donc de leur stockage. Cela inclut la mise en place de bases de données, d’entrepôts de données et d’autres systèmes de stockage.
- Le composant « traitement des données », responsable de la transformation et de l’analyse. Il s’agit ici de mettre en place des systèmes de traitement des données, tels que des algorithmes de Machine Learning ou de Dataviz, afin d’obtenir des informations à partir des données.
- Le composant « gouvernance des données » chargé de veiller à ce que les données soient traitées de manière sécurisée et responsable. Cela inclut la mise en place de politiques et de procédures.
L’état d’avancement de sa mise en place dans les entreprises
Alors, la révolution est-elle en marche ? L’approche Data Mesh n’en est encore qu’à ses balbutiements dans les entreprises. Si certains commencent à adhérer au concept d’autonomie axée sur les données, il reste encore beaucoup à faire pour que le maillage des données devienne une réalité, notamment en termes d’investissement dans les infrastructures, les systèmes de stockage et de traitement nécessaires, ainsi que dans le développement des politiques et des procédures de gouvernance des données.
Malgré tout, certaines entreprises ont déjà mis en œuvre l’approche Data Mesh et ont déjà pu en tirer des bénéfices. Par exemple, Netflix a constaté une augmentation significative de l’efficacité et de la collaboration entre les équipes.
Les avantages potentiels sont donc évidents. Et pour y voir plus clair, l’idéal est encore aujourd’hui de se faire accompagner, car les solutions d’éditeurs de logiciels autour de la donnée et de leur traitement, et qui peuvent participer à la mise en place de cette approche, sont très nombreuses. A vous de jouer 😉 !