Qu’est-ce que le « Master Data Management » ?
Le volume des données ne cesse de croitre dans les entreprises et leur bonne gestion constitue une problématique importante. En effet, chaque domaine métier (marketing, vente, gestion des ressources humaines, comptabilité, production…) produit un grand nombre de données qui sont réparties dans différents silos d’applications. Face à cela, il est important de mettre en place un système efficace de gestion des données, ce qui n’est pas toujours simple.
Dans cette vision traditionnelle, il est souvent bien difficile de déterminer quelle application constitue la référence pour telle ou telle donnée métier. De la même manière, les problèmes d’incohérences entre applications, voire dans la même application, sont souvent difficiles à maitriser.
Parmi l’ensemble des données, certaines sont plus critiques pour l’activité de l’entreprise et sont partagées entre plusieurs métiers : les Master Data (données de référence).
Les Master Data habituelles peuvent être :
- Physiques : produits, matériels, actifs, clients, emplacements…
- Virtuelles : centres de coûts, bâtiments dont la construction est prévue…
La figure ci-dessous montre un exemple d’une mauvaise gestion des Master Data :
Le Master Data Management est le moyen le plus efficace d’intégrer et de gérer les données partagées et d’éliminer les redondances.
Il vise à mettre l’information au service du client pour répondre aux besoins du moment et pour s’adapter aux besoins futurs. Son approche évolutive nécessite une forte application des domaines métiers.
Dans cet article, nous allons nous intéresser plus particulièrement à l’outil Talend MDM.
Présentation du MDM de Talend
La solution MDM de Talend possède toutes les fonctionnalités de base du Master Data Management : modélisation avancée, interface Web dynamique, déclenchement d’événement, sécurité basée sur les rôles. Son implémentation est relativement rapide et elle s’adapte facilement aux données de l’entreprise.
Le MDM de Talend permet de regrouper toutes les Master Data dans un hub central. Ce référentiel standardisé fournit, via l’utilisation de modèles de données, les prérequis en fonction de la manière dont les données sont mises à jour. De plus, cette solution offre la possibilité d’enrichir continuellement ses données avec des sources externes (notamment en temps réel). Les données sont uniformisées, tracées selon des règles prédéfinies.
Pour utiliser Talend MDM, vous devez suivre les étapes suivantes :
- Développer un modèle de données contenant une ou plusieurs entités métier (client, article, …), qui sera utilisé par tout le système d’information de l’entreprise.
- Créer des flux appelés « Jobs » effectuant des transformations et/ou des fusions de données. Ces flux représentent une séquence de connecteurs et de composants, permettant de charger les données dans le serveur MDM et les valider selon les modèles de données prédéfinis.
- Créer des déclencheurs qui permettent d’exécuter les jobs en se basant sur les événements qui se produisent dans le serveur MDM. Par exemple, lorsqu’un utilisateur met à jour les données depuis le serveur MDM (ajout ou modification d’un client par exemple), un événement sera créé, ce qui déclenchera un job spécifique d’alimentation d’une application dans Talend Studio.
Architecture fonctionnelle du MDM de Talend
Le graphique suivant illustre les blocs fonctionnels de l’architecture de Talend MDM.
Le bloc Clients comprend :
- Talend Studio, pour réaliser les développements, pour créer les modèles de données ainsi que les flux de transformation et leur processus d’exécution.
- le navigateur Web, pour se connecter au serveur MDM où vous pouvez rechercher, afficher et éditer les Master Data à l’aide de tâches définies par le Studio.
Le bloc Server comprend un serveur MDM, dans lequel les Master Data sont gérées.
Le bloc Database comprend la base de données MDM, dans laquelle les Master data sont stockées.
Prérequis à l'utilisation de Talend Open Studio for MDM
Vous trouverez ci-dessous les prérequis matériels et recommandations de l’éditeur relatives aux ressources permettant de réaliser l’installation de Talend MDM :
Outils de Talend MDM
La solution Talend MDM présente un ensemble complet d’outils et de fonctions qui sont accessibles à partir du studio Talend et de l’interface Web.
Dans le Studio Talend vous trouvez :
- La perspective Integration dédiée aux développements (modélisation des flux de transformations et de leurs processus d’exécution) offre un large choix de connecteurs et de composants mis à la disposition de l’utilisateur.
Dans cette perspective, les utilisateurs peuvent créer différents Jobs afin de valider, corriger ou exporter les données sur le hub MDM.
- La perspective Profiling permet d’examiner et analyser les données avant de les charger dans le hub MDM.
- La perspective MDM pour la gestion des Master Data permet de construire les modèles des données qui seront propagées vers les systèmes source et cible.
Dans le Serveur Talend MDM vous trouvez :
- Talend MDM Web User Interface: c’est une application Web permettant de créer, modifier, interroger ou extraire les Master Data stockées dans le référentiel.
Fonctionnalités de Talend MDM
Les modèles de données sont les composants centraux de la solution de MDM de Talend. Ils contiennent une ou plusieurs entités métier. Une entité métier peut être un fournisseur, un pays, un client…
Chaque entité est définie par ses attributs (dimensions) qui correspondent aux caractéristiques de celle-ci. Par exemple, pour l’entité Client, les attributs peuvent être le nom, l’adresse, numéro de téléphone…
La gestion des événements constitue une partie importante de la gestion des Master Data.
Lorsqu’un utilisateur métier crée ou modifie un enregistrement de données depuis Talend MDM Web User Interface, un événement sera créé, il peut être consulté à partir du studio Talend.
Lorsqu’un événement se produit, vous pouvez utiliser des déclencheurs pour exécuter un processus. Ces processus peuvent être des processus d’intégration, de validation ou d’enrichissement des données.
Du côté des fonctionnalités du Job Designer, une large bibliothèque de connecteurs est disponible pour se connecter aux principaux SGBD et pour traiter tous les types de fichiers plats, aussi bien en lecture qu’en écriture.
Ci-dessous quelques exemples de connecteurs :
Traitement des données
- Fonctions de Transformations : tri, filtre, dédoublonnage, reformatage des données, distribution…
- Transformations manuelles : traitements par un langage de programmation.
Caractéristiques spécifiques
Conception visuelle de jobs, statistique d’exécution en temps réel, traçage des données, fonctionnalités de débogage.
Composant Talend MDM
Dans la perspective d’intégration, les utilisateurs peuvent créer différents Jobs afin de valider, corriger, ou exporter les données sur le hub MDM. Ces jobs sont construits à partir de connecteurs et de composants, on peut modifier leurs propriétés pour définir leur comportement.
Exemple de Job permettant d’exporter les données sur le serveur MDM après modification :
Le job doit être déployé sur le serveur pour pouvoir exporter les données.
CONCLUSION DE L’EXPERT
A travers un ensemble d’outils, Talend MDM permet de lier toutes les données critiques de l’entreprise en un hub central fournissant un point d’intérêt commun. Il n’existe donc qu’une seule version de la donnée, celle présente dans le HUB.
Cet outil permet d’obtenir une cohérence et une agilité avec les Master Data.
Reste à savoir que le Master Data Management requiert une forte implication des utilisateurs métier, afin de mettre en place un modèle des données qui sera utilisé par tout le système d’information de l’entreprise. Les données importées dans le MDM doivent être validées par les utilisateurs métiers. En effet, ils doivent contrôler la cohérence et la qualité de leurs données.
Il existe aussi une version Entreprise de Talend MDM qui propose de nombreuses fonctionnalités complémentaires par rapport à la version Open source : des Outils de conception et de modélisation supplémentaires, fonctions de gestion et de monitoring, des fonctions de qualité des données et de gouvernance.