Talend : Master Data Management

Qu’est-ce que le « Master Data Management » ?

Le volume des données ne cesse de croitre dans les entreprises et leur bonne gestion constitue une problématique importante. En effet, chaque domaine métier (marketing, vente, gestion des ressources humaines, comptabilité, production…) produit un grand nombre de données qui sont réparties dans différents silos d’applications. Face à cela, il est important de mettre en place un système efficace de gestion des données, ce qui n’est pas toujours simple.

Dans cette vision traditionnelle, il est souvent bien difficile de déterminer quelle application constitue la référence pour telle ou telle donnée métier. De la même manière, les problèmes d’incohérences entre applications, voire dans la même application, sont souvent difficiles à maitriser.

Parmi l’ensemble des données, certaines sont plus critiques pour l’activité de l’entreprise et sont partagées entre plusieurs métiers : les Master Data (données de référence).

Les Master Data habituelles peuvent être :

  • Physiques : produits, matériels, actifs, clients, emplacements…
  • Virtuelles : centres de coûts, bâtiments dont la construction est prévue…

La figure ci-dessous montre un exemple d’une mauvaise gestion des Master Data :

Master Data Management

Le Master Data Management est le moyen le plus efficace d’intégrer et de gérer les données partagées et d’éliminer les redondances.

Il vise à mettre l’information au service du client pour répondre aux besoins du moment et pour s’adapter aux besoins futurs. Son approche évolutive nécessite une forte application des domaines métiers.

Dans cet article, nous allons nous intéresser plus particulièrement à l’outil Talend MDM.

Présentation du MDM de Talend

La solution MDM de Talend possède toutes les fonctionnalités de base du Master Data Management : modélisation avancée, interface Web dynamique, déclenchement d’événement, sécurité basée sur les rôles. Son implémentation est relativement rapide et elle s’adapte facilement aux données de l’entreprise.

Le MDM de Talend permet de regrouper toutes les Master Data dans un hub central. Ce référentiel standardisé fournit, via l’utilisation de modèles de données, les prérequis en fonction de la manière dont les données sont mises à jour. De plus, cette solution offre la possibilité d’enrichir continuellement ses données avec des sources externes (notamment en temps réel). Les données sont uniformisées, tracées selon des règles prédéfinies.

Pour utiliser Talend MDM, vous devez suivre les étapes suivantes :

  • Développer un modèle de données contenant une ou plusieurs entités métier (client, article, …), qui sera utilisé par tout le système d’information de l’entreprise.
  • Créer des flux appelés « Jobs » effectuant des transformations et/ou des fusions de données. Ces flux représentent une séquence de connecteurs et de composants, permettant de charger les données dans le serveur MDM et les valider selon les modèles de données prédéfinis.
  • Créer des déclencheurs qui permettent d’exécuter les jobs en se basant sur les événements qui se produisent dans le serveur MDM. Par exemple, lorsqu’un utilisateur met à jour les données depuis le serveur MDM (ajout ou modification d’un client par exemple), un événement sera créé, ce qui déclenchera un job spécifique d’alimentation d’une application dans Talend Studio.

Architecture fonctionnelle du MDM de Talend

Le graphique suivant illustre les blocs fonctionnels de l’architecture de Talend MDM.

Architecture fonctionnelle Talend MDM

Le bloc Clients comprend :

  • Talend Studio, pour réaliser les développements, pour créer les modèles de données ainsi que les flux de transformation et leur processus d’exécution.
  • le navigateur Web, pour se connecter au serveur MDM où vous pouvez rechercher, afficher et éditer les Master Data à l’aide de tâches définies par le Studio.

Le bloc Server comprend un serveur MDM, dans lequel les Master Data sont gérées.

Le bloc Database comprend la base de données MDM, dans laquelle les Master data sont stockées.

Prérequis à l’utilisation de Talend Open Studio for MDM

Vous trouverez ci-dessous les prérequis matériels et recommandations de l’éditeur relatives aux ressources permettant de réaliser l’installation de Talend MDM :

Pré-requis Talend MDM

Outils de Talend MDM

La solution Talend MDM présente un ensemble complet d’outils et de fonctions qui sont accessibles à partir du studio Talend et de l’interface Web.

Dans le Studio Talend vous trouvez :

  • La perspective Integration dédiée aux développements (modélisation des flux de transformations et de leurs processus d’exécution) offre un large choix de connecteurs et de composants mis à la disposition de l’utilisateur.

Dans cette perspective, les utilisateurs peuvent créer différents Jobs afin de valider, corriger ou exporter les données sur le hub MDM.

  • La perspective Profiling permet d’examiner et analyser les données avant de les charger dans le hub MDM.
  • La perspective MDM pour la gestion des Master Data permet de construire les modèles des données qui seront propagées vers les systèmes source et cible.

Dans le Serveur Talend MDM vous trouvez :

  • Talend MDM Web User Interface: c’est une application Web permettant de créer, modifier, interroger ou extraire les Master Data stockées dans le référentiel.

Fonctionnalités de Talend MDM

Les modèles de données sont les composants centraux de la solution de MDM de Talend. Ils contiennent une ou plusieurs entités métier. Une entité métier peut être un fournisseur, un pays, un client…

Chaque entité est définie par ses attributs (dimensions) qui correspondent aux caractéristiques de celle-ci. Par exemple, pour l’entité Client, les attributs peuvent être le nom, l’adresse, numéro de téléphone…

Modèles de données Talend MDM

La gestion des événements constitue une partie importante de la gestion des Master Data.

Lorsqu’un utilisateur métier crée ou modifie un enregistrement de données depuis Talend MDM Web User Interface, un événement sera créé, il peut être consulté à partir du studio Talend.

Gestion des évènements Talend MDM

Lorsqu’un événement se produit, vous pouvez utiliser des déclencheurs pour exécuter un processus. Ces processus peuvent être des processus d’intégration, de validation ou d’enrichissement des données.

Du côté des fonctionnalités du Job Designer, une large bibliothèque de connecteurs est disponible pour se connecter aux principaux SGBD et pour traiter tous les types de fichiers plats, aussi bien en lecture qu’en écriture.

Ci-dessous quelques exemples de connecteurs :

Connecteurs Talend MDM

Traitement des données

  • Fonctions de Transformations : tri, filtre, dédoublonnage, reformatage des données, distribution…
  • Transformations manuelles : traitements par un langage de programmation.

Caractéristiques spécifiques

Conception visuelle de jobs, statistique d’exécution en temps réel, traçage des données, fonctionnalités de débogage.

Mise en relation pour un projet Talend

Composant Talend MDM

Dans la perspective d’intégration, les utilisateurs peuvent créer différents Jobs afin de valider, corriger, ou exporter les données sur le hub MDM. Ces jobs sont construits à partir de  connecteurs et de composants, on peut modifier leurs propriétés pour définir leur comportement.

Composants Talend MDM

Exemple de Job permettant d’exporter les données sur le serveur MDM après modification :

Job Talend MDM

Le job doit être déployé sur le serveur pour pouvoir exporter les données.

Interface Talend MDM

CONCLUSION DE L’EXPERT

A travers un ensemble d’outils, Talend MDM permet de lier toutes les données critiques de l’entreprise en un hub central fournissant un point d’intérêt commun. Il n’existe donc qu’une seule version de la donnée, celle présente dans le HUB.

Cet outil permet d’obtenir une cohérence et une agilité avec les Master Data.

Reste à savoir que le Master Data Management requiert une forte implication des utilisateurs métier, afin de mettre en place un modèle des données qui sera utilisé par tout le système d’information de l’entreprise. Les données importées dans le MDM doivent être validées par les utilisateurs métiers. En effet, ils doivent contrôler la cohérence et la qualité de leurs données.

Il existe aussi une version Entreprise de Talend MDM qui propose de nombreuses fonctionnalités complémentaires par rapport à la version Open source : des Outils de conception et de modélisation supplémentaires, fonctions de gestion et de monitoring, des fonctions de qualité des données et de gouvernance.



Laisser un commentaire

Enter your text here...




close

Découvrez les capacités de SAP Analytics Cloud 

Découvrez le 25 juillet de 11h à 12h un webinar sur les capacités de reporting, d'analyse, de planning et de prédiction de SAP Analytics Cloud