Data Architecture

Quatrième étape de notre parcours sur les bonnes pratiques de Data Management, le domaine « Data Architecture » vient poser les fondations de la gestion des données comme actif stratégique.

Dans le cadre du Data Management, le domaine « Data Architecture » regroupe l’ensemble des disciplines qui vont permettre de mieux partager l’organisation des données et leur sémantique au sein de l’organisation.

Définition

Le domaine « Data Architecture » a pour vocation de gérer les modèles sémantiques (glossaire, catalogue…), les métadonnées, ainsi que les problématiques d’intégration dans le système d’information. Ce domaine cherche donc à optimiser la façon dont sont distribuées et les données dans le SI pour répondre tant aux besoins actuels que futurs.

Le domaine « Data Architecture » regroupe ainsi 3 disciplines :

  • Business Glossary
  • Metadata Management
  • Data Integration

En l’absence d’un investissement suffisant dans ce domaine, l’organisation est vouée à gérer tout une variété de problèmes liés à une mauvaise compréhension et à une utilisation inappropriée des données. Face aux difficultés croissantes d’intégration de données et à l’explosion des volumes, elle sera condamnée à réagir (plutôt qu’anticiper) et devra également assumer les impacts financiers de son manque de rigueur dans la gestion de l’architecture des données.

Disciplines

Business Glossary

L’intention de la discipline « Business Glossary » est de fournir un référentiel partagé de termes et de définitions aux différentes parties prenantes. Ce référentiel doit couvrir aussi bien les données structurées que les données non-structurées.

Le glossaire métier est un élément essentiel à une bonne compréhension et une bonne intégration des données au travers de l’organisation. Il assure que la signification des termes sont consistent pour l’ensemble des acteurs

Bénéfices La mise en place d’un glossaire partagé va avoir de nombreux bénéfices pour l’organisation, tels que :

  • Eviter les ambiguïtés sur la terminologie et partager une compréhension commune entre les parties prenantes
  • Simplifier l’intégration des données
  • Améliorer la qualité des données

Livrables Les principaux livrables de cette discipline sont :

  • Glossaire des termes métier
  • Catalogue de métadonnées pour la gestion des termes métier
  • Principes et processus pour la gestion du glossaire
  • Principes et processus pour la mise en conformité avec le glossaire
  • Exigences quant à l’utilisation du glossaire
  • Indicateurs de conformité avec le glossaire
  • Historique de révision des termes du glossaire

Pour la gestion du glossaire, l’organisation peut faire appel à des outils spécifiques tels que Collibra Data Governance Center, Dataedo, Informatica Enterprise Data Catalog, Atlas de la fondation Apache, Oracle Enterprise Metadata Management…

Metadata Management

Metadata ManagementAvant de décrire cette discipline, alignons-nous d’abord sur le terme de métadonnée. Nous retiendrons pour cela la définition du Data Management Maturity Model : « Une métadonnée est une information qui identifie, décrit, explique le contenu, le contexte, la structure et la classification d’une information. Les métadonnées permettent de simplifier l’accès, l’usage et la gestion des données ».

La discipline de « Metadata Management » vise donc à établir les processus et l’infrastructure pour définir, fournir et gérer la connaissance à propos des données (structurées et non structurées).

Il est d’usage de distinguer 3 catégories de métadonnées :

  • Les métadonnées métier visent à comprendre, recherche et contrôler le contenu de l’information (exemples : termes, définition, auteurs, mots-clés, domaine, règles de qualité…). Ce sont ces métadonnées qui seront exploitées dans le cadre d’une taxonomie, d’une ontologie ou d’un glossaire.
  • Les métadonnées techniques visent à donner des informations sur la couche physique des données et leurs transformations (exemple : table, champ, type de données, liens, index…).
  • Les métadonnées opérationnelles fournissent des informations pour gérer les données en tant que telles. Elles donnent en particulier des informations sur la gestion des données. Exemples : date de création, but, information pour l’archivage, organe de gouvernance, informations relatives à la qualité, règles de production et de maintenance…

Bénéfices Les principaux bénéfices de cette discipline sont :

  • Renforcer le partage de données
  • Assurer la conformité des données
  • Améliorer la réactivité aux changement demandés par les métiers
  • Réduire les risques liés aux données

Livrables Les principaux livrables de cette discipline sont :

  • Principes, stratégie, processus, standards de gestion des métadonnées
  • Méta-modèle des métadonnées
  • Référentiel de métadonnées
  • Résultats d’audit des métadonnées
  • Historique de révision des métadonnées
  • Rôles et responsabilités sur les métadonnées
  • Indicateurs sur les métadonnées (adoption, conformité…)

Pour l’outillage, on retrouvera des outils identiques à ceux utilisés pour la gestion des glossaires.

Data Integration

Data IntegrationL’intention première de la discipline « Data Integration » est de réduire le nombre de sources de données pour les besoins des processus métiers. Il s’agit également d’améliorer la disponibilité des données pour les processus métiers qui nécessitent des informations consolidées.

Il s’agit donc pour l’organisation de mettre en place les processus (en conformité avec la gouvernance), l’architecture (en conformité avec les standards d’architecture) et les outils pour :

  1. Répondre aux besoins des processus métier en matière de consolidation des données
  2. Répondre aux exigences en matière de qualité des données.

 

Bénéfices Les bénéfices de la discipline « Data Integration » sont :

  • Optimisation des sources de données
  • Economies liées à la centralisation de certaines informations
  • Economies liées l’amélioration de la qualité des données

Livrables Les principaux livrables de cette discipline sont :

  • Principes et standards en matière d’intégration des données (interfaces, méthodes, bonnes pratiques)
  • Plan d’intégration des données
  • Scripts d’intégration des données
  • Plan de vérification/validation + résultat de tests
  • Environnement de test d’intégration
  • Application Programming Interfaces (APIs)
  • Métriques pour piloter la performance et la qualité de l’intégration
  • SLAs sur la mise à disposition de données
  • Rapports d’analyse causale sur les défauts d’intégration

En termes d’outillage, c’est dans le cadre de cette discipline que l’on retrouvera des outils comme les ETL (Extract Transform and Load), les outils de test des données, des mécanismes d’intégration continue portant sur les données (DataOps)

Maturité

Pour terminer notre propos, voici quelques éléments pour comprendre le profil type d’une organisation sur chacun des niveaux de maturité.

  • Au niveau 1, les glossaires sont définis localement. Les métadonnées sont disséminées au sein de l’organisation. L’intégration de données est effective entre les systèmes.
  • Au niveau 2, un glossaire transversal est établi et est utilisé sur les projets. Des processus sont en place pour gérer le glossaire et les métadonnées. Les métadonnées sont utilisées pour conduire des analyses d’impact en cas de changement sur les données. Un environnement et des outils d’intégration des données sont en place. L’intégration des données est testée.
  • Au niveau 3, une gouvernance est place pour gérer le glossaire et les métadonnées. La conformité et l’usage du glossaire et des métadonnées est suivie à l’aide de métriques. Des standards pour l’intégration des données sont définis et appliqués. Ils sont alignés avec les standards d’architecture de l’organisation. Les erreurs (et les métriques associés) d’intégration des données sont capturées.
  • Au niveau 4, les décisions de changement au glossaire, aux métadonnées et à l’intégration des données s’appuie sur des métriques et des données historiques. Les définitions du glossaire sont alignées sur les standards de l’industrie. Les données hautement partagées sont centralisées, intégrées et disponibles selon les besoins métier.
  • Au niveau 5, un processus est en place pour gérer l’amélioration continue des activités liées au glossaire, aux métadonnées et à l’intégration des données.

Pour aller plus loin

Redsen Consulting aide les organisations à évaluer leur niveau de maturité dans le domaine du Data Management ! Remplissez le formulaire en ligne Audit Quick Start Data Management et bénéficiez d’un diagnostic gratuit réalisé par nos experts.

Audit Quick Start Data Management

 

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Voir plus
scroll to top