5 étapes pour mettre sur pied votre stratégie de catalogage de données

Pramana
4 min readMar 2, 2019

--

Une méthodologie concrète pour faire émerger votre catalogue de données : de la définition des priorités à la constitution d’un premier « couple » glossaire-dictionnaire des données.

Catalogue des données, suite et fin ? Qui sait… Après la définition de ce qu’est un catalogue de données (et de l’intérêt d’en établir un) et un… catalogue d’erreurs fatales dans le cadre d’un tel projet, attaquons-nous maintenant à la bonne méthodologie et aux bonnes pratiques.

Notre objectif n’est pas de vous livrer une recette miracle applicable à la lettre (vous aurez compris que nous ne croyons pas tellement à ce genre d’approche…). Mais plutôt de vous indiquer une méthodologie vous permettant d’aborder la question de la mise en place et du déploiement d’un catalogue de données de manière organisée, en maîtrisant au maximum les risques, et en vous posant les bonnes questions.

Les 5 étapes du catalogage de données

Etape 1 : Recueil des usages et des besoins

Avant toute chose il est impératif d’identifier et lister les populations à adresser au sein de votre organisation et d’effectuer des ateliers avec ces différents acteurs pour identifier leurs usages des données au quotidien, ainsi que leurs besoins, que vous déduirez très souvent en partant de leurs points de douleurs.

Cette première étape peut également être une première opportunité pour commencer une phase d’acculturation sur la gestion des données et le catalogage des données au sein des différentes populations.

Étape 2 : prioriser les données à décrire

S’attaquer en bloc à l’ensemble de votre patrimoine de données n’est pas seulement vertigineux : c’est également assez irréaliste. Une approche beaucoup plus viable va donc consister :

  • À réaliser un premier découpage « à grosse maille » du patrimoine global de données pour définir des domaines de données,
  • Identifier les domaines (ayant une certaine homogénéité d’un point de vue fonctionnel/métier par exemple) de données prioritaires

Point d’attention : On observe souvent que les domaines de données prioritaires sont raccrochés à une stratégie, ou à des usages liés à des expérimentations. De ce fait, nous vous conseillons de partir des orientations stratégiques et des réalités des projets et expérimentations en cours afin d’en déduire vos domaines de données prioritaires

Pour ce genre d’initiative, une des clés du succès réside dans le fait de prouver la valeur rapidement, en démontrant l’apport sur un périmètre restreint. Pour cela, vous pouvez adopter une démarche opportuniste en vous appuyant sur un projet déjà identifié chez vous pour lequel l’activité de catalogage serait un accélérateur.

Étape 3 : réaliser un état des lieux par domaine de données

Dans un premier temps, il va s’agir d’évaluer le niveau de maturité du ou des domaines de données en question et des métadonnées déjà existantes au sein de chaque domaine. Comment, concrètement ?

  1. En menant d’abord une revue des métadonnées existantes et de leur niveau de qualité.
  2. Puis, en dressant un état des lieux des processus opérationnels (peuplement, mise à jour, partage) liées à ces données
  3. Enfin en listant les bonnes pratiques associées aux processus opérationnels

Dans un second temps, nous vous suggérons de recenser les points de douleurs rencontrés dans la gestion et l’utilisation des données.

Étape 4 : Créer un métamodèle sur mesure et réaliste

A ce stade, vous disposez alors de la matière pour construire un métamodèle cible pour votre catalogue. Le métamodèle correspond à la liste des métadonnées (ex : métadonnées de base, métadonnées liées à la qualité, métadonnées liées à la confidentialité…) et de leurs relations, que vous utiliserez pour recenser les données.

L’important ici va être d’adresser les usages et objectifs de vos populations cibles tout en limitant le métamodèle aux métadonnées essentielles, non ambiguës et qui seront à même d’être complétées avec fiabilité.

Etape 5 : définir une méthode de catalogage détaillée

Vous avez défini votre métamodèle ? Il ne vous reste plus qu’une étape avant de commencer à remplir votre beau catalogue. Et il s’agit tout simplement de vous poser la question de comment vous allez le faire…

Car sans un minimum de points de repères et de méthodologie vous risquez non seulement d’y laisser quelques cheveux, mais également de manquer de cohérence dans votre approche et par conséquent d’induire des oublis ou incohérences au sein du contenu de votre catalogue, ce qui serait dommageable.

La bonne pratique est alors d’insérer au maximum la pratique de catalogage dans les pratiques existantes, c’est-à-dire dans les processus métier tels qu’ils existent au sein de votre organisation. Toutefois, certaines étapes clés nécessaires au peuplement du catalogue de données devront être anticipées :

  1. Localiser les données
  2. Peupler le glossaire, puis le dictionnaire (ou l’inverse)
  3. Réconcilier les deux
  4. Consolider
  5. Évoluer

Cette dernière étape “Evoluer” permet de garantir la mise à jour, la pertinence et donc l’usage de votre catalogue. Elle est assurée par la définition et la mise en place d’une gouvernance régissant les processus opérationnels de mise à jour et d’évolution de votre catalogue de données. Généralement, cette gouvernance s’inscrit dans une démarche plus large de gouvernance des données à un niveau entreprise et s’insère donc dans les politiques, règles et le modèle de rôles (Data Owners, Data Stewards, …) qui auront été définis en amont.

Ne foncez pas tête baissée!

Cette démarche, que nous vous avons présentée, se nourrit d’un certain nombre de standards tels que le DMBOK de l’association DAMA dans lesquels vous trouverez les fondamentaux et les bonnes pratiques pour initier vos travaux. De plus, certaines initiatives ou outils sont certainement déjà existants au sein de votre organisation, Aussi, ne partez pas de la page blanche mais prenez le temps de regarder ce que vous avez en magasin !

Romain PAOLETTI
& Benjamin DECABOOTER
Consultants chez Pramana

--

--

Pramana

Designing The Digital World — Data Governance, Enterprise Architecture — more on pramana.fr and on LinkedIn