La Gouvernance des Données peut-elle être un levier pour l’IA et la Data Science ?

Quelques pistes pour créer une synergie entre Données, Organisation et Usages.

De la difficulté de passer du POC (Proof of Concept) à l’industrialisation :

Remonter aux causes-racines du « Garbage in, Garbage out » :

Un biais dans la définition de la donnée dû à :

  • Une multitude de définitions d’une même donnée
  • Un vocabulaire inconsistant pour la qualifier
  • Une méconnaissance du périmètre de la donnée

Un biais dans la compréhension du contexte de production et de collecte de la donnée dû à :

  • Un manque d’identification d’experts du domaine de donnée qui revoient la donnée avant son utilisation (notamment pour la relier aux activités métiers)

Des problèmes de qualité :

  • Données incomplètes, inconsistantes, non-valides ou non mises à jour
  • Une structuration des données ne correspondant pas au besoin des utilisateurs et la présence de données mal ou non labellisées
  • Un volume insuffisant des données pour tester la robustesse des algorithmes

L’utilisation de la mauvaise source de données

  • Les master data ou les données de référence ne sont pas systématiquement utilisées
  • A cause de problèmes d’accès à la donnée, la meilleure source de données n’est pas toujours prise en entrée

Des problèmes de protection de la donnée :

  • Le non-respect des règles de confidentialité et d’anonymisation

Des bonnes pratiques sur l’usage de la donnée non connues et non intégrées dans les processus et dans les activités quotidiennes.

Des raisons de collecte de la donnée non explicitées ou non consenties :

  • Un usage non éthique de la donnée peut en être la conséquence

Des référents de données non identifiés :

  • Un manque de responsabilisation des collaborateurs sur l’importance d’avoir une donnée de qualité sur toute la chaîne du processus métier.

La gouvernance des données comme solution potentielle au « Garbage in, Garbage out » :

  • La gouvernance de la donnée repose sur des principes et des politiques qui permettent de guider les bons réflexes à avoir lors de la définition, la collecte et le partage des données.
    Un des principes structurants dans la gouvernance de la donnée est que « la donnée est un actif de l’entreprise » et qu’elle doit être gérée en tant que tel. Cela implique une gestion continue de la qualité des données et la mise en place d’actions correctives qui pourront améliorer la qualité du « Garbage in » en entrée des algorithmes d’IA, de Data science et de Machine Learning.
  • La gouvernance de la donnée permet de responsabiliser les collaborateurs d’une organisation pour gérer la donnée comme un actif de l’entreprise dans leurs activités quotidiennes (la gestion de sa documentation, de sa qualité, son usage dans un cadre respectant les règles de confidentialité et d’éthique, etc.).
    En effet, en identifiant des rôles et des référents de domaines de données, la gouvernance instaure un cadre dans lequel il y a plus de temps et de personnes affectés à la compréhension et à la l’implémentation des bonnes pratiques d’usage de la donnée. Ce temps et ces ressources sont cruciales étant donné la volumétrie et la complexité croissante des données collectées et les délais de plus en plus courts accordés au développement des cas d’usage (l’Agile, le temps réel, etc.).
  • La gouvernance de la donnée favorise l’instauration d’un langage commun sur la donnée. Ce langage commun est matérialisé par la mise en place d’un catalogue de données universel et diffusé dans l’entreprise. Ce dernier, s’il répond bien aux besoins des data-scientists en termes de documentation de la donnée, peut accélérer le travail d’investigation amont de la donnée, à savoir : quelle source utiliser, est-ce que la source est une référence partagée, quelles règles de gestion ont été appliquées à la donnée avant son arrivée dans la source retenue, etc.

--

--

Designing The Digital World — Data Governance, Enterprise Architecture — more on pramana.fr and on LinkedIn

Get the Medium app

A button that says 'Download on the App Store', and if clicked it will lead you to the iOS App store
A button that says 'Get it on, Google Play', and if clicked it will lead you to the Google Play store
Pramana

Designing The Digital World — Data Governance, Enterprise Architecture — more on pramana.fr and on LinkedIn