Blog

Comprendre la qualité des données et la gestion des données de référence : Choisir entre les deux approches (partie 3 sur 3)

Note : ce blog est la troisième partie d’une série de trois. Si vous le souhaitez, vous pouvez consulter les blogs précédents où nous avons discuté de la nécessité d’une gestion systématique et centralisée des données, ainsi que de la gestion des données de base en détail.

Nous y sommes – le final de la série. Et cela nous amène à la discussion la plus importante de cette série : Quelle approche choisir entre la qualité des données et la gestion des données de référence. Cependant, maintenant que nous avons vu les deux approches en détail, il est tout à fait évident que ces deux disciplines sont hautement intégrées l’une dans l’autre. En fait, on pense souvent que la qualité des données est le principal moteur et sous-produit des initiatives de GDR. Néanmoins, lorsque ces solutions sont conditionnées et vendues comme des outils, il devient impératif de connaître les domaines et les capacités qui se chevauchent, afin de pouvoir choisir la bonne solution pour votre entreprise.

DQM et MDM : Compléments et non opposés

L’un des concepts les plus importants pour commencer est que la qualité des données et la gestion des données de référence ne sont pas opposées l’une à l’autre ; elles sont plutôt complémentaires. Les solutions MDM contiennent quelques capacités supplémentaires en plus des fonctions de gestion de la qualité des données.

Cela fait de MDM une solution plus complexe et plus gourmande en ressources à mettre en œuvre – un élément à prendre en compte lors du choix entre les deux approches.

Comparaison des capacités de MDM et de DQM

Il existe une vingtaine de fonctions ou de capacités que les outils de gestion des données possèdent ou ne possèdent généralement pas. Nous allons comparer une solution typique de MDM et de DQM à ces capacités.

Gardez à l’esprit que ces principes ne s’appliquent pas nécessairement à toutes les solutions MDM/DQM existantes et qu’il peut y avoir des exceptions. Cette comparaison met en évidence les concepts les plus couramment compris et les différences entre les deux approches.

Non.CapacitéMDMDQMCommentaires
1.Contrôle de l’utilisation et du partage des donnéesOuiNon
2.Contrôle d’accès aux donnéesOui Non
3.Flux de vérification des donnéesOuiNon
4.Historique des données et gestion des journauxOuiNon
5.Modélisation des objets de donnéesOuiNon
6.Gestion des métadonnéesOuiNon
7.Gestion des données de référenceDépend deNonToutes les solutions de GDR ne facilitent pas la gestion des données de référence, et l’absence de cette fonctionnalité peut saper vos efforts de GDR.
8.Stockage des donnéesDépend deNonLes outils DQM créent généralement des copies de vos données que vous pouvez ensuite écraser/exporter vers d’autres applications. D’autre part, les outils de GDR peuvent avoir un stockage de données pour stocker les enregistrements de données de base, ou dans certains cas, l’outil de GDR maintient un registre qui fait référence aux enregistrements de données de base résidant dans d’autres applications/sources.
9.L’ingestion ou la prise de donnéesOuiOuiIl s’agit de la capacité de se connecter ou de s’intégrer à une multitude de sources et d’applications.
10.Requêtes et filtres de données personnalisésOuiOui
11.Création d’enregistrements de donnéesDépend deNonLes outils DQM sont davantage axés sur le nettoyage des données qui ont été collectées/créées par d’autres applications de données. D’autre part, les outils de GDR ayant leur propre stockage de données permettent la création d’enregistrements de données, tandis que d’autres outils de GDR basés sur un registre ne permettent pas la création d’enregistrements de données.
12.Manipulation des donnéesOuiNonDans les outils DQM, vous ne pouvez pas directement manipuler/mettre à jour les données – ce qui vous permet de maintenir l’intégrité des données ; tandis que dans les MDM, vous pouvez mettre à jour les enregistrements de données de base qui ont été créés en consolidant les données provenant d’autres sources.
13.Collaboration en matière de donnéesDépend deNon
14.Profilage des donnéesOuiOuiEn savoir plus sur le profilage des données dans une solution DQM.
15.Nettoyage et normalisation des donnéesOuiOuiEn savoir plus sur le nettoyage et la normalisation des données dans une solution DQM.
16.Mise en correspondance des donnéesOuiOuiEn savoir plus sur le rapprochement des données dans une solution DQM.
17.Fusion des données et survieOuiOuiEn savoir plus sur la fusion des données et la survie dans une solution DQM.
18.Synchronisation des donnéesDépend deNonPour MDM, la synchronisation des données dépend du style architectural de MDM.
19.Analyse des données d’exécutionOuiDépend deIl s’agit de signaler les entrées/manipulations de données entrantes comme étant invalides ou susceptibles de faire double emploi. Pour les outils DQM, cela peut dépendre du fait que le fournisseur offre une API de qualité des données, qui peut être intégrée à votre solution personnalisée pour analyser les données en temps réel.
20.Interface utilisateurOuiOui

Comment ces capacités sont-elles intégrées dans les outils logiciels ?

Maintenant que nous avons compris la portée exacte de ces disciplines et outils, examinons un autre aspect important avant de prendre la décision finale. Il s’agit de comprendre comment les fournisseurs intègrent généralement ces capacités dans leurs offres de produits et de services.

1. Outils autonomes de qualité des données

Ces outils ont plus ou moins les mêmes caractéristiques que celles mentionnées ci-dessus pour DQM. Ils ne se connectent pas à d’autres sources de données en temps réel, et ces outils sont donc principalement utilisés pour le traitement par lots (y compris le profilage, le nettoyage, la normalisation, la mise en correspondance et la fusion des données), puis le chargement des enregistrements consolidés vers la source de destination.

Parmi les avantages supplémentaires, citons

  • Le moyen le plus rapide et le plus sûr de consolider les enregistrements de données.
  • Il est plus facile d’affiner les algorithmes de correspondance et les règles de fusion en fonction de la nature actuelle des données (contrairement aux MDM où les mêmes configurations s’appliquent à tous les enregistrements générés au fil du temps).
  • Certains de ces outils sont dotés de dictionnaires de mots spécialisés qui permettent de trouver des mots exacts (par exemple, le prénom, le second prénom et le nom de famille) et de remplacer les champs mal orthographiés ou manquants.
  • Certains outils permettent également de planifier les tâches DQM et de générer des enregistrements consolidés à des moments précis.
  • Particulièrement utile pour consolider les listes de marketing par courriel, les contacts et les dossiers des clients.

2. Intégrer les fonctions de qualité des données en temps réel

Certains fournisseurs exposent les fonctions nécessaires à la qualité des données par le biais d’API ou de SDK. Cela vous permet d’intégrer toutes les fonctionnalités de DQM dans vos applications existantes en temps réel ou en cours d’exécution.

Cela peut nécessiter quelques efforts supplémentaires, mais certains avantages en découlent :

  • Utile lors de la mise en œuvre de flux personnalisés (notamment pour la gouvernance des données) qui sont importants pour les besoins de votre entreprise.
  • Peut potentiellement agir comme un pare-feu de qualité des données pour votre entrepôt de données, où la qualité des données entrantes est testée avant leur entrée.

3. Solution MDM opérationnelle

Les fournisseurs proposent des solutions de GDR de différentes manières, en fonction de leur objectif ou de leur utilisation dans une organisation. L’un d’eux est un MDM opérationnel. Ce type de MDM est normalement utilisé dans les opérations de données de routine et est fortement axé sur la fourniture d’une vue consolidée des actifs de données de base à tous ceux qui manipulent des données dans une organisation.

Les MDM opérationnels ont généralement un style architectural de coexistence ou centralisé – ce qui suggère qu’ils ont leur propre stockage de données.

4. Solution analytique de MDM

Ce type de MDM est normalement utilisé à des fins d’analyse ou de business intelligence dans une organisation. Comme ils ne sont pas utilisés de manière opérationnelle, ils n’ont pas vraiment besoin de leur propre stockage de données. C’est pourquoi les styles architecturaux tels que le registre ou le consolidé sont plus courants avec les solutions de GDR analytiques, car ils pointent simplement vers les enregistrements de données de base, ou les envoient aux applications de BI qui en ont besoin pour l’analyse.

5. Solutions internes personnalisées

Malgré les diverses solutions de qualité des données et de gestion des données de référence présentes sur le marché, de nombreuses entreprises investissent dans le développement d’une solution interne pour leurs besoins en données personnalisées. Bien que cela puisse sembler très prometteur, les entreprises finissent souvent par gaspiller un grand nombre de ressources – temps et argent – dans ce processus. Le développement d’une telle solution peut être plus facile à mettre en œuvre, mais il est presque impossible de la maintenir dans le temps.

Pour en savoir plus sur ce sujet, vous pouvez lire notre livre blanc : Pourquoi les projets internes de qualité des données échouent.

Lequel vous faut-il ? MDM ou DQM ?

Ceci nous amène à notre dernier sujet et à notre conclusion : comment choisir entre une solution MDM ou DQM. Et la réponse est : cela dépend. Bien que, jusqu’à présent, vous puissiez savoir clairement quelle solution répond le mieux à vos besoins – surtout après avoir passé en revue les capacités de chacune d’entre elles – vous devrez peut-être garder les aspects suivants à l’esprit au moment de prendre votre décision.

1. Principaux objectifs commerciaux

C’est probablement l’élément le plus important à prendre en compte, car il suggère que cette décision dépend fortement de la situation de votre entreprise. Pour prendre la bonne décision, vous devez connaître les principaux objectifs et buts de votre entreprise, ainsi que le rôle que jouent les données pour les atteindre. En outre, vous pouvez noter comment les opérations de données sont gérées dans votre entreprise et où exactement une solution de gestion des données est nécessaire.

2. Cadre de mesure de la qualité des données

Une autre étape utile consiste à identifier vos indicateurs clés de performance (ICP) en matière de qualité des données. La qualité des données peut avoir une signification différente selon les organisations. Une fois que vous aurez réalisé et identifié votre propre définition de la « qualité des données », il sera plus facile de savoir quelle solution la facilitera le mieux et vous aidera à introduire, maintenir et pérenniser la qualité des données dans vos principaux actifs de données.

3. Budget et temps que votre entreprise est prête à investir

En lisant le précédent blog de la série, vous avez peut-être compris que la mise en œuvre d’un MDM est un processus assez complexe, car il nécessite une planification et une analyse préalables approfondies, ainsi que l’implication des principales parties prenantes.

Gardez à l’esprit le budget et le temps que votre entreprise peut se permettre et est prête à investir dans ce processus – par rapport au retour sur investissement. Par exemple, vous n’avez peut-être pas besoin d’une entité complète et indépendante pour la gestion des données de référence, et un simple outil autonome de qualité des données peut répondre à vos besoins en la matière.

4. Qui gère/utilise/demande les données de base dans votre entreprise ?

Cela peut éventuellement servir de point de décision. De nombreuses personnes au sein de votre entreprise peuvent générer ou manipuler des données de référence, mais tout le monde ne les utilise pas dans ses opérations quotidiennes.

Prenons l’exemple de ce scénario : les enregistrements de données clients sont générés ou mis à jour par les commerciaux, les comptables ou d’autres personnels opérationnels, mais seule votre équipe d’analystes de données les utilise pour générer des rapports trimestriels. Dans un tel cas, la maintenance d’un GDR complet au fil du temps peut s’avérer trop lourde à gérer par rapport aux exigences de son utilisation. Vous pouvez simplement fournir à vos analystes de données leur propre outil personnalisé de qualité des données, qu’ils peuvent utiliser pour évaluer et gérer rapidement et efficacement la qualité des données, puis utiliser les données selon les besoins.

Mais d’un autre côté, si plusieurs départements ont besoin d’enregistrements de données de base presque tous les jours ouvrables, une solution MDM complète peut être la solution.

Remarques finales

Ici, nous arrivons à la fin. Nous avons commencé par examiner le besoin croissant de solutions de gestion des données systématiques et centralisées, puis nous avons étudié les solutions MDM sur le plan conceptuel et technologique, et enfin nous avons terminé par une comparaison complète entre les approches MDM et DQM. Ce voyage en lui-même vous a donné suffisamment d’informations pour prendre la bonne décision pour votre entreprise.

Mais si vous le souhaitez, nos experts en solutions peuvent certainement vous aider à répondre à toute question que vous pourriez encore avoir. N’hésitez pas à télécharger notre essai gratuit ou à réserver une démonstration dès aujourd’hui pour une séance de consultation personnelle.

In this blog, you will find:

Try data matching today

No credit card required

« * » indique les champs nécessaires

Hidden
Ce champ n’est utilisé qu’à des fins de validation et devrait rester inchangé.

Want to know more?

Check out DME resources

Merging Data from Multiple Sources – Challenges and Solutions

Aïe ! Nous n’avons pas retrouvé votre formulaire.