Blog

L’impact de la mauvaise qualité des données : Risques, défis et solutions

Il est difficile d’établir une corrélation entre un problème de données et un risque ou un impact commercial.

Une mauvaise qualité des données peut avoir des risques dévastateurs pour votre entreprise. La plupart des travailleurs organisationnels sont conscients de l’impact d’une mauvaise qualité des données, mais il leur est difficile d’en faire un argumentaire sur papier – qu’il s’agisse de justifier l’investissement dans des plans d’amélioration de la qualité des données ou de convaincre leurs supérieurs hiérarchiques d’agir. C’est pourquoi il est impératif de relier les problèmes de qualité des données aux risques commerciaux potentiels et aux coûts associés, afin d’attirer à temps l’attention des parties prenantes et de mettre en œuvre les solutions possibles.

Dans ce blog, nous allons voir comment divers problèmes de qualité des données peuvent introduire des risques sérieux pour votre entreprise et quelles mesures vous pouvez prendre pour les surmonter.

Conception de la faille de données – matrice des risques commerciaux

David Loshin (dans son livre Le guide du praticien pour l’amélioration de la qualité des données ) présente un modèle très utile pour relier les défauts des données aux impacts commerciaux et aux coûts qui en découlent. J’ai résumé le modèle dans le tableau ci-dessous :

ProblèmeNuméroRisque commercialQuantificateurCoût (annuel)
Il s’agit du problème de qualité des données qui réside dans votre ensemble de données. Ce sont les différents problèmes qui peuvent survenir en raison d’un problème de données. Il s’agit de l’impact que le problème peut avoir sur l’entreprise. Cela permet de quantifier l’impact en termes de mesure commerciale. Cela fournit une estimation périodique des coûts encourus en raison de l’impact sur l’entreprise.
Exemple
Nom et coordonnées du client mal orthographiés Enregistrements en double créés pour le même client Service à la clientèle : Augmentation du nombre d’appels entrants Augmentation du temps du personnel 30 000 $ de plus en temps de personnel nécessaire
Service à la clientèle : Diminution de la satisfaction des clients Réduction des commandes, perte de clients ~500 commandes de moins cette année (par rapport à l’estimation)
Les comptes : Impact sur le flux de trésorerie Augmentation de la volatilité des flux de trésorerie On ne peut pas se fier aux flux de trésorerie estimés dans environ 20 % des cas.
Comptes : Augmentation de la demande d’audit Augmentation du temps du personnel 20 000 $ de plus en temps de travail pour le personnel.

Ce modèle résume précisément le type d’impact qu’un problème de qualité des données (quelque chose d’aussi minime qu’un nom de client mal orthographié) peut avoir sur votre entreprise. Il y a quelques points à noter à propos de ce modèle :

  • Un problème de qualité des données peut donner lieu à plusieurs problèmes. Par exemple, un nom de client ou des informations de contact mal orthographiés peuvent également conduire à un client incorrect dans votre base de données et à la perte du contact d’un client authentique.
  • Un seul problème peut avoir des répercussions multiples sur divers secteurs d’activité. Dans le tableau ci-dessus, nous avons vu comment un problème a eu deux impacts sur le service clientèle et deux impacts sur le service comptabilité. Un même problème peut avoir plus d’impact sur ces départements, ou éventuellement plus d’impact sur d’autres verticaux, comme les ventes, le marketing, le produit, etc.
  • Le quantificateur est nécessaire à la recherche et il peut y avoir plusieurs quantificateurs pour un même impact.
  • Le coût est estimé et peut être mesuré à tout moment périodique, par exemple, mensuellement, trimestriellement, annuellement, etc.

Le modèle mentionné ci-dessus permet d’établir un lien entre toutes sortes de problèmes de qualité des données et les risques commerciaux estimés. Mais pour vous aider à remplir le modèle pour votre cas spécifique, je vais énumérer les aspects suivants dans ce blog :

  • Les différents types de problèmes de qualité des données présents dans les principaux actifs de données d’une organisation, et
  • Les risques commerciaux les plus courants encourus en raison de ces problèmes de qualité des données.

Commençons.

Problèmes de qualité des données

Examinons les problèmes de qualité les plus courants rencontrés dans les ensembles de données d’une organisation.

  1. Données incorrectes : Il s’agit des données qui ne sont pas conformes à la réalité. Cela se produit généralement en raison de :
    1. Informations périmées : Les données ont tendance à changer au fil du temps et doivent être réexaminées et révisées périodiquement.
    2. L’erreur humaine : Les erreurs de frappe, les fautes d’orthographe et la mauvaise compréhension des données sont quelques-unes des raisons courantes à l’origine des problèmes de qualité des données.
    3. Métadonnées ambiguës : Un manque de compréhension claire de la signification de certains champs de données peut vous amener à stocker des informations incorrectes.
  2. Données en double : Il s’agit de stocker plusieurs enregistrements appartenant à la même entité.
  3. Données incomplètes : Il s’agit de laisser des champs nécessaires vides dans vos ensembles de données.
  4. Formats et modèles incohérents : Il s’agit d’avoir les mêmes données stockées dans plusieurs formats et modèles, plutôt que de suivre le format et le modèle normalisés.
  5. Dépendances manquantes : Certains champs de données sont laissés vides car leurs champs dépendants sont vides. Par exemple, un code postal vide peut faire en sorte que le champ des géocodes de soutien reste vide.
  6. Unités de mesure différentes : Il s’agit de stocker le même champ de données dans plusieurs unités de mesure, ce qui vous prive d’une échelle de mesure standardisée.

Risques commerciaux associés à une mauvaise qualité des données

Pour estimer l’impact d’une mauvaise qualité des données sur une entreprise, vous devez identifier le rôle que jouent les données dans les différents processus métier. Cela vous aidera à mettre en évidence les processus qui risquent d’être perturbés et de provoquer des retards si les données présentent l’un des problèmes mentionnés ci-dessus. J’ai énuméré ci-dessous les risques commerciaux les plus courants associés à une mauvaise qualité des données.

1. Les occasions manquées

Sur les 3,64 millions de pistes générées chaque année, 45 % sont filtrées comme mauvaises pistes en raison de données dupliquées, d’un formatage invalide, d’un échec de la validation de l’e-mail et de champs manquants. Source

Une entreprise est susceptible de manquer des opportunités sur de multiples fronts si la qualité des données est mauvaise dans des ensembles de données disparates. Par exemple, avec de mauvaises données sur les prospects, vous pouvez manquer une occasion d’identifier des prospects potentiels. De même, une mauvaise information sur les produits peut nuire à votre capacité à élaborer une stratégie efficace pour le développement de vos produits en fonction des besoins du marché. Les concurrents de votre secteur prendront certainement la tête du marché s’ils disposent d’ensembles de données plus fiables et plus précis.

2. Perte de revenus

Les organisations estiment que la mauvaise qualité des données est responsable d’une perte moyenne de 15 millions de dollars par an. Source :

C’est certainement l’un des plus grands risques que votre entreprise peut encourir en raison de la mauvaise qualité des données. Des données incomplètes ou incorrectes (qu’il s’agisse des coordonnées des clients, des informations sur les produits ou d’une ambiguïté dans les données financières) peuvent vous faire perdre des clients potentiels et entraîner des pertes de revenus. Si ces erreurs ne sont pas liées à une mauvaise gestion de la qualité des données, vous aurez du mal à comprendre pourquoi votre équipe ne parvient pas à atteindre ses objectifs annuels en matière de ventes ou de revenus.

3. Réduction de l’efficacité opérationnelle et de la productivité

La plupart des équipes chargées des données en 2021 ont déclaré qu’elles n’utilisaient aucun logiciel de qualité des données et s’appuyaient sur des contrôles manuels de la qualité des données. Source :

Lorsque les employés d’une entreprise corrigent manuellement les problèmes de qualité des données avant de les utiliser, leur efficacité et leur productivité peuvent s’en ressentir. De nombreux analystes et scientifiques des données ont le sentiment de passer plus de temps à préparer et à nettoyer les données – par rapport à la réalisation d’analyses et à la formulation de prévisions fiables sur l’avenir de l’entreprise. C’est pourquoi votre entreprise a besoin d’un système de bout en bout qui utilise la technologie pour automatiser la validation de la qualité des données et mettre en œuvre des processus de qualité des données à temps. Cela peut transformer vos données en les rendant utilisables à chaque étape de leur cycle de vie – sans fournir d’effort supplémentaire en cours d’exécution.

4. L’insatisfaction des clients

Sur 37% des personnes interrogées travaillant sur l’expérience client pour les processus externes, seules 30% surveillent de manière proactive les impacts de la qualité des données. Source :

À l’heure actuelle, les clients recherchent la personnalisation. Le seul moyen de les convaincre d’acheter chez vous et non chez un concurrent est de leur offrir une expérience qui leur est propre. Faites-leur sentir qu’ils sont vus, entendus et compris. Pour y parvenir, les entreprises utilisent une tonne de données générées par les clients pour comprendre leur comportement et leurs préférences. Si ces données présentent de sérieux défauts, vous finirez évidemment par déduire des détails erronés sur vos clients ou acheteurs potentiels. Cela peut entraîner une diminution de la satisfaction des clients et de la fidélité à la marque.

5. Mauvaise analyse

84 % des PDG sont préoccupés par la qualité des données sur lesquelles ils fondent leurs décisions. – Source

Il existe deux façons de prévoir le marché, la demande et les besoins futurs. La première est de suivre son instinct. La seconde consiste à examiner les données passées pour identifier des modèles et prévoir l’avenir probable. Il est évident que la seconde méthode est plus fiable. Mais lorsqu’il s’agit de veille économique ou d’analyse de marché, la qualité de vos informations dépend de celle des données d’entrée. Si les données qui alimentent votre algorithme d’analyse présentent de multiples problèmes de qualité, les modèles identifiés seront inexacts, ce qui vous conduira à une perception erronée de l’avenir du marché.

6. Atteinte à la réputation

Le consommateur moyen passe 13 minutes et 45 secondes à lire des avis avant de prendre une décision d’achat. – Source

La mauvaise information sur les produits est l’une des principales raisons pour lesquelles les clients retournent les produits achetés. Le produit n’était pas comme il était présenté sur le site web. Mais dans certains cas, la mauvaise qualité des données peut vous coûter plus que des produits retournés. En mars 2017, le Rescue 116 s’est écrasé contre un obstacle de 282 pieds – Blackrock Island, au large du comté de Mayo. Des enquêtes plus approfondies ont révélé que l’exploitant de l’hélicoptère du CHC Ireland n’avait pas mis en place un système « formalisé, normalisé, contrôlé ou périodique ». De ce fait, la base de données utilisée par l’opérateur pour examiner les itinéraires de vol ne contenait pas de détails sur l’île de Blackrock.

Il a été rapporté que l’équipage n’a été averti de cet obstacle sur sa route de vol qu’à 13 secondes de celui-ci. Le pire est qu’une plainte a été déposée au sujet de cette inexactitude de la base de données des garde-côtes irlandais 4 ans avant l’incident, mais aucune mesure corrective n’a été prise. Dans un monde où chaque action est guidée par les données, ces incidents prouvent que le coût d’une mauvaise qualité des données est fortement sous-estimé.

7. Manque de conformité

L’article 5 du GDPR stipule que les données personnelles doivent être exactes et, si nécessaire, mises à jour. – Source

Les normes de conformité des données (telles que GDPR, HIPAA et CCPA, etc.) obligent les entreprises à revoir et à réviser leurs stratégies de gestion des données. En vertu de ces normes de conformité des données, les entreprises sont tenues de protéger les données personnelles de leurs clients et de veiller à ce que les propriétaires des données (les clients eux-mêmes) aient le droit d’accéder à leurs données, de les modifier ou de les effacer.

Outre ces droits accordés aux propriétaires de données, les normes obligent également les entreprises à respecter les principes de transparence, de limitation de la finalité, de minimisation des données, d’exactitude, de limitation du stockage, de sécurité et de responsabilité. Il est très difficile de se conformer à ces normes si les données sous-jacentes ne sont pas exactes, complètes, valides et sécurisées. Et un manque de conformité peut limiter les activités de votre entreprise, notamment sur le plan géographique.

8. Augmentation des coûts financiers

IBM estime à 3 100 milliards de dollars le coût annuel de la mauvaise qualité des données, rien qu’aux États-Unis, en 2016. – Source

Tous les risques commerciaux mentionnés ci-dessus aboutissent à une chose : ils vous coûtent plus d’argent que si vous aviez mis en place un système de gestion de la qualité des données de bout en bout. Que vous payiez pour embaucher du personnel supplémentaire ou que vous mettiez constamment à jour les processus du système pour garantir la qualité des données, vous n’obtiendrez pas les résultats escomptés. Il est préférable d’investir dans la mise en œuvre d’un système unique et complet de gestion de la qualité des données, qui nettoie et prépare tous les différents types de données traitées dans votre organisation, afin de pouvoir maîtriser l’augmentation des coûts financiers.

Conclusion

La mise en œuvre de mesures de qualité des données cohérentes, automatisées et reproductibles peut aider votre organisation à atteindre et maintenir la qualité des données dans tous les ensembles de données.

Data Ladder a servi dessolutions de qualité des données à ses clients depuis plus d’une décennie maintenant. DataMatch Enterprise est l’un de ses principaux produits de qualité des données, disponible sous la forme d’une application autonome ou d’une solution intégrée. API – qui permet une gestion de la qualité des données de bout en bout, y compris leprofilage des données, nettoyage, correspondant, déduplication, et purge de la fusion.

Vous pouvez télécharger l’essai gratuit dès aujourd’hui ou programmer une session personnalisée avec nos experts pour comprendre comment notre produit peut aider à mettre en œuvre les meilleures pratiques pour atteindre et maintenir la qualité des données au niveau de l’entreprise.

In this blog, you will find:

Try data matching today

No credit card required

Hidden

Want to know more?

Check out DME resources

Merging Data from Multiple Sources – Challenges and Solutions

Aïe ! Nous n’avons pas retrouvé votre formulaire.