Blog

Qu’est-ce que l’exactitude des données, pourquoi c’est important et comment les entreprises peuvent s’assurer qu’elles disposent de données exactes.

Les données inexactes ont des implications réelles dans tous les secteurs. Dans le domaine de l’application de la loi, des données inexactes peuvent signifier l’inculpation de la mauvaise personne pour un crime. Dans le domaine des soins de santé, cela pourrait signifier commettre une erreur fatale dans les soins aux patients. Dans le secteur du commerce de détail, cela peut signifier faire des erreurs coûteuses lors de l’expansion d’une entreprise. Dans le domaine financier, cela pourrait signifier la violation des règles et des listes de sanctions.

L’exactitude des données n’est plus « seulement » une composante de la qualité des données. Il s’agit littéralement de la caractéristique la plus importante qui rend les données utilisables et utiles.

Dans ce guide détaillé, je vais couvrir tout ce que vous devez savoir sur.. :

  • Qu’est-ce que l’exactitude des données ?
  • Quelles sont les causes de l’inexactitude des données
  • Le coût élevé de l’inexactitude des données
  • Pourquoi il est essentiel de maintenir l’exactitude des données
  • Pourquoi les entreprises se débattent-elles avec la qualité et l’exactitude des données ?
  • Les mesures que vous pouvez prendre pour améliorer l’exactitude des données
  • Quelques exemples et études de cas importants

Allons-y.

Qu’est-ce que l’exactitude des données ?

L’exactitude des données fait référence à des enregistrements sans erreur qui peuvent être utilisés comme une source d’information fiable.

Dans la gestion des données, l’exactitude des données est le premier et le plus important composant/standard du cadre de qualité des données. Un ouvrage très souvent cité, Data Quality : The Accuracy Dimension de Jack Olson explique que la forme et le contenu sont deux des caractéristiques les plus importantes de l’exactitude des données.

Voici un exemple :

Dans la base de données américaine, les dates suivent le format MM/JJ/AAAA, alors que dans la base de données de l’UE et d’autres pays du monde, c’est JJ/MM/AAAA. Si le 09/10/2020 était converti en contenu, lequel des deux serait exact, selon vous ?

Est-ce le10 septembre ou le9 octobre ? C’est le problème classique de la différence entre le sens et la forme qui menace l’exactitude des données. Et cela se produit généralement en raison de l’absence de normalisation des données et de règles.

Il est impératif que toutes les données stockées dans un entrepôt de données soient exactes et appropriées pour être utilisées. Elle a un impact sur la veille économique, les prévisions, la budgétisation et d’autres activités essentielles d’une organisation. Si les données sont non pertinentes, incorrectes, incomplètes et inexactes, elles peuvent perturber les processus et nuire à l’efficacité opérationnelle.

Quelles sont les causes de l’inexactitude des données ?

Les causes de l’inexactitude des données sont nombreuses. Les causes les plus courantes sont :

Mauvaises pratiques de saisie des données : L’inexactitude des données est le résultat de mauvaises pratiques de saisie des données. Une organisation qui n’a pas mis en place une gouvernance des données verra les données saisies dans de multiples formats, styles et variétés. Par exemple, le nom d’un client peut être écrit de trois manières différentes par trois représentants différents. Pire encore, les données acquises à partir des médias sociaux sont fortement sujettes aux erreurs, aux fautes de frappe et aux erreurs de copier/coller.

Ne pas réglementer l’accessibilité des données : Le CRM est un bon exemple de ce point. Accessibles simultanément par les responsables des ventes, du marketing, du service clientèle et des comptes, les CRM peuvent devenir un foyer de données dupliquées, incohérentes et inexactes. Par exemple, un responsable marketing peut vouloir vérifier le nom de l’entreprise du client avant de publier une étude de cas, et voir une orthographe incorrecte ou une forme abrégée du nom dans le champ Nom de l’entreprise, qui a peut-être été tapée ou modifiée par un commercial. Le représentant marketing devra passer par plusieurs cycles de vérification pour corriger cette erreur. Pire encore, le client peut finir par pointer du doigt l’erreur si l’étude de cas a été publiée sans vérification.

La qualité des données n’est généralement pas abordée : Les équipes sont trop occupées par la vente, le marketing et la promotion pour penser à des informations incorrectes dans l’ensemble des données. Les dirigeants sont trop occupés à penser aux investissements dans le cloud, les systèmes de big data, les logiciels et technologies fantaisistes pour se préoccuper des données. Les équipes informatiques sont trop occupées à aider les dirigeants à se  » transformer  » pour se préoccuper de données disparates, doubles ou inexactes. La qualité ou l’exactitude des données n’est pas un sujet de discussion dans une salle de réunion. Elle n’est mise en lumière que lorsque quelque chose va très mal, comme un rapport erroné ou une campagne de marketing inefficace.

Toutes ces causes entraînent des pertes se chiffrant en millions.

Le coût élevé des données inexactes

Quelques statistiques pour enfoncer le clou.

High Cost of Inaccurate Data

  • On estime que les mauvaises données coûtent aux entreprises 15 % de leurs revenus. (Gartner)
  • L’impact financier moyen d’une mauvaise qualité des données sur les organisations est de 9,7 millions de dollars par an. (Gartner)
  • Rien qu’aux États-Unis, les entreprises perdent chaque année 3 100 milliards de dollars en raison de la mauvaise qualité des données. (IBM)
  • De nombreux rapports de recherche ont montré que les mauvaises données coûtent en moyenne aux entreprises 30 % ou plus de leurs revenus.
  • Près d’un tiers des analystes passent plus de 40 % de leur temps à vérifier et à valider leurs données analytiques. (Forrester)
  • Les travailleurs du savoir perdent 50 % de leur temps dans des usines de données cachées, à rechercher des données, à trouver et à corriger des erreurs, et à chercher des sources de confirmation pour des données auxquelles ils ne font pas confiance. (HBR)
    • 28 % de ceux qui ont eu des problèmes de livraison de courrier électronique affirment que le service à la clientèle a souffert à cause des mauvaises données. (E-Consultancy)
  • 20 à 30 % des dépenses d’exploitation sont dues à de mauvaises données. (Travaux pragmatiques)

Ces statistiques prouvent que les données inexactes et de mauvaise qualité constituent un problème persistant dans la plupart des organisations et qu’elles ont un impact considérable sur le retour sur investissement, la réputation de l’entreprise et la confiance des clients.

Pourquoi il est essentiel de maintenir l’exactitude des données

Des idées. Analytique. L’intelligence.

Les trois principaux objectifs que les entreprises veulent atteindre avec les données. On n’y parvient pas avec davantage de données. Elle est obtenue grâce à des données précises, complètes, opportunes et fiables.

C’est à travers ces objectifs qu’une entreprise prend des décisions clés telles que :

  • Expansion sur un nouveau marché
  • Lancement d’un nouveau service
  • Comprendre la position sur le marché
  • Comprendre les concurrents
  • Comprendre les clients et personnaliser les services à la clientèle
  • Permettre des processus d’entreprise efficaces

… et bien plus encore. Selon le secteur d’activité, l’exactitude des données peut faire ou défaire les entreprises. Les implications réelles de données inexactes ne peuvent être ignorées.

Pourquoi les entreprises se débattent-elles avec la qualité et l’exactitude des données ?

Des millions sont investis dans des solutions de gestion des données. Pourtant, une étude de HBR portant sur 75 cadres révèle que seuls 3 % d’entre eux ont trouvé que leurs données étaient exactes dans la fourchette acceptable de 97 enregistrements corrects ou plus sur 100.

Les entreprises ont du mal à maintenir l’exactitude des données parce qu’elles se concentrent uniquement sur la collecte de données supplémentaires, au lieu de rendre les données actuelles utilisables.

D’après notre expérience avec plus de 4 500 clients, trois obstacles essentiels empêchent les entreprises de tenir des registres précis.

Mauvaise culture des données : Les entreprises n’ont pas encore véritablement adopté une culture axée sur les données. Des investissements importants sont réalisés dans les technologies, mais peu ou pas d’investissements dans la formation à la sensibilisation aux données. Les employés ne sont généralement pas conscients de concepts tels que la qualité ou l’exactitude des données. Pendant longtemps, ces pratiques ont été réservées au département informatique. Lorsqu’il s’agit de données relatives aux clients, les employés de l’entreprise apportent des modifications à leur guise, sans respecter de normes définies ou de protocoles de qualité des données. Ces lacunes empêchent les entreprises d’obtenir des données exactes, ce qui compromet l’intégrité des données.

Accumuler des données au lieu d’être guidé par les données : Il n’y a vraiment pas de fin à la thésaurisation des données. Les entreprises dépensent des millions de dollars dans les technologies du big data et recueillent chaque jour davantage de données. Mais il n’y a pas de système en place pour donner un sens à ces données. Il n’y a pas de ressources disponibles pour nettoyer, trier et gérer les données à temps. Il n’y a pas d’automatisation et certainement pas de processus mis en place pour résoudre les problèmes de qualité des données, ce qui conduit au troisième obstacle.

Une dépendance obstinée à l’égard de méthodes et de technologies dépassées : Aujourd’hui, dans la plupart des organisations, les données sont encore préparées manuellement à l’aide d’Excel, de SQL ou d’outils ETL. Tous sont incapables de gérer les complexités des données modernes – en particulier les données clients obtenues via les médias sociaux, les fournisseurs tiers ou les formulaires web. Truffées d’erreurs, d’inexactitudes et de bizarreries, ces données ne peuvent être traitées ou préparées manuellement, car il faudrait des mois à une entreprise pour nettoyer et faire correspondre des milliers de lignes de données.

Ne pas reconnaître le besoin urgent de garantir la qualité des données entrave votre progression et affecte votre retour sur investissement – ce qui nous amène au point important suivant.

Comment calculer le retour sur investissement de l’exactitude des données ?

Le retour sur investissement détermine toutes, sinon la plupart, des décisions de l’entreprise. Comme pour tout autre processus, nous ferons de notre mieux pour justifier les dépenses consacrées à la qualité des données en mesurant son retour sur investissement et la plupart des dirigeants utiliseront une approche traditionnelle à cet égard :

Combien gagnerons-nous en $ si nous dépensons $ pour réparer nos données ?

Eh bien, voici une réponse non traditionnelle.

Vous augmentez votre retour sur investissement lorsque :

  • Votre entreprise *NE FAIT PAS* d’erreurs à cause de mauvaises données.
  • Vous ne dépensez pas chaque dollar pour réparer chaque disque.
  • Vos équipes ont accès à une source de données propre et centralisée avec laquelle travailler.
  • Les avantages de la correction des données sont plus importants que le coût de la dissimulation des erreurs et des inefficacités causées par de mauvaises données.
  • Vous prenez des décisions en toute confiance sur la base d’informations et de rapports de renseignement issus de données précises.

Le fait est que le retour sur investissement de toute initiative de qualité des données est insaisissable. Mais le coût des données médiocres est évident. Les entreprises perdent des millions de dollars chaque année à cause des doublons, des données périmées, incomplètes, mal assorties, inaccessibles et disparates.

Voici un exemple :

Une entreprise de formation en ligne par abonnement doit faire correspondre un million d’enregistrements obtenus à partir de trois sources : formulaires de demande, CRM, service clientèle.

En utilisant des outils ETL traditionnels, l’entreprise effectue le rapprochement mais se retrouve avec 3,5 % de faux négatifs et 6,8 % de faux positifs. Ce seul chiffre a coûté à l’entreprise des centaines de dollars en ventes, en heures de main-d’œuvre (en examinant manuellement chaque faux négatif et positif). Si l’entreprise avait entrepris une initiative sérieuse en matière de qualité des données, elle aurait évité le gaspillage de 11 % du total de ses enregistrements.

11% d’un million = 11.000

En supposant que chaque client paie 100 $.

C’est 11 0000 x 100 = 11000000

Onze millions de revenus gaspillés. C’est un coup dur pour la rentabilité de toute entreprise.

Prêt à faire le nécessaire pour améliorer l’exactitude des données ?

Voici ce par quoi vous pouvez commencer.

Quelles mesures immédiates pouvez-vous prendre pour améliorer l’exactitude des données ?


Vous serez peut-être tenté d’engager un analyste de données. Ou peut-être changer votre CRM. Ou alors, demandez (encore) à vos équipes informatiques de trouver une solution.

Stop.

Rien de tout cela ne va fonctionner.

Alors, qu’est-ce qui le fera ?

Voici quelques mesures immédiates que je recommande :

  • Effectuez un audit de la qualité des données. Découvrez les cinq principaux problèmes qui affectent la qualité de vos données. Parmi les problèmes les plus courants, vous trouverez des doublons, des informations incomplètes et des données stockées dans de multiples silos, dont plus de la moitié sont soit obsolètes, soit oubliées depuis longtemps.
  • Mesurez l’impact estimé. Disons que vous avez mille nouveaux prospects ce mois-ci. Combien de ces pistes sont réellement utilisables ? Si c’est juste deux ou trois cents, vous perdez des revenus.
  • Mesurez la main d’œuvre nécessaire pour réparer ces données. Combien de temps vos représentants passent-ils à vérifier et à corriger les informations ? Le font-ils manuellement ? Combien d’appels téléphoniques sont passés et quelle est la durée moyenne de chaque appel ? Évaluez le coût de la fixation manuelle de ces données. S’il faut un mois à votre équipe pour vérifier, nettoyer, déduire et corriger un ensemble de données de 1 000 lignes, vous devez rechercher une solution plus rapide et plus automatisée.
  • Optez pour une solution automatisée : Lors de l’audit de vos données, vous vous rendrez peut-être compte que vous avez besoin d’une solution de rapprochement des données qui peut vous aider à supprimer les doublons et peut-être à consolider plusieurs ensembles de données provenant de sources multiples en un enregistrement consolidé et doré. La plupart des organisations utilisent la solution DataMatch Enterprise de Data Ladder pour le rapprochement des données et la déduplication des données. En outre, ils peuvent également profiler, nettoyer, normaliser et préparer leurs données.
  • Engagez un analyste de données pour gérer la préparation des données : Vous pouvez penser à engager un analyste de données et à le laisser faire le nettoyage, mais ce n’est guère la bonne utilisation de ses compétences. Votre analyste de données doit être doté des bons outils et des bonnes ressources pour l’aider à obtenir des données précises. Ils doivent être les penseurs et les stratèges, tandis que la solution que vous leur fournissez est l’exécutant. Votre analyste ne doit pas passer 80 % de son temps à faire du travail de conciergerie (les experts affirment que le nettoyage des données est un travail de conciergerie des données et ce n’est pas amusant !) Laissez les solutions faire le nettoyage et laissez vos analystes réfléchir !
  • Concentrez-vous sur des ensembles de données spécifiques à corriger plutôt que sur une source de données entière : Il est impossible d’effectuer une opération globale sur l’ensemble de votre source de données ou de votre base de données. Non seulement ce sera inutile, mais ce sera aussi un gaspillage d’efforts. Concentrez-vous plutôt sur l’optimisation des données dont vous avez besoin pour des tâches immédiates – comme le nettoyage des données des six derniers mois pour préparer un rapport semestriel, ou des données du dernier trimestre pour préparer une campagne promotionnelle. En vous concentrant d’abord sur la correction des données importantes, vous arriverez progressivement à trier les autres données et à décider de ce que vous voulez garder et de ce que vous voulez jeter.

Grâce à ces mesures immédiates, vous pouvez préparer vos équipes à traiter des opérations commerciales essentielles telles qu’une initiative de migration à venir, une grande campagne promotionnelle ou un rapport de veille économique. L’objectif fondamental pour disposer de données exactes est de garantir leur intégrité. Vos données peuvent faire ou défaire votre entreprise. Vous vous souciez assez de la situation pour la réparer ?

Étude de cas des frères Cleveland

Cleveland Brothers Equipment Company Inc. est un concessionnaire d’équipements et soutient un certain nombre d’industries, notamment la construction, l’agriculture, la production d’énergie, l’aménagement paysager, etc. Cela signifie que l’entreprise traite des ensembles de données clients multiples provenant de sources multiples, avec des intérêts et des besoins multiples.

L’entreprise avait besoin d’une solution de gestion de la qualité des données qui lui permette de déduire les données, de recouper les informations de contact telles que les noms, les numéros de téléphone, les adresses de facturation et les noms de société. Ils avaient également besoin de la solution pour les aider à nettoyer et à normaliser les données.

DataMatch Enterprise a été l’outil de choix de l’entreprise qui l’a aidée à effectuer plusieurs opérations clés en même temps. Comme l’outil est facile à utiliser et ne nécessite aucune expertise supplémentaire en programmation, même les ressources commerciales de l’entreprise ont pu préparer les données facilement.

Étude de cas des frères Cleveland

Téléchargez l’étude de cas et découvrez comment le principal revendeur d’équipements gagne du temps en gérant plusieurs listes de clients.


Télécharger

En conclusion : Ne transigez pas sur l’exactitude des données. Votre entreprise a besoin de données fiables

L’objectif est la qualité des données. L’exactitude des données est le résultat. Avec les bonnes ressources humaines et technologiques, votre entreprise sera mieux à même d’aborder l’avenir avec confiance.

Comment fonctionnent les meilleures solutions de correspondance floue de leur catégorie : Combinaison d’algorithmes établis et exclusifs


Télécharger

Commencez votre essai gratuit aujourd’hui

Aïe ! Nous n’avons pas retrouvé votre formulaire.

In this blog, you will find:

Try data matching today

No credit card required

Hidden

Want to know more?

Check out DME resources

Merging Data from Multiple Sources – Challenges and Solutions

Aïe ! Nous n’avons pas retrouvé votre formulaire.