{"id":63021,"date":"2020-10-02T00:00:00","date_gmt":"2020-10-02T04:00:00","guid":{"rendered":"https:\/\/dataladder.com\/comment-identifier-les-donnees-manquantes-assurer-lexhaustivite-des-donnees-et-maintenir-lexactitude-de-vos-donnees\/"},"modified":"2022-03-28T15:00:37","modified_gmt":"2022-03-28T15:00:37","slug":"comment-identifier-les-donnees-manquantes-assurer-lexhaustivite-des-donnees-et-maintenir-lexactitude-de-vos-donnees","status":"publish","type":"post","link":"https:\/\/dataladder.com\/fr\/comment-identifier-les-donnees-manquantes-assurer-lexhaustivite-des-donnees-et-maintenir-lexactitude-de-vos-donnees\/","title":{"rendered":"Comment identifier les donn\u00e9es manquantes, assurer l&rsquo;exhaustivit\u00e9 des donn\u00e9es et maintenir l&rsquo;exactitude de vos donn\u00e9es ?"},"content":{"rendered":"<p>Les donn\u00e9es du monde r\u00e9el auront toujours des valeurs incompl\u00e8tes ou manquantes, surtout si elles sont recueillies aupr\u00e8s de plusieurs sources. Des donn\u00e9es incompl\u00e8tes peuvent donner lieu \u00e0 des rapports erron\u00e9s et \u00e0 des conclusions fauss\u00e9es dans le secteur de la recherche. Pour les entreprises, cela se traduit par une mauvaise connaissance du client, des informations commerciales inexactes et une perte de retour sur investissement.<\/p>\n<p>L&rsquo;exhaustivit\u00e9 des donn\u00e9es est donc une composante essentielle du cadre de qualit\u00e9 des donn\u00e9es et est \u00e9troitement li\u00e9e \u00e0 la validit\u00e9 et \u00e0 l&rsquo;exactitude. Si les donn\u00e9es sont manquantes, l&rsquo;information ne peut pas \u00eatre valid\u00e9e et si elle ne l&rsquo;est pas, elle ne peut pas \u00eatre consid\u00e9r\u00e9e comme exacte.<\/p>\n<p>Que vous soyez un chercheur travaillant sur des donn\u00e9es d&rsquo;enqu\u00eate, un professionnel de l&rsquo;entreprise travaillant sur des donn\u00e9es CRM ou un professionnel de l&rsquo;informatique travaillant sur des donn\u00e9es organisationnelles, vous devez \u00eatre en mesure d&rsquo;identifier les valeurs de donn\u00e9es manquantes ou incompl\u00e8tes afin de d\u00e9terminer la marche \u00e0 suivre.<\/p>\n<p>Dans ce bref article, je vais aborder les concepts cl\u00e9s suivants :<\/p>\n<ul>\n<li>Que signifie l&rsquo;absence de donn\u00e9es<\/li>\n<li>Types de donn\u00e9es manquantes<\/li>\n<li>Comment identifier les donn\u00e9es manquantes<\/li>\n<li>La signification de l&rsquo;exhaustivit\u00e9 des donn\u00e9es<\/li>\n<li>Types d&rsquo;exhaustivit\u00e9 des donn\u00e9es<\/li>\n<li>Comment mesurer l&rsquo;exhaustivit\u00e9<\/li>\n<li>Comment DataMatch Enterprise est plus efficace que Python pour identifier les donn\u00e9es manquantes<\/li>\n<\/ul>\n<h2>Que signifie l&rsquo;absence de donn\u00e9es ?<\/h2>\n<p>Les donn\u00e9es manquantes d\u00e9signent les lignes ou les colonnes dont les valeurs sont nulles, vides ou incompl\u00e8tes.<\/p>\n<p>Exemples :<\/p>\n<ul>\n<li>Noms de famille, num\u00e9ros de t\u00e9l\u00e9phone et adresses \u00e9lectroniques manquants dans un CRM<\/li>\n<li>\u00c2ge et ann\u00e9es d&#8217;emploi manquants dans un ensemble de donn\u00e9es d&rsquo;observation<\/li>\n<li>Chiffres de revenus manquants des employ\u00e9s dans les donn\u00e9es d&rsquo;organisation<\/li>\n<\/ul>\n<p>Les causes des donn\u00e9es manquantes sont nombreuses, mais peuvent \u00eatre r\u00e9sum\u00e9es \u00e0 trois raisons courantes :<\/p>\n<ul>\n<li>La r\u00e9ticence des gens \u00e0 fournir des informations (comme les revenus, l&rsquo;orientation sexuelle, etc.).<\/li>\n<li>Les erreurs de saisie de donn\u00e9es qui sont le r\u00e9sultat de mauvaises normes de donn\u00e9es (formulaires web qui n&rsquo;ont pas de champs obligatoires)<\/li>\n<li>Les champs qui ne sont pas pertinents pour le public cible (par exemple, une colonne demandant le nom de l&rsquo;entreprise sera laiss\u00e9e vide si la majorit\u00e9 des r\u00e9pondants sont des retrait\u00e9s).<\/li>\n<li>Pour les chercheurs qui s&rsquo;engagent dans des \u00e9tudes longitudinales, le taux d&rsquo;attrition (participants qui abandonnent l&rsquo;\u00e9tude) est \u00e9galement une cause majeure de donn\u00e9es manquantes.<\/li>\n<\/ul>\n<p>Dans les mod\u00e8les de recherche statistique, ces causes se traduisent par quatre types de donn\u00e9es manquantes que les chercheurs doivent identifier avant de tenter d&rsquo;y rem\u00e9dier. Bien que les statistiques sur les types de donn\u00e9es manquantes n&rsquo;entrent pas dans le cadre de cet article, je vais tout de m\u00eame vous donner un aper\u00e7u de base.<\/p>\n<p><strong><br \/>\n<em>Note : <\/em><br \/>\n<\/strong><em>Pour ceux qui souhaitent mieux comprendre les types de donn\u00e9es manquantes dans la recherche sur les soins de sant\u00e9 et les \u00e9tudes longitudinales, l&rsquo;article intitul\u00e9 <a href=\"https:\/\/www.tandfonline.com\/doi\/full\/10.1080\/00949655.2018.1520854\" rel=\"nofollow\">\u00ab\u00a0Strategies for handling missing data in longitudinal studies\u00a0\u00bb (Strat\u00e9gies de traitement des donn\u00e9es manquantes dans les \u00e9tudes longitudinales), <\/a>publi\u00e9 par le Journal of Statistical Computation and Simulation, est une excellente ressource \u00e0 consulter. <\/em><\/p>\n<h2>Types de donn\u00e9es manquantes :<\/h2>\n<p>Dans la recherche statistique, les donn\u00e9es manquantes sont class\u00e9es en quatre types :<\/p>\n<p><strong>Structurel : <\/strong>Donn\u00e9es manquantes parce qu&rsquo;elles ne devraient pas logiquement exister.<\/p>\n<p><img src=\"https:\/\/dataladder.com\/wp-content\/uploads\/2020\/10\/datacompletenessexample1-1.png\" alt=\"missing data\" width=\"417\" height=\"110\" \/><\/p>\n<p style=\"text-align: center;\"><strong>Exemple :<\/strong> Les personnes qui n&rsquo;ont pas d&rsquo;enfants laissent la colonne [No .of Children] vide. Ces personnes peuvent \u00eatre structurellement exclues de la conclusion sans que cela n&rsquo;ait d&rsquo;impact sur le r\u00e9sultat d&rsquo;une \u00e9tude, car logiquement, elles n&rsquo;ont pas besoin de remplir ce champ.<\/p>\n<p><strong>Donn\u00e9es manquantes compl\u00e8tement au hasard (MCAR) : <\/strong>Les colonnes avec des donn\u00e9es manquantes n&rsquo;ont pas d&rsquo;interd\u00e9pendance.<\/p>\n<p><img src=\"https:\/\/dataladder.com\/wp-content\/uploads\/2020\/10\/datacompletenessexample2.png\" alt=\"Missing completely at random\" width=\"422\" height=\"92\" \/><\/p>\n<p style=\"text-align: center;\"><strong>Exemple<\/strong>: les valeurs d&rsquo;\u00e2ge manquantes ne sont pas li\u00e9es aux r\u00e9sultats de la moyenne g\u00e9n\u00e9rale d&rsquo;un \u00e9l\u00e8ve dans une \u00e9tude mesurant les performances scolaires des \u00e9l\u00e8ves de la maternelle \u00e0 la terminale. Les chercheurs peuvent supposer un \u00e2ge m\u00e9dian (par exemple 16 \u00e0 18 ans pour la maternelle et le secondaire) et continuer \u00e0 conclure un rapport sans que cela n&rsquo;affecte sa cr\u00e9dibilit\u00e9.<\/p>\n<p><strong>Manquant au hasard (MAR) : <\/strong>Contrairement \u00e0 la MCAR, o\u00f9 il n&rsquo;y a aucun lien entre les valeurs manquantes et le sujet de l&rsquo;\u00e9tude, la MAR nous permet de pr\u00e9dire un mod\u00e8le en utilisant d&rsquo;autres informations sur la personne.<\/p>\n<p><img src=\"https:\/\/dataladder.com\/wp-content\/uploads\/2020\/10\/datacompletenessexample3.png\" alt=\"Missing at random\" width=\"417\" height=\"206\" \/><\/p>\n<p style=\"text-align: center;\"><strong>Exemple :<\/strong> Si l&rsquo;on se r\u00e9f\u00e8re \u00e0 l&rsquo;exemple ci-dessus, l&rsquo;\u00e2ge n&rsquo;est pas li\u00e9 aux notes de GPA, mais il a un impact sur l&#8217;emploi. Les chercheurs peuvent conclure que les \u00e9l\u00e8ves de plus de 14 ans peuvent avoir des r\u00e9sultats scolaires inf\u00e9rieurs en raison d&rsquo;un emploi \u00e0 temps partiel qui affecte leurs heures d&rsquo;\u00e9tude et leur capacit\u00e9 mentale.<\/p>\n<p><strong>Donn\u00e9es manquantes non al\u00e9atoires (MNAR) : <\/strong>L\u00e9g\u00e8rement d\u00e9routant, MNAR se r\u00e9f\u00e8re aux donn\u00e9es qui sont volontairement manquantes &#8211; c&rsquo;est-\u00e0-dire que les personnes refusent de r\u00e9pondre. Par exemple, dans l&rsquo;\u00e9tude ci-dessus, la plupart des jeunes de 14 ans *pourraient* refuser de remplir leurs heures de travail r\u00e9elles. Les donn\u00e9es MNAR sont tr\u00e8s probl\u00e9matiques car vous ne pouvez pas conclure ou supposer une raison sp\u00e9cifique et vous ne pouvez pas non plus utiliser les m\u00e9thodes standard de traitement des donn\u00e9es manquantes pour obtenir une r\u00e9ponse concluante.<\/p>\n<p><em><strong>Dans le monde des affaires, la nature des donn\u00e9es manquantes ou incompl\u00e8tes est diff\u00e9rente. Bien que vous n&rsquo;ayez pas \u00e0 vous occuper des probl\u00e8mes de MAR et de MNAR, vous devez vous occuper des informations de contact manquantes.<\/strong><\/em> (num\u00e9ros de t\u00e9l\u00e9phone, noms de famille, adresses \u00e9lectroniques, adresses, codes postaux, etc.)<\/p>\n<h2>Comment les donn\u00e9es manquantes sont-elles identifi\u00e9es ?<\/h2>\n<p>Les chercheurs qui travaillent avec des programmes statistiques tels que SAS, SPSS, Stata doivent utiliser des proc\u00e9dures statistiques manuelles pour identifier, supprimer et remplacer les valeurs manquantes. Mais il y a un probl\u00e8me.<\/p>\n<p>La plupart de ces programmes suppriment automatiquement les valeurs manquantes de toute analyse que vous ex\u00e9cutez, ce qui explique pourquoi diff\u00e9rentes variables pr\u00e9sentent des quantit\u00e9s diff\u00e9rentes de donn\u00e9es manquantes. Les chercheurs doivent donc v\u00e9rifier qu&rsquo;il n&rsquo;y a pas de donn\u00e9es manquantes dans un ensemble de donn\u00e9es <strong>avant de<\/strong> pouvoir d\u00e9cider de ce qu&rsquo;il faut supprimer. Ce processus est manuel et exige des connaissances sp\u00e9cifiques de la plateforme en plus de la ma\u00eetrise de Python &#8211; le langage utilis\u00e9 pour coder les algorithmes de d\u00e9tection des donn\u00e9es manquantes.<\/p>\n<p>D\u00e9terminer les donn\u00e9es manquantes n&rsquo;est que la premi\u00e8re \u00e9tape du probl\u00e8me. Vous devrez effectuer un codage suppl\u00e9mentaire pour remplacer les valeurs manquantes par des imputations (c&rsquo;est-\u00e0-dire utiliser la moyenne, la m\u00e9diane pour remplacer les valeurs manquantes). Vous devrez faire correspondre manuellement les colonnes, \u00e9crire des codes et r\u00e9p\u00e9ter le processus jusqu&rsquo;\u00e0 ce que le r\u00e9sultat souhait\u00e9 soit atteint. \u00c0 une \u00e9poque o\u00f9 la rapidit\u00e9 est la norme, vous ne pouvez pas vous permettre de passer des mois \u00e0 identifier les valeurs manquantes et \u00e0 les r\u00e9soudre.<\/p>\n<p>Le m\u00eame probl\u00e8me s&rsquo;applique \u00e9galement aux environnements professionnels. Les CRM \u00e9taient cens\u00e9s all\u00e9ger la charge de la gestion des donn\u00e9es, mais les probl\u00e8mes de donn\u00e9es manquantes restent un d\u00e9fi important. Les utilisateurs doivent identifier manuellement les valeurs manquantes et les nettoyer en exportant les donn\u00e9es vers un format XLS pour effectuer des modifications en masse. S&rsquo;il ne s&rsquo;agit que d&rsquo;informations de contact de base manquantes, cela peut \u00eatre corrig\u00e9 avec Excel, mais que faire si la nature des donn\u00e9es manquantes va au-del\u00e0 des informations de contact ? Et s&rsquo;il s&rsquo;agit de donn\u00e9es firmographiques ou psychographiques ?<\/p>\n<p>Comment d\u00e9couvrir des noms de soci\u00e9t\u00e9s incomplets (tels que BOSE [a brand] ou BOSE Corporation [a company]). Pas si facile \u00e0 faire manuellement !<\/p>\n<p>La question la plus importante \u00e0 laquelle il faut r\u00e9pondre est la suivante : comment limiter les probl\u00e8mes de donn\u00e9es manquantes et garantir l&rsquo;exhaustivit\u00e9 des donn\u00e9es ?<\/p>\n<h2>Qu&rsquo;est-ce que l&rsquo;exhaustivit\u00e9 des donn\u00e9es et comment la mesurer ?<\/h2>\n<p><em><strong>Dans le cadre de la qualit\u00e9 des donn\u00e9es, l&rsquo;exhaustivit\u00e9 des donn\u00e9es fait r\u00e9f\u00e9rence au degr\u00e9 de disponibilit\u00e9 de toutes les donn\u00e9es d&rsquo;un ensemble de donn\u00e9es. Une mesure de l&rsquo;exhaustivit\u00e9 des donn\u00e9es est le pourcentage d&rsquo;entr\u00e9es de donn\u00e9es manquantes. <\/strong><\/em><\/p>\n<p><strong>Par exemple, une colonne de 500 avec 100 champs manquants a un degr\u00e9 de compl\u00e9tude de 80%. En fonction de votre activit\u00e9, 20 % d&rsquo;entr\u00e9es manquantes peuvent se traduire par la perte de centaines de milliers de dollars de prospects et de pistes ! <\/strong><\/p>\n<p>Cela dit, l&rsquo;exhaustivit\u00e9 des donn\u00e9es ne consiste pas \u00e0 garantir que 100 % de vos champs sont complets. Il s&rsquo;agit de d\u00e9terminer quels \u00e9l\u00e9ments d&rsquo;information sont essentiels et lesquels sont facultatifs. Par exemple, vous aurez certainement besoin de num\u00e9ros de t\u00e9l\u00e9phone, mais peut-\u00eatre pas de num\u00e9ros de fax.<\/p>\n<p>L&rsquo;exhaustivit\u00e9 indique le niveau d&rsquo;informations et de connaissances dont vous disposez sur votre client et le degr\u00e9 d&rsquo;exactitude de ces informations. Par exemple, dans les donn\u00e9es de contact, les enfants et les personnes \u00e2g\u00e9es peuvent ne pas avoir d&rsquo;adresse \u00e9lectronique ou certains contacts peuvent ne pas avoir de num\u00e9ro de t\u00e9l\u00e9phone fixe ou de travail.<\/p>\n<p>L&rsquo;exhaustivit\u00e9 des donn\u00e9es <strong>n&rsquo;implique <\/strong>donc <strong>pas que tous les attributs des donn\u00e9es doivent \u00eatre pr\u00e9sents ou renseign\u00e9s. Vous devrez plut\u00f4t classer et choisir les ensembles de donn\u00e9es qu&rsquo;il est important de conserver et ceux qui peuvent \u00eatre ignor\u00e9s. <\/strong><\/p>\n<h2>Comment l&rsquo;exhaustivit\u00e9 des donn\u00e9es est-elle \u00e9valu\u00e9e ?<\/h2>\n<p>Traditionnellement, dans l&rsquo;entrep\u00f4t de donn\u00e9es, la compl\u00e9tude des donn\u00e9es est \u00e9valu\u00e9e par des tests ETL qui utilisent des fonctions d&rsquo;agr\u00e9gation telles que <strong>(somme, max, min, nombre)<\/strong> pour \u00e9valuer la compl\u00e9tude moyenne d&rsquo;une colonne ou d&rsquo;un enregistrement. En outre, la validation du profil des donn\u00e9es est \u00e9galement effectu\u00e9e par des instructions manuelles \u00e0 l&rsquo;aide de commandes telles que :<\/p>\n<p><img src=\"https:\/\/dataladder.com\/wp-content\/uploads\/2020\/10\/functionsformissingdata.png\" alt=\"\" width=\"399\" height=\"58\" \/><\/p>\n<p>pour comparer des valeurs distinctes et le nombre de lignes pour chaque valeur distincte. Cependant, avant d&rsquo;ex\u00e9cuter les commandes, l&rsquo;utilisateur devra d\u00e9terminer le type d&rsquo;incompl\u00e9tude auquel il a affaire et \u00e9tablir le type de probl\u00e8me de qualit\u00e9 des donn\u00e9es qui affecte les donn\u00e9es. Par exemple, si tous les num\u00e9ros de t\u00e9l\u00e9phone ne comportent pas d&rsquo;indicatif de ville, il peut s&rsquo;agir d&rsquo;un probl\u00e8me de qualit\u00e9 des donn\u00e9es au niveau de l&rsquo;entr\u00e9e. Si plus de 50 % de l&rsquo;auditoire ne fournit pas de r\u00e9ponse \u00e0 un probl\u00e8me sp\u00e9cifique, il peut s&rsquo;agir d&rsquo;un probl\u00e8me MNAR (missing not at random).<\/p>\n<p>Tout cela est formidable. Mais il y a une \u00e9tape importante que tous les utilisateurs ratent :<\/p>\n<p>Vous ne pouvez pas nettoyer, supprimer ou remplacer les valeurs manquantes si vous ne savez pas ce qui manque et quel pourcentage de ces donn\u00e9es manquantes est tol\u00e9rable.<\/p>\n<p>Et cela se fait par le biais du profilage des donn\u00e9es !<\/p>\n<h2>Profilage des donn\u00e9es &#8211; La premi\u00e8re \u00e9tape pour v\u00e9rifier l&rsquo;exhaustivit\u00e9 des donn\u00e9es et identifier les valeurs manquantes au niveau des attributs<\/h2>\n<p>Le profilage des donn\u00e9es est le processus d&rsquo;\u00e9valuation de votre ensemble de donn\u00e9es pour identifier une s\u00e9rie de probl\u00e8mes, notamment :<\/p>\n<ul>\n<li>Valeurs et enregistrements manquants<\/li>\n<li>Erreurs de donn\u00e9es telles que des fautes de frappe<\/li>\n<li>Anomalies au niveau des attributs (utilisation de signes de ponctuation ou d&rsquo;espaces n\u00e9gatifs dans les champs)<\/li>\n<li>Probl\u00e8mes de normalisation (incoh\u00e9rence des formats NYC vs New York)<\/li>\n<\/ul>\n<p>et plus encore.<\/p>\n<p>Le profilage des donn\u00e9es est une t\u00e2che exhaustive.<\/p>\n<p>Id\u00e9alement, vous souhaitez pouvoir jeter un coup d&rsquo;\u0153il aux donn\u00e9es des clients et identifier facilement ou rapidement les valeurs nulles dans les donn\u00e9es. Vous pouvez le faire manuellement en examinant chaque colonne ind\u00e9pendamment ou en utilisant des algorithmes.<\/p>\n<p>Python permet \u00e0 l&rsquo;utilisateur de trier ses donn\u00e9es en fonction de sa perception et de sa compr\u00e9hension. Si cela est id\u00e9al en termes de contr\u00f4le et de personnalisation, ce n&rsquo;est pas l&rsquo;id\u00e9al si vous \u00eates press\u00e9 par le temps et la pr\u00e9cision.<\/p>\n<p>Vous devrez constamment cr\u00e9er et r\u00e9viser les codes. Vous devrez continuer \u00e0 tester, mesurer et analyser les r\u00e9sultats. Non seulement cela est contre-productif, mais cela va \u00e0 l&rsquo;encontre de l&rsquo;objectif d&rsquo;utiliser les donn\u00e9es pour atteindre des objectifs en temps r\u00e9el.<\/p>\n<p>Vos \u00e9quipes marketing peuvent-elles attendre 4 mois pour que vous nettoyiez, d\u00e9duisiez et consolidiez les donn\u00e9es clients provenant de sources multiples ?<\/p>\n<p>Votre organisation peut-elle se permettre de perdre du ROI \u00e0 chaque jour qui passe et qui entra\u00eene une perte de ROI ? Pas vraiment.<\/p>\n<h2>Utilisation d&rsquo;une solution bas\u00e9e sur le ML comme DataMatch Enterprise par rapport aux scripts Python ou aux outils ETL<\/h2>\n<p>Les outils de scripting et d&rsquo;ETL en Python sont id\u00e9aux parce que vous en avez le contr\u00f4le. L&rsquo;utilisation d&rsquo;un outil automatis\u00e9 ne signifie pas que vous abandonnez le contr\u00f4le ou que vous renoncez \u00e0 l&rsquo;utilit\u00e9 de ces plateformes. Cela signifie simplement que vous <strong>acc\u00e9l\u00e9rez le processus et que vous l&rsquo;automatisez si n\u00e9cessaire. <\/strong><\/p>\n<p>Une solution d&rsquo;apprentissage automatique comme <a href=\"https:\/\/dataladder.com\/fr\/produits\/datamatch-enterprise-classe-premier-produit-de-gestion-de-la-qualite-des-donnees\/\">DataMatch Enterprise<\/a> de Data Ladder &#8211; une solution de gestion de la qualit\u00e9 des donn\u00e9es qui vous permet d&rsquo;identifier les valeurs manquantes et les informations incompl\u00e8tes sans avoir besoin de codes ou de scripts.<\/p>\n<p>Gr\u00e2ce \u00e0 la fonction de <a href=\"https:\/\/dataladder.com\/fr\/logiciels-et-outils-de-profilage-de-donnees-obtenez-des-resultats-instantanes-devaluation-de-la-qualite-des-donnees\/\">profilage des donn\u00e9es<\/a> de DME, vous pouvez v\u00e9rifier le pourcentage de compl\u00e9tude des donn\u00e9es au niveau des attributs (ce qui est complexe \u00e0 r\u00e9aliser via l&rsquo;ETL ou le codage).<\/p>\n<p>Par exemple, si 30 enregistrements sur 100 ont des valeurs manquantes, ils sont automatiquement mis en \u00e9vidence pour que vous puissiez les examiner. Un score de sant\u00e9 vous est \u00e9galement attribu\u00e9 pour chaque colonne. Dans ce cas, votre colonne Nom a un score de sant\u00e9 de 70%. Tout cela se fait en l&rsquo;espace de 10 minutes seulement. Vous vous \u00e9pargnez des <strong>heures de r\u00e9vision manuelle, de test d&rsquo;algorithmes et de r\u00e9daction\/r\u00e9\u00e9criture de d\u00e9finitions <\/strong>pour simplement v\u00e9rifier <a href=\"https:\/\/dataladder.com\/fr\/quest-ce-que-lexactitude-des-donnees-pourquoi-cest-important-et-comment-les-entreprises-peuvent-sassurer-quelles-disposent-de-donnees-exactes\/\">l&rsquo;exactitude ou l&rsquo;exhaustivit\u00e9 de vos donn\u00e9es<\/a>.<\/p>\n<p><img src=\"https:\/\/dataladder.com\/wp-content\/uploads\/2020\/09\/Profiling-customer-data-1.png\" alt=\"DataMatch Enterprise vs Python Scripting or ETL Tools\" width=\"540\" height=\"332\" \/><\/p>\n<p>Ce n&rsquo;est pas tout.<\/p>\n<p>Parfois, vous \u00eates \u00e9galement amen\u00e9 \u00e0 <strong>consolider des donn\u00e9es et \u00e0 d\u00e9dupliquer des donn\u00e9es redondantes. <\/strong>Par exemple, vous d\u00e9couvrez que les informations relatives \u00e0 votre client sont stock\u00e9es dans deux sources de donn\u00e9es distinctes. Une seule source contient tout ce dont vous avez besoin &#8211; num\u00e9ros de t\u00e9l\u00e9phone, adresses \u00e9lectroniques, localisation, etc. L&rsquo;autre source contient des informations dont vous n&rsquo;avez pas n\u00e9cessairement besoin &#8211; \u00e2ge, sexe, num\u00e9ros de fax, etc. Vous voulez combiner les deux, et soit <a href=\"https:\/\/dataladder.com\/fr\/logiciel-merge-purge-utiliser-des-regles-de-survie-integrees-et-personnalisees\/\">fusionner ou purger<\/a> ces informations pour assurer l&rsquo;exhaustivit\u00e9. Imaginez le temps et les processus que vous devrez passer pour y parvenir ? La simple pens\u00e9e est \u00e9puisante.<\/p>\n<p>Avec un outil comme DME, vous pouvez <a href=\"https:\/\/dataladder.com\/fr\/logiciel-de-correspondance-de-donnees-classe-parmi-les-meilleurs-de-sa-categorie-avec-une-precision-de-correspondance-de-96\/\">faire correspondre<\/a> et <a href=\"https:\/\/dataladder.com\/fr\/logiciel-de-deduplication-de-donnees-utilisez-des-regles-integrees-et-personnalisees-pour-la-deduplication-crm\/\">d\u00e9duire<\/a> un million d&rsquo;enregistrements en 20 minutes !<\/p>\n<h2>Le v\u00e9ritable objectif de l&rsquo;exhaustivit\u00e9 des donn\u00e9es<\/h2>\n<p>C&rsquo;est facile de <strong>ignorer les valeurs manquantes et proc\u00e9der \u00e0 la compilation de rapports ou \u00e0 la r\u00e9alisation d&rsquo;activit\u00e9s en sachant que vous avez des donn\u00e9es manquantes. <\/strong>Il en r\u00e9sulte des t\u00e2ches qui donnent lieu \u00e0 des r\u00e9ponses m\u00e9diocres (comme une campagne de marketing par courrier \u00e9lectronique qui n&rsquo;a pas tenu compte des noms de famille manquants et qui a d\u00fb se battre avec des doublons), des rapports dont les conclusions sont trompeuses et qui ont un impact sur les politiques et les r\u00e9formes essentielles, des plans d&rsquo;affaires qui \u00e9chouent et des erreurs qui ont des implications juridiques.<\/p>\n<p>Cela dit, le v\u00e9ritable objectif de l&rsquo;exhaustivit\u00e9 des donn\u00e9es n&rsquo;est donc pas d&rsquo;avoir des donn\u00e9es parfaites \u00e0 100 %. Il s&rsquo;agit de s&rsquo;assurer que les donn\u00e9es essentielles \u00e0 votre objectif sont<strong> valides, compl\u00e8tes, exactes et utilisables<\/strong>. Les outils que vous avez \u00e0 votre disposition, tels que le DME, sont des technologies qui vous aideront \u00e0 y parvenir.<\/p>\n\n","protected":false},"excerpt":{"rendered":"<p>Les donn\u00e9es du monde r\u00e9el auront toujours des valeurs incompl\u00e8tes ou manquantes, surtout si elles sont recueillies aupr\u00e8s de plusieurs sources. Des donn\u00e9es incompl\u00e8tes peuvent donner lieu \u00e0 des rapports erron\u00e9s et \u00e0 des conclusions fauss\u00e9es dans le secteur de la recherche. Pour les entreprises, cela se traduit par une mauvaise connaissance du client, des [&hellip;]<\/p>\n","protected":false},"author":9,"featured_media":58352,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"_lmt_disableupdate":"","_lmt_disable":"","_links_to":"","_links_to_target":""},"categories":[1342],"tags":[701,700,517,485],"acf":[],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v19.9 - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>Comment identifier les donn\u00e9es manquantes, assurer l&#039;exhaustivit\u00e9 des donn\u00e9es et maintenir l&#039;exactitude de vos donn\u00e9es ? - Data Ladder<\/title>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/dataladder.com\/fr\/comment-identifier-les-donnees-manquantes-assurer-lexhaustivite-des-donnees-et-maintenir-lexactitude-de-vos-donnees\/\" \/>\n<meta property=\"og:locale\" content=\"fr_FR\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Comment identifier les donn\u00e9es manquantes, assurer l&#039;exhaustivit\u00e9 des donn\u00e9es et maintenir l&#039;exactitude de vos donn\u00e9es ? - Data Ladder\" \/>\n<meta property=\"og:description\" content=\"Les donn\u00e9es du monde r\u00e9el auront toujours des valeurs incompl\u00e8tes ou manquantes, surtout si elles sont recueillies aupr\u00e8s de plusieurs sources. Des donn\u00e9es incompl\u00e8tes peuvent donner lieu \u00e0 des rapports erron\u00e9s et \u00e0 des conclusions fauss\u00e9es dans le secteur de la recherche. Pour les entreprises, cela se traduit par une mauvaise connaissance du client, des [&hellip;]\" \/>\n<meta property=\"og:url\" content=\"https:\/\/dataladder.com\/fr\/comment-identifier-les-donnees-manquantes-assurer-lexhaustivite-des-donnees-et-maintenir-lexactitude-de-vos-donnees\/\" \/>\n<meta property=\"og:site_name\" content=\"Data Ladder\" \/>\n<meta property=\"article:publisher\" content=\"https:\/\/web.facebook.com\/DataLadderSoftware\" \/>\n<meta property=\"article:published_time\" content=\"2020-10-02T04:00:00+00:00\" \/>\n<meta property=\"article:modified_time\" content=\"2022-03-28T15:00:37+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/dataladder.com\/wp-content\/uploads\/2021\/09\/Easy-Identification-of-Missing-Information-Identify-Gaps-in-Data-Entry-Procedures_Excel-Deduplication-Graphic.png\" \/>\n\t<meta property=\"og:image:width\" content=\"1943\" \/>\n\t<meta property=\"og:image:height\" content=\"1919\" \/>\n\t<meta property=\"og:image:type\" content=\"image\/png\" \/>\n<meta name=\"author\" content=\"lbarrera\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"\u00c9crit par\" \/>\n\t<meta name=\"twitter:data1\" content=\"lbarrera\" \/>\n\t<meta name=\"twitter:label2\" content=\"Dur\u00e9e de lecture estim\u00e9e\" \/>\n\t<meta name=\"twitter:data2\" content=\"12 minutes\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"Article\",\"@id\":\"https:\/\/dataladder.com\/fr\/comment-identifier-les-donnees-manquantes-assurer-lexhaustivite-des-donnees-et-maintenir-lexactitude-de-vos-donnees\/#article\",\"isPartOf\":{\"@id\":\"https:\/\/dataladder.com\/fr\/comment-identifier-les-donnees-manquantes-assurer-lexhaustivite-des-donnees-et-maintenir-lexactitude-de-vos-donnees\/\"},\"author\":{\"name\":\"lbarrera\",\"@id\":\"https:\/\/dataladder.com\/fr\/#\/schema\/person\/6cc3d6b3c83c611546541b5eb2d1e21b\"},\"headline\":\"Comment identifier les donn\u00e9es manquantes, assurer l&rsquo;exhaustivit\u00e9 des donn\u00e9es et maintenir l&rsquo;exactitude de vos donn\u00e9es ?\",\"datePublished\":\"2020-10-02T04:00:00+00:00\",\"dateModified\":\"2022-03-28T15:00:37+00:00\",\"mainEntityOfPage\":{\"@id\":\"https:\/\/dataladder.com\/fr\/comment-identifier-les-donnees-manquantes-assurer-lexhaustivite-des-donnees-et-maintenir-lexactitude-de-vos-donnees\/\"},\"wordCount\":2828,\"publisher\":{\"@id\":\"https:\/\/dataladder.com\/fr\/#organization\"},\"keywords\":[\"donn\u00e9es manquantes\",\"exhaustivit\u00e9 des donn\u00e9es\",\"la qualit\u00e9 des donn\u00e9es\",\"Profilage des donn\u00e9es\"],\"articleSection\":[\"Mesures de la qualit\u00e9 des donn\u00e9es\"],\"inLanguage\":\"fr-FR\"},{\"@type\":\"WebPage\",\"@id\":\"https:\/\/dataladder.com\/fr\/comment-identifier-les-donnees-manquantes-assurer-lexhaustivite-des-donnees-et-maintenir-lexactitude-de-vos-donnees\/\",\"url\":\"https:\/\/dataladder.com\/fr\/comment-identifier-les-donnees-manquantes-assurer-lexhaustivite-des-donnees-et-maintenir-lexactitude-de-vos-donnees\/\",\"name\":\"Comment identifier les donn\u00e9es manquantes, assurer l'exhaustivit\u00e9 des donn\u00e9es et maintenir l'exactitude de vos donn\u00e9es ? - Data Ladder\",\"isPartOf\":{\"@id\":\"https:\/\/dataladder.com\/fr\/#website\"},\"datePublished\":\"2020-10-02T04:00:00+00:00\",\"dateModified\":\"2022-03-28T15:00:37+00:00\",\"breadcrumb\":{\"@id\":\"https:\/\/dataladder.com\/fr\/comment-identifier-les-donnees-manquantes-assurer-lexhaustivite-des-donnees-et-maintenir-lexactitude-de-vos-donnees\/#breadcrumb\"},\"inLanguage\":\"fr-FR\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/dataladder.com\/fr\/comment-identifier-les-donnees-manquantes-assurer-lexhaustivite-des-donnees-et-maintenir-lexactitude-de-vos-donnees\/\"]}]},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/dataladder.com\/fr\/comment-identifier-les-donnees-manquantes-assurer-lexhaustivite-des-donnees-et-maintenir-lexactitude-de-vos-donnees\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Home\",\"item\":\"https:\/\/dataladder.com\/fr\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Comment identifier les donn\u00e9es manquantes, assurer l&#8217;exhaustivit\u00e9 des donn\u00e9es et maintenir l&#8217;exactitude de vos donn\u00e9es ?\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/dataladder.com\/fr\/#website\",\"url\":\"https:\/\/dataladder.com\/fr\/\",\"name\":\"Data Ladder\",\"description\":\"Enterprise Data Profiling, Cleansing, and Matching\",\"publisher\":{\"@id\":\"https:\/\/dataladder.com\/fr\/#organization\"},\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/dataladder.com\/fr\/?s={search_term_string}\"},\"query-input\":\"required name=search_term_string\"}],\"inLanguage\":\"fr-FR\"},{\"@type\":\"Organization\",\"@id\":\"https:\/\/dataladder.com\/fr\/#organization\",\"name\":\"Data Ladder\",\"url\":\"https:\/\/dataladder.com\/fr\/\",\"logo\":{\"@type\":\"ImageObject\",\"inLanguage\":\"fr-FR\",\"@id\":\"https:\/\/dataladder.com\/fr\/#\/schema\/logo\/image\/\",\"url\":\"https:\/\/dataladder.com\/wp-content\/uploads\/2018\/06\/DL-Logo-Ball-30.png\",\"contentUrl\":\"https:\/\/dataladder.com\/wp-content\/uploads\/2018\/06\/DL-Logo-Ball-30.png\",\"width\":413,\"height\":408,\"caption\":\"Data Ladder\"},\"image\":{\"@id\":\"https:\/\/dataladder.com\/fr\/#\/schema\/logo\/image\/\"},\"sameAs\":[\"https:\/\/www.linkedin.com\/company\/dataladder-llc\/\",\"https:\/\/web.facebook.com\/DataLadderSoftware\"]},{\"@type\":\"Person\",\"@id\":\"https:\/\/dataladder.com\/fr\/#\/schema\/person\/6cc3d6b3c83c611546541b5eb2d1e21b\",\"name\":\"lbarrera\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"fr-FR\",\"@id\":\"https:\/\/dataladder.com\/fr\/#\/schema\/person\/image\/\",\"url\":\"https:\/\/secure.gravatar.com\/avatar\/5198cb4dd374e7d879a15a9cf20299b3?s=96&d=mm&r=g\",\"contentUrl\":\"https:\/\/secure.gravatar.com\/avatar\/5198cb4dd374e7d879a15a9cf20299b3?s=96&d=mm&r=g\",\"caption\":\"lbarrera\"},\"url\":\"https:\/\/dataladder.com\/fr\/author\/lbarrera\/\"}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Comment identifier les donn\u00e9es manquantes, assurer l'exhaustivit\u00e9 des donn\u00e9es et maintenir l'exactitude de vos donn\u00e9es ? - Data Ladder","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/dataladder.com\/fr\/comment-identifier-les-donnees-manquantes-assurer-lexhaustivite-des-donnees-et-maintenir-lexactitude-de-vos-donnees\/","og_locale":"fr_FR","og_type":"article","og_title":"Comment identifier les donn\u00e9es manquantes, assurer l'exhaustivit\u00e9 des donn\u00e9es et maintenir l'exactitude de vos donn\u00e9es ? - Data Ladder","og_description":"Les donn\u00e9es du monde r\u00e9el auront toujours des valeurs incompl\u00e8tes ou manquantes, surtout si elles sont recueillies aupr\u00e8s de plusieurs sources. Des donn\u00e9es incompl\u00e8tes peuvent donner lieu \u00e0 des rapports erron\u00e9s et \u00e0 des conclusions fauss\u00e9es dans le secteur de la recherche. Pour les entreprises, cela se traduit par une mauvaise connaissance du client, des [&hellip;]","og_url":"https:\/\/dataladder.com\/fr\/comment-identifier-les-donnees-manquantes-assurer-lexhaustivite-des-donnees-et-maintenir-lexactitude-de-vos-donnees\/","og_site_name":"Data Ladder","article_publisher":"https:\/\/web.facebook.com\/DataLadderSoftware","article_published_time":"2020-10-02T04:00:00+00:00","article_modified_time":"2022-03-28T15:00:37+00:00","og_image":[{"width":1943,"height":1919,"url":"https:\/\/dataladder.com\/wp-content\/uploads\/2021\/09\/Easy-Identification-of-Missing-Information-Identify-Gaps-in-Data-Entry-Procedures_Excel-Deduplication-Graphic.png","type":"image\/png"}],"author":"lbarrera","twitter_card":"summary_large_image","twitter_misc":{"\u00c9crit par":"lbarrera","Dur\u00e9e de lecture estim\u00e9e":"12 minutes"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"Article","@id":"https:\/\/dataladder.com\/fr\/comment-identifier-les-donnees-manquantes-assurer-lexhaustivite-des-donnees-et-maintenir-lexactitude-de-vos-donnees\/#article","isPartOf":{"@id":"https:\/\/dataladder.com\/fr\/comment-identifier-les-donnees-manquantes-assurer-lexhaustivite-des-donnees-et-maintenir-lexactitude-de-vos-donnees\/"},"author":{"name":"lbarrera","@id":"https:\/\/dataladder.com\/fr\/#\/schema\/person\/6cc3d6b3c83c611546541b5eb2d1e21b"},"headline":"Comment identifier les donn\u00e9es manquantes, assurer l&rsquo;exhaustivit\u00e9 des donn\u00e9es et maintenir l&rsquo;exactitude de vos donn\u00e9es ?","datePublished":"2020-10-02T04:00:00+00:00","dateModified":"2022-03-28T15:00:37+00:00","mainEntityOfPage":{"@id":"https:\/\/dataladder.com\/fr\/comment-identifier-les-donnees-manquantes-assurer-lexhaustivite-des-donnees-et-maintenir-lexactitude-de-vos-donnees\/"},"wordCount":2828,"publisher":{"@id":"https:\/\/dataladder.com\/fr\/#organization"},"keywords":["donn\u00e9es manquantes","exhaustivit\u00e9 des donn\u00e9es","la qualit\u00e9 des donn\u00e9es","Profilage des donn\u00e9es"],"articleSection":["Mesures de la qualit\u00e9 des donn\u00e9es"],"inLanguage":"fr-FR"},{"@type":"WebPage","@id":"https:\/\/dataladder.com\/fr\/comment-identifier-les-donnees-manquantes-assurer-lexhaustivite-des-donnees-et-maintenir-lexactitude-de-vos-donnees\/","url":"https:\/\/dataladder.com\/fr\/comment-identifier-les-donnees-manquantes-assurer-lexhaustivite-des-donnees-et-maintenir-lexactitude-de-vos-donnees\/","name":"Comment identifier les donn\u00e9es manquantes, assurer l'exhaustivit\u00e9 des donn\u00e9es et maintenir l'exactitude de vos donn\u00e9es ? - Data Ladder","isPartOf":{"@id":"https:\/\/dataladder.com\/fr\/#website"},"datePublished":"2020-10-02T04:00:00+00:00","dateModified":"2022-03-28T15:00:37+00:00","breadcrumb":{"@id":"https:\/\/dataladder.com\/fr\/comment-identifier-les-donnees-manquantes-assurer-lexhaustivite-des-donnees-et-maintenir-lexactitude-de-vos-donnees\/#breadcrumb"},"inLanguage":"fr-FR","potentialAction":[{"@type":"ReadAction","target":["https:\/\/dataladder.com\/fr\/comment-identifier-les-donnees-manquantes-assurer-lexhaustivite-des-donnees-et-maintenir-lexactitude-de-vos-donnees\/"]}]},{"@type":"BreadcrumbList","@id":"https:\/\/dataladder.com\/fr\/comment-identifier-les-donnees-manquantes-assurer-lexhaustivite-des-donnees-et-maintenir-lexactitude-de-vos-donnees\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Home","item":"https:\/\/dataladder.com\/fr\/"},{"@type":"ListItem","position":2,"name":"Comment identifier les donn\u00e9es manquantes, assurer l&#8217;exhaustivit\u00e9 des donn\u00e9es et maintenir l&#8217;exactitude de vos donn\u00e9es ?"}]},{"@type":"WebSite","@id":"https:\/\/dataladder.com\/fr\/#website","url":"https:\/\/dataladder.com\/fr\/","name":"Data Ladder","description":"Enterprise Data Profiling, Cleansing, and Matching","publisher":{"@id":"https:\/\/dataladder.com\/fr\/#organization"},"potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/dataladder.com\/fr\/?s={search_term_string}"},"query-input":"required name=search_term_string"}],"inLanguage":"fr-FR"},{"@type":"Organization","@id":"https:\/\/dataladder.com\/fr\/#organization","name":"Data Ladder","url":"https:\/\/dataladder.com\/fr\/","logo":{"@type":"ImageObject","inLanguage":"fr-FR","@id":"https:\/\/dataladder.com\/fr\/#\/schema\/logo\/image\/","url":"https:\/\/dataladder.com\/wp-content\/uploads\/2018\/06\/DL-Logo-Ball-30.png","contentUrl":"https:\/\/dataladder.com\/wp-content\/uploads\/2018\/06\/DL-Logo-Ball-30.png","width":413,"height":408,"caption":"Data Ladder"},"image":{"@id":"https:\/\/dataladder.com\/fr\/#\/schema\/logo\/image\/"},"sameAs":["https:\/\/www.linkedin.com\/company\/dataladder-llc\/","https:\/\/web.facebook.com\/DataLadderSoftware"]},{"@type":"Person","@id":"https:\/\/dataladder.com\/fr\/#\/schema\/person\/6cc3d6b3c83c611546541b5eb2d1e21b","name":"lbarrera","image":{"@type":"ImageObject","inLanguage":"fr-FR","@id":"https:\/\/dataladder.com\/fr\/#\/schema\/person\/image\/","url":"https:\/\/secure.gravatar.com\/avatar\/5198cb4dd374e7d879a15a9cf20299b3?s=96&d=mm&r=g","contentUrl":"https:\/\/secure.gravatar.com\/avatar\/5198cb4dd374e7d879a15a9cf20299b3?s=96&d=mm&r=g","caption":"lbarrera"},"url":"https:\/\/dataladder.com\/fr\/author\/lbarrera\/"}]}},"modified_by":null,"_links":{"self":[{"href":"https:\/\/dataladder.com\/fr\/wp-json\/wp\/v2\/posts\/63021"}],"collection":[{"href":"https:\/\/dataladder.com\/fr\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/dataladder.com\/fr\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/dataladder.com\/fr\/wp-json\/wp\/v2\/users\/9"}],"replies":[{"embeddable":true,"href":"https:\/\/dataladder.com\/fr\/wp-json\/wp\/v2\/comments?post=63021"}],"version-history":[{"count":1,"href":"https:\/\/dataladder.com\/fr\/wp-json\/wp\/v2\/posts\/63021\/revisions"}],"predecessor-version":[{"id":66555,"href":"https:\/\/dataladder.com\/fr\/wp-json\/wp\/v2\/posts\/63021\/revisions\/66555"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/dataladder.com\/fr\/wp-json\/wp\/v2\/media\/58352"}],"wp:attachment":[{"href":"https:\/\/dataladder.com\/fr\/wp-json\/wp\/v2\/media?parent=63021"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/dataladder.com\/fr\/wp-json\/wp\/v2\/categories?post=63021"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/dataladder.com\/fr\/wp-json\/wp\/v2\/tags?post=63021"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}