{"id":63019,"date":"2020-10-12T00:00:00","date_gmt":"2020-10-12T04:00:00","guid":{"rendered":"https:\/\/dataladder.com\/la-hantise-des-donnees-dupliquees-un-guide-de-la-deduplication-des-donnees\/"},"modified":"2022-03-28T14:53:29","modified_gmt":"2022-03-28T14:53:29","slug":"la-hantise-des-donnees-dupliquees-un-guide-de-la-deduplication-des-donnees","status":"publish","type":"post","link":"https:\/\/dataladder.com\/fr\/la-hantise-des-donnees-dupliquees-un-guide-de-la-deduplication-des-donnees\/","title":{"rendered":"La hantise des donn\u00e9es dupliqu\u00e9es &#8211; Un guide de la d\u00e9duplication des donn\u00e9es"},"content":{"rendered":"<p>La duplication des donn\u00e9es est un probl\u00e8me s\u00e9rieux qui affecte les connaissances d&rsquo;une organisation, consomme de l&rsquo;espace de stockage co\u00fbteux, brouille les informations sur les clients et conduit l&rsquo;entreprise \u00e0 prendre des d\u00e9cisions erron\u00e9es. Les responsables informatiques, les analystes de donn\u00e9es et les utilisateurs professionnels sont conscients des doublons &#8211; ils y sont confront\u00e9s chaque fois qu&rsquo;ils extraient des donn\u00e9es pour un projet, mais l&rsquo;impact sur l&rsquo;ensemble de l&rsquo;entreprise ne se fait sentir que lorsque les donn\u00e9es dupliqu\u00e9es et sales deviennent la cause du blocage ou de l&rsquo;\u00e9chec d&rsquo;une initiative commerciale.<\/p>\n<p>Le processus de suppression des doublons est appel\u00e9 d\u00e9duplication des donn\u00e9es et l&rsquo;objectif est d&rsquo;<em>\u00e9viter qu&rsquo;un probl\u00e8me de doublons de donn\u00e9es <\/em>ne se transforme en<strong> crise. <\/strong><\/p>\n<p>Dans ce guide, je traiterai des sujets suivants :<\/p>\n<ul>\n<li>La v\u00e9ritable signification des donn\u00e9es dupliqu\u00e9es et leurs types<\/li>\n<li>Quelques causes courantes de doublons<\/li>\n<li>Difficult\u00e9s rencontr\u00e9es par les utilisateurs pour nettoyer\/supprimer les doublons<\/li>\n<li>Qu&rsquo;est-ce que la d\u00e9duplication des donn\u00e9es et comment fonctionne-t-elle ?<\/li>\n<li>Existe-t-il un moyen plus simple de d\u00e9duire des donn\u00e9es ?<\/li>\n<li>Comment DataMatch Enterprise aide-t-il<\/li>\n<\/ul>\n<p>Allons-y.<\/p>\n<h2>Les donn\u00e9es dupliqu\u00e9es, leurs types et pourquoi elles se produisent<\/h2>\n<p>La d\u00e9finition simple &#8211; une copie d&rsquo;un document original est un duplicata. Si tel \u00e9tait le cas, la r\u00e9solution des doublons n&rsquo;aurait jamais \u00e9t\u00e9 un probl\u00e8me.<\/p>\n<p>La duplication des donn\u00e9es est beaucoup plus complexe que ce que l&rsquo;on peut imaginer. Voici quelques types et exemples pertinents pour vous aider \u00e0 comprendre l&rsquo;\u00e9tendue des probl\u00e8mes de donn\u00e9es dupliqu\u00e9es.<\/p>\n<h3>Type 1 : Duplicatas exacts dans la m\u00eame source<\/h3>\n<p>Cela est d\u00fb \u00e0 des erreurs de saisie de donn\u00e9es, notamment le copier\/coller d&rsquo;informations d&rsquo;une source \u00e0 l&rsquo;autre. Par exemple, si vous copiez des informations d&rsquo;un outil de marketing tiers dans le CRM, vous risquez d&rsquo;enregistrer deux fois la m\u00eame information. Les doublons exacts sont faciles \u00e0 d\u00e9tecter.<\/p>\n<p><strong>Exemple : <\/strong><\/p>\n<p><strong>Les enregistrements CRM de la rang\u00e9e 1 et de la rang\u00e9e 5 ont des doublons o\u00f9 le dernier enregistrement a une lettre suppl\u00e9mentaire dans le pr\u00e9nom.<\/strong><\/p>\n<p><img class=\"aligncenter wp-image-57000 size-large\" src=\"https:\/\/dataladder.com\/wp-content\/uploads\/2020\/10\/DL-_Table-1-1024x266.png\" alt=\"\" width=\"1024\" height=\"266\" srcset=\"https:\/\/dataladder.com\/wp-content\/uploads\/2020\/10\/DL-_Table-1-1024x266.png 1024w, https:\/\/dataladder.com\/wp-content\/uploads\/2020\/10\/DL-_Table-1-300x78.png 300w, https:\/\/dataladder.com\/wp-content\/uploads\/2020\/10\/DL-_Table-1-768x199.png 768w, https:\/\/dataladder.com\/wp-content\/uploads\/2020\/10\/DL-_Table-1-1536x398.png 1536w, https:\/\/dataladder.com\/wp-content\/uploads\/2020\/10\/DL-_Table-1.png 1804w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/p>\n<p>Remarquez que la derni\u00e8re ligne comporte \u00e9galement une faute de frappe accidentelle. Le pr\u00e9nom est <strong>Mary S<\/strong>, au lieu de Mary.<\/p>\n<h3>Type 2 : Duplicatas exacts dans des sources multiples<\/h3>\n<p>La sauvegarde des donn\u00e9es est souvent la principale cause de doublons exacts dans des sources multiples. Les entreprises sont souvent r\u00e9ticentes \u00e0 l&rsquo;id\u00e9e de supprimer des donn\u00e9es. Elles ont donc tendance \u00e0 conserver des listes dans de multiples formats et sources. Par exemple, les dossiers locaux de l&rsquo;entreprise peuvent contenir une feuille Excel p\u00e9rim\u00e9e d&rsquo;enregistrements cr\u00e9\u00e9s lorsque l&rsquo;entreprise a essay\u00e9 de migrer une source de donn\u00e9es de l&rsquo;ERP vers un CRM. Au fil du temps, les copies de ces donn\u00e9es causent d&rsquo;importants probl\u00e8mes de stockage sur le disque et de performances du syst\u00e8me. L&rsquo;une des principales motivations des utilisateurs informatiques pour d\u00e9duire des donn\u00e9es est de lib\u00e9rer de l&rsquo;espace de stockage !<\/p>\n<p><strong>Exemple : <\/strong><\/p>\n<p><strong>Duplicatas exacts dans la base de donn\u00e9es de la CRM et des entreprises. Remarquez que la structure de la base de donn\u00e9es est diff\u00e9rente de celle du CRM. Lorsque les donn\u00e9es sont d\u00e9plac\u00e9es du CRM vers la base de donn\u00e9es, elles peuvent rencontrer ces probl\u00e8mes, ce qui entra\u00eene des donn\u00e9es inexactes et dupliqu\u00e9es difficiles \u00e0 d\u00e9tecter. <\/strong><\/p>\n<p><strong><u>Donn\u00e9es CRM : <\/u><\/strong><\/p>\n<p><img class=\"aligncenter wp-image-57000 size-large\" src=\"https:\/\/dataladder.com\/wp-content\/uploads\/2020\/10\/DL-_Table-1-1024x266.png\" alt=\"\" width=\"1024\" height=\"266\" srcset=\"https:\/\/dataladder.com\/wp-content\/uploads\/2020\/10\/DL-_Table-1-1024x266.png 1024w, https:\/\/dataladder.com\/wp-content\/uploads\/2020\/10\/DL-_Table-1-300x78.png 300w, https:\/\/dataladder.com\/wp-content\/uploads\/2020\/10\/DL-_Table-1-768x199.png 768w, https:\/\/dataladder.com\/wp-content\/uploads\/2020\/10\/DL-_Table-1-1536x398.png 1536w, https:\/\/dataladder.com\/wp-content\/uploads\/2020\/10\/DL-_Table-1.png 1804w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/p>\n<p><strong><u>Base de donn\u00e9es de l&rsquo;entreprise : <\/u><\/strong><\/p>\n<p><img class=\"aligncenter wp-image-57016 size-large\" src=\"https:\/\/dataladder.com\/wp-content\/uploads\/2020\/10\/DL-_Table-2-1024x261.png\" alt=\"\" width=\"1024\" height=\"261\" srcset=\"https:\/\/dataladder.com\/wp-content\/uploads\/2020\/10\/DL-_Table-2-1024x261.png 1024w, https:\/\/dataladder.com\/wp-content\/uploads\/2020\/10\/DL-_Table-2-300x76.png 300w, https:\/\/dataladder.com\/wp-content\/uploads\/2020\/10\/DL-_Table-2-768x195.png 768w, https:\/\/dataladder.com\/wp-content\/uploads\/2020\/10\/DL-_Table-2-1536x391.png 1536w, https:\/\/dataladder.com\/wp-content\/uploads\/2020\/10\/DL-_Table-2.png 1804w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/p>\n<h3>Type 3 : doublons avec des informations variables dans plusieurs sources<\/h3>\n<p>Dans ce cas, les diff\u00e9rentes informations d&rsquo;un m\u00eame utilisateur sont stock\u00e9es dans plusieurs sources. Cela se produit lorsque l&rsquo;entit\u00e9 est enregistr\u00e9e comme une nouvelle entr\u00e9e en raison d&rsquo;une nouvelle adresse \u00e9lectronique, d&rsquo;une nouvelle adresse ou d&rsquo;un nouvel intitul\u00e9 de poste.<\/p>\n<p><strong>Exemple : <\/strong><\/p>\n<p><strong>Reprenons l&rsquo;exemple ci-dessus avec des informations actualis\u00e9es. <\/strong><\/p>\n<p><strong><u>Donn\u00e9es CRM :<\/u><\/strong><\/p>\n<p><img class=\"aligncenter wp-image-57004 size-large\" src=\"https:\/\/dataladder.com\/wp-content\/uploads\/2020\/10\/DL-_Table-3-1024x273.png\" alt=\"\" width=\"1024\" height=\"273\" srcset=\"https:\/\/dataladder.com\/wp-content\/uploads\/2020\/10\/DL-_Table-3-1024x273.png 1024w, https:\/\/dataladder.com\/wp-content\/uploads\/2020\/10\/DL-_Table-3-300x80.png 300w, https:\/\/dataladder.com\/wp-content\/uploads\/2020\/10\/DL-_Table-3-768x205.png 768w, https:\/\/dataladder.com\/wp-content\/uploads\/2020\/10\/DL-_Table-3-1536x410.png 1536w, https:\/\/dataladder.com\/wp-content\/uploads\/2020\/10\/DL-_Table-3-2048x547.png 2048w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/p>\n<p><img class=\"aligncenter wp-image-57008 size-large\" src=\"https:\/\/dataladder.com\/wp-content\/uploads\/2020\/10\/DL-_Table-4-1024x242.png\" alt=\"\" width=\"1024\" height=\"242\" srcset=\"https:\/\/dataladder.com\/wp-content\/uploads\/2020\/10\/DL-_Table-4-1024x242.png 1024w, https:\/\/dataladder.com\/wp-content\/uploads\/2020\/10\/DL-_Table-4-300x71.png 300w, https:\/\/dataladder.com\/wp-content\/uploads\/2020\/10\/DL-_Table-4-768x182.png 768w, https:\/\/dataladder.com\/wp-content\/uploads\/2020\/10\/DL-_Table-4-1536x363.png 1536w, https:\/\/dataladder.com\/wp-content\/uploads\/2020\/10\/DL-_Table-4-2048x484.png 2048w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/p>\n<p>Dans le premier cas, Marie peut \u00eatre un ancien client dont les donn\u00e9es ont \u00e9t\u00e9 stock\u00e9es dans la base de donn\u00e9es de l&rsquo;entreprise mais n&rsquo;ont jamais \u00e9t\u00e9 mises \u00e0 jour. Dans le CRM, l&rsquo;information est nouvelle. En supposant que l&rsquo;entreprise veuille mettre \u00e0 jour sa base de donn\u00e9es, l&rsquo;enregistrement de Mme Mary Sue est un doublon. Lorsque les entreprises disposent de plusieurs sources de donn\u00e9es disparates et que chacune d&rsquo;entre elles stocke les informations diff\u00e9remment, les doublons de cette nature sont fr\u00e9quents.<\/p>\n<h3>Type 4 : Duplicatas non exacts<\/h3>\n<p>C&rsquo;est le probl\u00e8me le plus courant et aussi le plus difficile \u00e0 attraper. Cela se produit lorsque les informations d&rsquo;une entit\u00e9 sont \u00e9crites de plusieurs fa\u00e7ons.<\/p>\n<p>Supposons que le nom complet de Mary Sue soit Mary Susan Sue, voici comment ses donn\u00e9es seront saisies dans des enregistrements multiples.<\/p>\n<p><strong>CRM : <\/strong>Mary J. Sue<\/p>\n<p><strong>Dossiers de commercialisation : <\/strong>Mary Jane<\/p>\n<p><strong>Saisie accidentelle d&rsquo;un raccourci par un commercial dans une fiche d\u00e9partementale : <\/strong>MJ Sue.<\/p>\n<p>Maintenant, supposons que Mary Jane Sue est un m\u00e9decin. Si les r\u00e8gles de saisie des donn\u00e9es de l&rsquo;organisation n&rsquo;autorisent que Ms\/Mrs\/Mr, son titre de Dr. ne peut pas \u00eatre ajout\u00e9 !<\/p>\n<p>Pour corser le tout, que faire si elle a chang\u00e9 de num\u00e9ro, d&rsquo;adresse \u00e9lectronique ou de lieu de travail deux fois en deux ans ? Et chaque fois qu&rsquo;elle fait affaire avec l&rsquo;entreprise, elle est enregistr\u00e9e comme un nouveau client.<\/p>\n<h2>Causes des doublons<\/h2>\n<p>Les doublons comme ceux de type 3 et 4 ne sont pas faciles \u00e0 d\u00e9tecter par les techniques de <a href=\"https:\/\/dataladder.com\/fr\/logiciel-de-correspondance-de-donnees-classe-parmi-les-meilleurs-de-sa-categorie-avec-une-precision-de-correspondance-de-96\/\">comparaison de donn\u00e9es<\/a> exactes qui reposent sur des champs ayant des valeurs exactes pour d\u00e9tecter une correspondance. M\u00eame si vous avez mis en place une strat\u00e9gie de d\u00e9duplication des donn\u00e9es, il y aura toujours des doublons.<\/p>\n<p>Voici quelques raisons pour lesquelles :<\/p>\n<p><strong>Duplication caus\u00e9e par les fusions et acquisitions <\/strong><\/p>\n<p>Lorsque les entreprises <a href=\"https:\/\/dataladder.com\/fr\/logiciel-merge-purge-utiliser-des-regles-de-survie-integrees-et-personnalisees\/\">fusionnent des donn\u00e9es<\/a> provenant de sources multiples pour effectuer une migration massive, le niveau de duplication devient dangereusement compliqu\u00e9. La structure des donn\u00e9es des deux entreprises peut diff\u00e9rer, m\u00eame si elles partagent les m\u00eames informations sur les clients.<\/p>\n<p>Par exemple, un utilisateur de Microsoft est aussi un utilisateur de LinkedIn et les deux plateformes peuvent avoir presque les m\u00eames donn\u00e9es individuelles. Par cons\u00e9quent, les doublons peuvent se produire \u00e0 un niveau plus profond si les entreprises fusionnent leurs donn\u00e9es sans mettre en place une solide strat\u00e9gie de qualit\u00e9 des donn\u00e9es qui implique la <a href=\"https:\/\/dataladder.com\/fr\/guide-rapide-des-logiciels-solutions-et-meilleures-pratiques-de-preparation-des-donnees\/\">pr\u00e9paration des donn\u00e9es<\/a>, <a href=\"https:\/\/dataladder.com\/fr\/logiciel-de-nettoyage-de-donnees-outil-de-nettoyage-des-donnees-crm-rapide-et-economique\/\">leur nettoyage<\/a>, leur consolidation et leur d\u00e9duplication.<\/p>\n<p><strong>Mauvais processus de saisie des donn\u00e9es et manque de gouvernance des donn\u00e9es <\/strong><\/p>\n<p>Les organisations qui ne mettent pas en \u0153uvre des politiques strictes de gouvernance des donn\u00e9es ou qui ne disposent pas de syst\u00e8mes strat\u00e9giques de qualit\u00e9 des donn\u00e9es se retrouvent souvent avec des donn\u00e9es sales et dupliqu\u00e9es.<\/p>\n<p>Il n&rsquo;est pas rare que plusieurs membres d&rsquo;une \u00e9quipe puissent acc\u00e9der au CRM et remplir\/modifier\/personnaliser les donn\u00e9es \u00e0 volont\u00e9. Cela signifie qu&rsquo;il n&rsquo;y a pas d&rsquo;obligation de rendre des comptes ou de tra\u00e7abilit\u00e9, pas d&rsquo;indication de la personne responsable de la saisie exacte des donn\u00e9es, pas de directives sur la mani\u00e8re de saisir correctement les donn\u00e9es.<\/p>\n<p>Tout cela entra\u00eene des probl\u00e8mes tels que des entr\u00e9es doubles ou multiples pour un seul enregistrement qui ne garantissent pas l&rsquo;exactitude. Lorsque les donn\u00e9es doivent \u00eatre utilis\u00e9es pour des analyses ou des rapports, la personne responsable devra se creuser les m\u00e9ninges pour essayer de donner un sens \u00e0 toutes ces donn\u00e9es. Les mauvaises pratiques en mati\u00e8re de donn\u00e9es lors de la phase d&rsquo;entr\u00e9e des donn\u00e9es ont de graves r\u00e9percussions sur les applications en aval qui affectent l&rsquo;inefficacit\u00e9 et sont \u00e9galement la principale cause des conflits entre d\u00e9partements.<\/p>\n<p><strong>Donn\u00e9es de tiers et int\u00e9grations avec les portails de partenaires <\/strong><\/p>\n<p>Les donn\u00e9es provenant de tiers, telles que les donn\u00e9es obtenues \u00e0 partir de portails, de r\u00e9seaux ou de communaut\u00e9s de partenaires, ou m\u00eame \u00e0 partir de formulaires d&rsquo;inscription \u00e0 des sites web, sont \u00e0 l&rsquo;origine d&rsquo;un nombre \u00e9lev\u00e9 de doublons. Souvent, les personnes qui remplissent un formulaire peuvent utiliser plusieurs identifiants de messagerie ou num\u00e9ros de t\u00e9l\u00e9phone, ce qui entra\u00eene des entr\u00e9es multiples pour une seule personne. D&rsquo;autre part, les donn\u00e9es externes peuvent avoir une version diff\u00e9rente de la m\u00eame entit\u00e9, mais les m\u00eames informations ne sont pas mises \u00e0 jour dans les enregistrements existants et un nouvel enregistrement est cr\u00e9\u00e9 \u00e0 la place. Bien que cela ne semble pas \u00eatre un probl\u00e8me sur le moment, cela entra\u00eene par la suite des analyses fauss\u00e9es.<\/p>\n<p>Par exemple, une entreprise peut croire qu&rsquo;elle a obtenu 100 pistes gr\u00e2ce \u00e0 une campagne, mais comme les entr\u00e9es ont \u00e9t\u00e9 dupliqu\u00e9es, il ne s&rsquo;agit peut-\u00eatre que de 60 pistes valides, les 40 autres \u00e9tant incompl\u00e8tes, dupliqu\u00e9es ou inexactes.<\/p>\n<p><strong>En supposant que chaque piste vaut 100 $ x 40 = 4 000 $. <\/strong><\/p>\n<p><strong>En supposant que le co\u00fbt de chaque piste est de 50 $ x 40 = 2 000 $.<\/strong><\/p>\n<p><strong>Perte : 6 000 $ au total ! <\/strong><\/p>\n<p><strong>Bugs logiciels et erreurs syst\u00e8me <\/strong><\/p>\n<p>Les bogues logiciels et les erreurs administratives ou de syst\u00e8me dans le CRM et dans les applications associ\u00e9es peuvent entra\u00eener des milliers d&rsquo;enregistrements en double. Cette situation est fr\u00e9quente lors des activit\u00e9s de migration de syst\u00e8mes ou de donn\u00e9es et, bien qu&rsquo;elle puisse \u00eatre rectifi\u00e9e, elle pose un s\u00e9rieux probl\u00e8me de qualit\u00e9 des donn\u00e9es.<\/p>\n<p>Chaque source de donn\u00e9es contient une certaine quantit\u00e9 de donn\u00e9es en double. Les experts estiment que jusqu&rsquo;\u00e0 5% de duplication est tol\u00e9rable. Tout ce qui d\u00e9passe ce seuil constitue une menace pour les applications en aval. Les rapports deviennent trompeurs. Les clients s&rsquo;\u00e9nervent. Les utilisateurs et les employ\u00e9s deviennent frustr\u00e9s. Selon le DSI, \u00ab\u00a0les syst\u00e8mes comportant <a href=\"https:\/\/www.cio.com\/article\/2382113\/how-to-solve-crm-data-deduplication-dilemmas.html\" rel=\"nofollow\">25 % d&rsquo;enregistrements en double<\/a> peuvent <strong>menacer des carri\u00e8res <\/strong>\u00a0\u00bb <strong>. <\/strong><\/p>\n<p><strong>Selon Natik Ameen, expert en marketing chez <a href=\"https:\/\/www.canzmarketing.com\/\" rel=\"nofollow\">Canz Marketing<\/a>, les donn\u00e9es en double dans le CRM de l&rsquo;entreprise sont dues \u00e0 toute une s\u00e9rie de raisons.<\/strong><em>d&rsquo;une erreur humaine \u00e0 des clients fournissant des informations l\u00e9g\u00e8rement diff\u00e9rentes \u00e0 diff\u00e9rents moments dans la base de donn\u00e9es de l&rsquo;organisation. Par exemple, un consommateur inscrit son nom en tant que Jonathan Smith sur un formulaire et Jon Smith sur l&rsquo;autre. Le d\u00e9fi est exacerb\u00e9 par une base de donn\u00e9es en pleine expansion. Il est souvent de plus en plus difficile pour les administrateurs d&rsquo;assurer le suivi de la DB ainsi que celui des donn\u00e9es pertinentes. Il est de plus en plus difficile de s&rsquo;assurer que la BD de l&rsquo;organisation reste exacte.<\/em>&lsquo;.<\/p>\n<p>Vous avez besoin d&rsquo;une strat\u00e9gie de d\u00e9duplication des donn\u00e9es pour relever le d\u00e9fi des donn\u00e9es dupliqu\u00e9es.<\/p>\n<h2>Qu&rsquo;est-ce que la d\u00e9duplication des donn\u00e9es et comment fonctionne-t-elle ?<\/h2>\n<p>La d\u00e9duplication des donn\u00e9es est le processus de comparaison, de rapprochement et de suppression des doublons pour cr\u00e9er un enregistrement consolid\u00e9. La d\u00e9duplication des donn\u00e9es se fait en trois \u00e9tapes :<\/p>\n<p><strong>Comparaison et mise en correspondance : <\/strong>diff\u00e9rentes listes et diff\u00e9rents enregistrements sont compar\u00e9s et mis en correspondance pour d\u00e9tecter les doublons exacts et non exacts. Par exemple, une liste CRM est mise en correspondance avec une liste de base de donn\u00e9es interne afin de s&rsquo;assurer que les m\u00eames enregistrements ne sont pas t\u00e9l\u00e9charg\u00e9s deux fois dans la base de donn\u00e9es centrale.<\/p>\n<p><strong>Traitement des enregistrements obsol\u00e8tes : <\/strong>Les enregistrements en double obsol\u00e8tes sont soit mis \u00e0 jour avec de nouvelles informations, soit supprim\u00e9s. Dans d&rsquo;autres cas, les donn\u00e9es sont consolid\u00e9es (si un enregistrement a des poign\u00e9es de m\u00e9dias sociaux alors que l&rsquo;autre n&rsquo;en a pas) et de nouvelles r\u00e8gles ou colonnes sont cr\u00e9\u00e9es pour stocker ces informations suppl\u00e9mentaires.<\/p>\n<p><strong>Cr\u00e9ation d&rsquo;enregistrements consolid\u00e9s : <\/strong>Une fois que les doublons ont \u00e9t\u00e9 supprim\u00e9s, un enregistrement consolid\u00e9 compos\u00e9 de donn\u00e9es propres et trait\u00e9es est cr\u00e9\u00e9 et peut \u00eatre utilis\u00e9 comme \u00ab\u00a0enregistrement d&rsquo;or\u00a0\u00bb, sur la base duquel les enregistrements existants peuvent \u00eatre model\u00e9s.<\/p>\n<p>Des outils tels qu&rsquo;Excel peuvent \u00eatre excellents pour supprimer les doublons exacts au sein d&rsquo;une m\u00eame source de donn\u00e9es, mais ils ne parviennent pas \u00e0 identifier les doublons similaires.<\/p>\n<p>Pour voir comment supprimer les doublons exacts dans Excel, suivez ce guide :<\/p>\n<p><strong><a href=\"https:\/\/www.excel-easy.com\/examples\/remove-duplicates.html\" rel=\"nofollow\">https:\/\/www.excel-easy.com\/examples\/remove-duplicates.html<\/a> <\/strong><\/p>\n<p>Pour supprimer les doublons en Python, vous pouvez utiliser la biblioth\u00e8que Dedupe pour trouver des enregistrements dans des ensembles de donn\u00e9es appartenant \u00e0 la m\u00eame entit\u00e9. Voici un excellent guide sur la d\u00e9duplication des donn\u00e9es \u00e0 l&rsquo;aide de Python :<\/p>\n<p><strong><a href=\"https:\/\/recordlinkage.readthedocs.io\/en\/latest\/notebooks\/data_deduplication.html\" rel=\"nofollow\">https:\/\/recordlinkage.readthedocs.io\/en\/latest\/notebooks\/data_deduplication.html<\/a> <\/strong><\/p>\n<h2>Existe-t-il un moyen plus simple de d\u00e9dupliquer des donn\u00e9es ?<\/h2>\n<p>Python, bien que puissant, prend beaucoup de temps.<\/p>\n<p>Par exemple, pour faire correspondre un simple enregistrement entre deux sources, vous devez charger ou importer des modules, cr\u00e9er des paires d&rsquo;enregistrements (ce qui est un processus long en soi), puis cr\u00e9er un code pour comparer les enregistrements au niveau des attributs. Vous devrez alors examiner manuellement chaque instance de la comparaison pour identifier quel enregistrement appartient \u00e0 la m\u00eame personne.<\/p>\n<p>Ce processus doit \u00eatre modifi\u00e9 et r\u00e9p\u00e9t\u00e9 pour chaque nouvelle exigence au niveau des attributs.<\/p>\n<p>Si vous \u00eates un analyste de donn\u00e9es responsable des donn\u00e9es d&rsquo;une entreprise, vous ne pouvez pas <strong>prendre des mois pour d\u00e9duire des donn\u00e9es. <\/strong><\/p>\n<p>Vous ne pouvez pas non plus risquer de perdre des donn\u00e9es, ce qui est une possibilit\u00e9 r\u00e9elle lorsque vous essayez de tester diff\u00e9rents codes pour trouver la bonne correspondance.<\/p>\n<p>Eric McGee, ing\u00e9nieur r\u00e9seau senior chez <a href=\"https:\/\/www.trgdatacenters.com\/\" rel=\"nofollow\">TRG DataCenters<\/a>, pense que le plus gros probl\u00e8me lors du nettoyage\/suppression des donn\u00e9es est la possibilit\u00e9 de perdre des donn\u00e9es lors de la rationalisation des champs de donn\u00e9es. Il pense \u00e9galement qu&rsquo;au niveau de l&rsquo;entreprise, l&rsquo;exactitude de la correspondance des donn\u00e9es peut devenir tr\u00e8s importante, ou l&rsquo;ensemble du cabinet peut compromettre des donn\u00e9es cruciales.<\/p>\n<p>Une solution plus simple, mais \u00e0 laquelle peu d&rsquo;ing\u00e9nieurs syst\u00e8me sont pr\u00eats \u00e0 s&rsquo;adapter, consiste \u00e0 utiliser un <a href=\"https:\/\/dataladder.com\/fr\/logiciel-de-deduplication-de-donnees-utilisez-des-regles-integrees-et-personnalisees-pour-la-deduplication-crm\/\">outil de d\u00e9duplication des donn\u00e9es<\/a>, surtout s&rsquo;il ne fait pas partie de leur plateforme de gestion des donn\u00e9es. Le probl\u00e8me est que la plupart des plateformes de gestion des donn\u00e9es ne disposent pas de solides <a href=\"https:\/\/dataladder.com\/fr\/8-avantages-du-couplage-de-donnees-qui-peuvent-vous-aider-a-developper-votre-entreprise\/\">capacit\u00e9s de rapprochement des donn\u00e9es<\/a> qui peuvent aider les utilisateurs \u00e0 identifier les doublons. Les analystes et les ing\u00e9nieurs finissent par d\u00e9duire manuellement les donn\u00e9es, ce qui repr\u00e9sente une perte de temps consid\u00e9rable.<\/p>\n<p>Les meilleurs outils de d\u00e9duplication des donn\u00e9es utilisent des algorithmes avanc\u00e9s de <a href=\"https:\/\/dataladder.com\/fr\/correspondance-floue-101-nettoyage-et-mise-en-relation-de-donnees-desordonnees\/\">correspondance floue<\/a> et des algorithmes propri\u00e9taires pour faire correspondre les donn\u00e9es \u00e0 un niveau plus profond &#8211; une capacit\u00e9 que toutes les solutions de gestion des donn\u00e9es n&rsquo;offrent pas. C&rsquo;est pourquoi la plupart des entreprises et des clients du Fortune 500 avec lesquels nous avons travaill\u00e9 pr\u00e9f\u00e8rent utiliser un outil tel que <a href=\"https:\/\/dataladder.com\/fr\/produits\/datamatch-enterprise-classe-premier-produit-de-gestion-de-la-qualite-des-donnees\/\"><br \/>\n<strong>DataMatch Enterprise<\/strong><br \/>\n<\/a> en conjonction avec leurs plateformes de gestion de donn\u00e9es.<\/p>\n<p>En raison de ses capacit\u00e9s d&rsquo;int\u00e9gration faciles et de ses puissants algorithmes de correspondance floue, DataMatch Enterprise a \u00e9t\u00e9 l&rsquo;outil pr\u00e9f\u00e9r\u00e9 de la plupart des organisations pour d\u00e9duire les donn\u00e9es au sein de leur plate-forme de base de donn\u00e9es.<\/p>\n<p>Si vous souhaitez en savoir plus sur les entreprises que nous avons aid\u00e9es en mati\u00e8re de d\u00e9duplication des donn\u00e9es, consultez nos \u00e9tudes de cas.<\/p>\n<p>Par exemple, voyez comment nous avons travaill\u00e9 avec <a href=\"https:\/\/content.dataladder.com\/Bell-Bank-CS.pdf\">Bell Bank<\/a> pour supprimer les doublons et consolider les donn\u00e9es clients provenant de sources multiples.<\/p>\n<p>Ou comment <a href=\"https:\/\/content.dataladder.com\/Cleveland-Brothers-Engineering-CS.pdf\">Cleveland Brothers<\/a>, un d\u00e9taillant mondial, a gagn\u00e9 du temps en g\u00e9rant plusieurs listes de clients avec DataMatch Enterprise.<\/p>\n<table style=\"height: 383px; width: 87.8612%; border-collapse: collapse;\">\n<tbody>\n<tr>\n<td style=\"width: 308px;\">\n<p><figure id=\"attachment_56508\" aria-describedby=\"caption-attachment-56508\" style=\"width: 300px\" class=\"wp-caption aligncenter\"><a href=\"https:\/\/content.dataladder.com\/Bell-Bank-CS.pdf\"><img class=\"wp-image-56508 size-medium\" src=\"https:\/\/dataladder.com\/wp-content\/uploads\/2020\/10\/DL_Bell-Bank-Case-Study-300x300.png\" alt=\"Bell Bank Case Study\" width=\"300\" height=\"300\" srcset=\"https:\/\/dataladder.com\/wp-content\/uploads\/2020\/10\/DL_Bell-Bank-Case-Study-300x300.png 300w, https:\/\/dataladder.com\/wp-content\/uploads\/2020\/10\/DL_Bell-Bank-Case-Study-150x150.png 150w, https:\/\/dataladder.com\/wp-content\/uploads\/2020\/10\/DL_Bell-Bank-Case-Study.png 760w\" sizes=\"(max-width: 300px) 100vw, 300px\" \/><\/a><figcaption id=\"caption-attachment-56508\" class=\"wp-caption-text\">\u00c9tude de cas de la Banque Bell<\/figcaption><\/figure><\/td>\n<td style=\"width: 308px;\">\n<p><figure id=\"attachment_56888\" aria-describedby=\"caption-attachment-56888\" style=\"width: 300px\" class=\"wp-caption aligncenter\"><a href=\"https:\/\/content.dataladder.com\/Cleveland-Brothers-Engineering-CS.pdf\"><img class=\"wp-image-56888 size-medium\" src=\"https:\/\/dataladder.com\/wp-content\/uploads\/2020\/10\/DL_Cleveland-Brothers-Case-Study-300x300.png\" alt=\"Cleveland Case Study\" width=\"300\" height=\"300\" srcset=\"https:\/\/dataladder.com\/wp-content\/uploads\/2020\/10\/DL_Cleveland-Brothers-Case-Study-300x300.png 300w, https:\/\/dataladder.com\/wp-content\/uploads\/2020\/10\/DL_Cleveland-Brothers-Case-Study-150x150.png 150w, https:\/\/dataladder.com\/wp-content\/uploads\/2020\/10\/DL_Cleveland-Brothers-Case-Study.png 760w\" sizes=\"(max-width: 300px) 100vw, 300px\" \/><\/a><figcaption id=\"caption-attachment-56888\" class=\"wp-caption-text\">\u00c9tude de cas de Cleveland<\/figcaption><\/figure><\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<h2>Conclusion &#8211; D\u00e9velopper une approche m\u00e9thodique de la d\u00e9duplication des donn\u00e9es<\/h2>\n<p>L&rsquo;\u00e9volution de la nature des donn\u00e9es s&rsquo;accompagne d&rsquo;une augmentation de la complexit\u00e9 des probl\u00e8mes de qualit\u00e9. Les doublons deviendront difficiles \u00e0 traiter avec des m\u00e9thodes manuelles. La demande d&rsquo;informations en temps r\u00e9el fera qu&rsquo;il ne sera plus possible de passer des semaines \u00e0 \u00e9laborer le code parfait. Il est donc imp\u00e9ratif pour les entreprises de mettre continuellement \u00e0 jour leur arsenal d&rsquo;outils de qualit\u00e9 des donn\u00e9es et de plateformes de gestion pour garantir l&rsquo;exactitude et l&rsquo;int\u00e9grit\u00e9 des donn\u00e9es.<\/p>\n\n","protected":false},"excerpt":{"rendered":"<p>La duplication des donn\u00e9es est un probl\u00e8me s\u00e9rieux qui affecte les connaissances d&rsquo;une organisation, consomme de l&rsquo;espace de stockage co\u00fbteux, brouille les informations sur les clients et conduit l&rsquo;entreprise \u00e0 prendre des d\u00e9cisions erron\u00e9es. Les responsables informatiques, les analystes de donn\u00e9es et les utilisateurs professionnels sont conscients des doublons &#8211; ils y sont confront\u00e9s chaque [&hellip;]<\/p>\n","protected":false},"author":9,"featured_media":58356,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"_lmt_disableupdate":"","_lmt_disable":"","_links_to":"","_links_to_target":""},"categories":[1263],"tags":[698,699,695,697,694,696],"acf":[],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v19.9 - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>La hantise des donn\u00e9es dupliqu\u00e9es - Un guide de la d\u00e9duplication des donn\u00e9es - Data Ladder<\/title>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/dataladder.com\/fr\/la-hantise-des-donnees-dupliquees-un-guide-de-la-deduplication-des-donnees\/\" \/>\n<meta property=\"og:locale\" content=\"fr_FR\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"La hantise des donn\u00e9es dupliqu\u00e9es - Un guide de la d\u00e9duplication des donn\u00e9es - Data Ladder\" \/>\n<meta property=\"og:description\" content=\"La duplication des donn\u00e9es est un probl\u00e8me s\u00e9rieux qui affecte les connaissances d&rsquo;une organisation, consomme de l&rsquo;espace de stockage co\u00fbteux, brouille les informations sur les clients et conduit l&rsquo;entreprise \u00e0 prendre des d\u00e9cisions erron\u00e9es. Les responsables informatiques, les analystes de donn\u00e9es et les utilisateurs professionnels sont conscients des doublons &#8211; ils y sont confront\u00e9s chaque [&hellip;]\" \/>\n<meta property=\"og:url\" content=\"https:\/\/dataladder.com\/fr\/la-hantise-des-donnees-dupliquees-un-guide-de-la-deduplication-des-donnees\/\" \/>\n<meta property=\"og:site_name\" content=\"Data Ladder\" \/>\n<meta property=\"article:publisher\" content=\"https:\/\/web.facebook.com\/DataLadderSoftware\" \/>\n<meta property=\"article:published_time\" content=\"2020-10-12T04:00:00+00:00\" \/>\n<meta property=\"article:modified_time\" content=\"2022-03-28T14:53:29+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/dataladder.com\/wp-content\/uploads\/2021\/09\/0.jpg\" \/>\n\t<meta property=\"og:image:width\" content=\"1201\" \/>\n\t<meta property=\"og:image:height\" content=\"1201\" \/>\n\t<meta property=\"og:image:type\" content=\"image\/jpeg\" \/>\n<meta name=\"author\" content=\"lbarrera\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"\u00c9crit par\" \/>\n\t<meta name=\"twitter:data1\" content=\"lbarrera\" \/>\n\t<meta name=\"twitter:label2\" content=\"Dur\u00e9e de lecture estim\u00e9e\" \/>\n\t<meta name=\"twitter:data2\" content=\"13 minutes\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"Article\",\"@id\":\"https:\/\/dataladder.com\/fr\/la-hantise-des-donnees-dupliquees-un-guide-de-la-deduplication-des-donnees\/#article\",\"isPartOf\":{\"@id\":\"https:\/\/dataladder.com\/fr\/la-hantise-des-donnees-dupliquees-un-guide-de-la-deduplication-des-donnees\/\"},\"author\":{\"name\":\"lbarrera\",\"@id\":\"https:\/\/dataladder.com\/fr\/#\/schema\/person\/6cc3d6b3c83c611546541b5eb2d1e21b\"},\"headline\":\"La hantise des donn\u00e9es dupliqu\u00e9es &#8211; Un guide de la d\u00e9duplication des donn\u00e9es\",\"datePublished\":\"2020-10-12T04:00:00+00:00\",\"dateModified\":\"2022-03-28T14:53:29+00:00\",\"mainEntityOfPage\":{\"@id\":\"https:\/\/dataladder.com\/fr\/la-hantise-des-donnees-dupliquees-un-guide-de-la-deduplication-des-donnees\/\"},\"wordCount\":2907,\"publisher\":{\"@id\":\"https:\/\/dataladder.com\/fr\/#organization\"},\"keywords\":[\"d\u00e9duplication des donn\u00e9es\",\"donn\u00e9es dupliqu\u00e9es\",\"Donn\u00e9es sales\",\"duplication des donn\u00e9es\",\"les probl\u00e8mes de qualit\u00e9 des donn\u00e9es\",\"mauvaises donn\u00e9es\"],\"articleSection\":[\"Gestion de la qualit\u00e9 des donn\u00e9es\"],\"inLanguage\":\"fr-FR\"},{\"@type\":\"WebPage\",\"@id\":\"https:\/\/dataladder.com\/fr\/la-hantise-des-donnees-dupliquees-un-guide-de-la-deduplication-des-donnees\/\",\"url\":\"https:\/\/dataladder.com\/fr\/la-hantise-des-donnees-dupliquees-un-guide-de-la-deduplication-des-donnees\/\",\"name\":\"La hantise des donn\u00e9es dupliqu\u00e9es - Un guide de la d\u00e9duplication des donn\u00e9es - Data Ladder\",\"isPartOf\":{\"@id\":\"https:\/\/dataladder.com\/fr\/#website\"},\"datePublished\":\"2020-10-12T04:00:00+00:00\",\"dateModified\":\"2022-03-28T14:53:29+00:00\",\"breadcrumb\":{\"@id\":\"https:\/\/dataladder.com\/fr\/la-hantise-des-donnees-dupliquees-un-guide-de-la-deduplication-des-donnees\/#breadcrumb\"},\"inLanguage\":\"fr-FR\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/dataladder.com\/fr\/la-hantise-des-donnees-dupliquees-un-guide-de-la-deduplication-des-donnees\/\"]}]},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/dataladder.com\/fr\/la-hantise-des-donnees-dupliquees-un-guide-de-la-deduplication-des-donnees\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Home\",\"item\":\"https:\/\/dataladder.com\/fr\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"La hantise des donn\u00e9es dupliqu\u00e9es &#8211; Un guide de la d\u00e9duplication des donn\u00e9es\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/dataladder.com\/fr\/#website\",\"url\":\"https:\/\/dataladder.com\/fr\/\",\"name\":\"Data Ladder\",\"description\":\"Enterprise Data Profiling, Cleansing, and Matching\",\"publisher\":{\"@id\":\"https:\/\/dataladder.com\/fr\/#organization\"},\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/dataladder.com\/fr\/?s={search_term_string}\"},\"query-input\":\"required name=search_term_string\"}],\"inLanguage\":\"fr-FR\"},{\"@type\":\"Organization\",\"@id\":\"https:\/\/dataladder.com\/fr\/#organization\",\"name\":\"Data Ladder\",\"url\":\"https:\/\/dataladder.com\/fr\/\",\"logo\":{\"@type\":\"ImageObject\",\"inLanguage\":\"fr-FR\",\"@id\":\"https:\/\/dataladder.com\/fr\/#\/schema\/logo\/image\/\",\"url\":\"https:\/\/dataladder.com\/wp-content\/uploads\/2018\/06\/DL-Logo-Ball-30.png\",\"contentUrl\":\"https:\/\/dataladder.com\/wp-content\/uploads\/2018\/06\/DL-Logo-Ball-30.png\",\"width\":413,\"height\":408,\"caption\":\"Data Ladder\"},\"image\":{\"@id\":\"https:\/\/dataladder.com\/fr\/#\/schema\/logo\/image\/\"},\"sameAs\":[\"https:\/\/www.linkedin.com\/company\/dataladder-llc\/\",\"https:\/\/web.facebook.com\/DataLadderSoftware\"]},{\"@type\":\"Person\",\"@id\":\"https:\/\/dataladder.com\/fr\/#\/schema\/person\/6cc3d6b3c83c611546541b5eb2d1e21b\",\"name\":\"lbarrera\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"fr-FR\",\"@id\":\"https:\/\/dataladder.com\/fr\/#\/schema\/person\/image\/\",\"url\":\"https:\/\/secure.gravatar.com\/avatar\/5198cb4dd374e7d879a15a9cf20299b3?s=96&d=mm&r=g\",\"contentUrl\":\"https:\/\/secure.gravatar.com\/avatar\/5198cb4dd374e7d879a15a9cf20299b3?s=96&d=mm&r=g\",\"caption\":\"lbarrera\"},\"url\":\"https:\/\/dataladder.com\/fr\/author\/lbarrera\/\"}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"La hantise des donn\u00e9es dupliqu\u00e9es - Un guide de la d\u00e9duplication des donn\u00e9es - Data Ladder","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/dataladder.com\/fr\/la-hantise-des-donnees-dupliquees-un-guide-de-la-deduplication-des-donnees\/","og_locale":"fr_FR","og_type":"article","og_title":"La hantise des donn\u00e9es dupliqu\u00e9es - Un guide de la d\u00e9duplication des donn\u00e9es - Data Ladder","og_description":"La duplication des donn\u00e9es est un probl\u00e8me s\u00e9rieux qui affecte les connaissances d&rsquo;une organisation, consomme de l&rsquo;espace de stockage co\u00fbteux, brouille les informations sur les clients et conduit l&rsquo;entreprise \u00e0 prendre des d\u00e9cisions erron\u00e9es. Les responsables informatiques, les analystes de donn\u00e9es et les utilisateurs professionnels sont conscients des doublons &#8211; ils y sont confront\u00e9s chaque [&hellip;]","og_url":"https:\/\/dataladder.com\/fr\/la-hantise-des-donnees-dupliquees-un-guide-de-la-deduplication-des-donnees\/","og_site_name":"Data Ladder","article_publisher":"https:\/\/web.facebook.com\/DataLadderSoftware","article_published_time":"2020-10-12T04:00:00+00:00","article_modified_time":"2022-03-28T14:53:29+00:00","og_image":[{"width":1201,"height":1201,"url":"https:\/\/dataladder.com\/wp-content\/uploads\/2021\/09\/0.jpg","type":"image\/jpeg"}],"author":"lbarrera","twitter_card":"summary_large_image","twitter_misc":{"\u00c9crit par":"lbarrera","Dur\u00e9e de lecture estim\u00e9e":"13 minutes"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"Article","@id":"https:\/\/dataladder.com\/fr\/la-hantise-des-donnees-dupliquees-un-guide-de-la-deduplication-des-donnees\/#article","isPartOf":{"@id":"https:\/\/dataladder.com\/fr\/la-hantise-des-donnees-dupliquees-un-guide-de-la-deduplication-des-donnees\/"},"author":{"name":"lbarrera","@id":"https:\/\/dataladder.com\/fr\/#\/schema\/person\/6cc3d6b3c83c611546541b5eb2d1e21b"},"headline":"La hantise des donn\u00e9es dupliqu\u00e9es &#8211; Un guide de la d\u00e9duplication des donn\u00e9es","datePublished":"2020-10-12T04:00:00+00:00","dateModified":"2022-03-28T14:53:29+00:00","mainEntityOfPage":{"@id":"https:\/\/dataladder.com\/fr\/la-hantise-des-donnees-dupliquees-un-guide-de-la-deduplication-des-donnees\/"},"wordCount":2907,"publisher":{"@id":"https:\/\/dataladder.com\/fr\/#organization"},"keywords":["d\u00e9duplication des donn\u00e9es","donn\u00e9es dupliqu\u00e9es","Donn\u00e9es sales","duplication des donn\u00e9es","les probl\u00e8mes de qualit\u00e9 des donn\u00e9es","mauvaises donn\u00e9es"],"articleSection":["Gestion de la qualit\u00e9 des donn\u00e9es"],"inLanguage":"fr-FR"},{"@type":"WebPage","@id":"https:\/\/dataladder.com\/fr\/la-hantise-des-donnees-dupliquees-un-guide-de-la-deduplication-des-donnees\/","url":"https:\/\/dataladder.com\/fr\/la-hantise-des-donnees-dupliquees-un-guide-de-la-deduplication-des-donnees\/","name":"La hantise des donn\u00e9es dupliqu\u00e9es - Un guide de la d\u00e9duplication des donn\u00e9es - Data Ladder","isPartOf":{"@id":"https:\/\/dataladder.com\/fr\/#website"},"datePublished":"2020-10-12T04:00:00+00:00","dateModified":"2022-03-28T14:53:29+00:00","breadcrumb":{"@id":"https:\/\/dataladder.com\/fr\/la-hantise-des-donnees-dupliquees-un-guide-de-la-deduplication-des-donnees\/#breadcrumb"},"inLanguage":"fr-FR","potentialAction":[{"@type":"ReadAction","target":["https:\/\/dataladder.com\/fr\/la-hantise-des-donnees-dupliquees-un-guide-de-la-deduplication-des-donnees\/"]}]},{"@type":"BreadcrumbList","@id":"https:\/\/dataladder.com\/fr\/la-hantise-des-donnees-dupliquees-un-guide-de-la-deduplication-des-donnees\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Home","item":"https:\/\/dataladder.com\/fr\/"},{"@type":"ListItem","position":2,"name":"La hantise des donn\u00e9es dupliqu\u00e9es &#8211; Un guide de la d\u00e9duplication des donn\u00e9es"}]},{"@type":"WebSite","@id":"https:\/\/dataladder.com\/fr\/#website","url":"https:\/\/dataladder.com\/fr\/","name":"Data Ladder","description":"Enterprise Data Profiling, Cleansing, and Matching","publisher":{"@id":"https:\/\/dataladder.com\/fr\/#organization"},"potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/dataladder.com\/fr\/?s={search_term_string}"},"query-input":"required name=search_term_string"}],"inLanguage":"fr-FR"},{"@type":"Organization","@id":"https:\/\/dataladder.com\/fr\/#organization","name":"Data Ladder","url":"https:\/\/dataladder.com\/fr\/","logo":{"@type":"ImageObject","inLanguage":"fr-FR","@id":"https:\/\/dataladder.com\/fr\/#\/schema\/logo\/image\/","url":"https:\/\/dataladder.com\/wp-content\/uploads\/2018\/06\/DL-Logo-Ball-30.png","contentUrl":"https:\/\/dataladder.com\/wp-content\/uploads\/2018\/06\/DL-Logo-Ball-30.png","width":413,"height":408,"caption":"Data Ladder"},"image":{"@id":"https:\/\/dataladder.com\/fr\/#\/schema\/logo\/image\/"},"sameAs":["https:\/\/www.linkedin.com\/company\/dataladder-llc\/","https:\/\/web.facebook.com\/DataLadderSoftware"]},{"@type":"Person","@id":"https:\/\/dataladder.com\/fr\/#\/schema\/person\/6cc3d6b3c83c611546541b5eb2d1e21b","name":"lbarrera","image":{"@type":"ImageObject","inLanguage":"fr-FR","@id":"https:\/\/dataladder.com\/fr\/#\/schema\/person\/image\/","url":"https:\/\/secure.gravatar.com\/avatar\/5198cb4dd374e7d879a15a9cf20299b3?s=96&d=mm&r=g","contentUrl":"https:\/\/secure.gravatar.com\/avatar\/5198cb4dd374e7d879a15a9cf20299b3?s=96&d=mm&r=g","caption":"lbarrera"},"url":"https:\/\/dataladder.com\/fr\/author\/lbarrera\/"}]}},"modified_by":null,"_links":{"self":[{"href":"https:\/\/dataladder.com\/fr\/wp-json\/wp\/v2\/posts\/63019"}],"collection":[{"href":"https:\/\/dataladder.com\/fr\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/dataladder.com\/fr\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/dataladder.com\/fr\/wp-json\/wp\/v2\/users\/9"}],"replies":[{"embeddable":true,"href":"https:\/\/dataladder.com\/fr\/wp-json\/wp\/v2\/comments?post=63019"}],"version-history":[{"count":1,"href":"https:\/\/dataladder.com\/fr\/wp-json\/wp\/v2\/posts\/63019\/revisions"}],"predecessor-version":[{"id":66553,"href":"https:\/\/dataladder.com\/fr\/wp-json\/wp\/v2\/posts\/63019\/revisions\/66553"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/dataladder.com\/fr\/wp-json\/wp\/v2\/media\/58356"}],"wp:attachment":[{"href":"https:\/\/dataladder.com\/fr\/wp-json\/wp\/v2\/media?parent=63019"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/dataladder.com\/fr\/wp-json\/wp\/v2\/categories?post=63019"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/dataladder.com\/fr\/wp-json\/wp\/v2\/tags?post=63019"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}