Blog

Un guide rapide de la fusion et de la purge des données

Ayant fourni des solutions de purge de fusion à des clients depuis plus de dix ans, nous considérons les opérations de purge de fusion comme une fonction essentielle dans les opérations commerciales telles que le marketing par publipostage, la résolution d’entités et l’obtention de versions à source unique de vérité. Cependant, pour de nombreuses organisations, le processus de purge des fusions reste limité à des fonctions et techniques Excel qui ne répondent guère à des besoins de données de plus en plus complexes.

Ce guide destiné aux utilisateurs informatiques et commerciaux démystifie le processus de fusion et de purge et vous aide à comprendre pourquoi vos équipes ne peuvent plus compter sur la fusion et la purge à l’aide d’Excel. Les principaux points à retenir de ce guide sont les suivants :

    • Qu’est-ce que la purge de fusion ?
    • Comment se fait traditionnellement la purge par fusion ?
    • Créer une stratégie réfléchie de fusion-purge
    • Les processus d’affaires qui peuvent être améliorés avec Merge Purge
    • Créer le disque d’or par la survivance des données
    • Meilleures pratiques en matière de fusion et de purge des données

Plongeons-y !

Qu’est-ce qu’une fonction ou un processus de fusion et de purge ?

Comme le terme l’indique, la purge par fusion désigne le processus consistant à combiner plusieurs sources de données tout en supprimant simultanément les doublons et les mauvais enregistrements de la source de données.

Par exemple, regardez l’image ci-dessous :

Remarquez que vous avez trois enregistrements dupliqués avec de multiples problèmes de qualité de données pour un seul individu. Lorsqu’une fonction de purge de fusion de données est appliquée à cet enregistrement, elle le transforme et renvoie une version propre et singulière comme l’image ci-dessous :

Une nouvelle colonne [Industry] a été ajoutée à cet enregistrement, qui était stocké dans une autre source de données. Après avoir fusionné et purgé les doublons de deux sources de données, le résultat est une vue consolidée de l’enregistrement de l’entité.

Le résultat d’une fonction de purge par fusion est de créer des enregistrements qui contiendront des noms, des adresses et des informations supplémentaires uniques qui serviront à l’objectif commercial des données. Dans ce cas particulier, les données ci-dessus, une fois optimisées, constituent un registre fiable que les spécialistes du marketing peuvent utiliser pour leurs campagnes de mailing.

Comment se fait historiquement la purge par fusion ?

Aujourd’hui, dans la plupart des entreprises, les équipes utilisent encore Excel pour gérer leurs dossiers. Les utilisateurs professionnels coupent, collent et concatènent manuellement plusieurs colonnes de données provenant de sources disparates pour créer des enregistrements précis. Des jours et des semaines sont perdus pour fusionner et purger des centaines de milliers d’enregistrements. Cela ne tient pas compte des erreurs humaines qui se produisent au moment de la fusion ou de la purge, ni d’événements dommageables tels que des pannes de logiciel.

Outre l’inefficacité opérationnelle, le facteur clé qui rend l’utilisation d’Excel contre-productive est la complexité croissante des données. Aujourd’hui, les entreprises traitent plus que des données de contact de base. Une entité peut avoir des enregistrements supplémentaires comme :

Et ainsi de suite.

Il est pratiquement impossible de gérer toutes ces nuances de données par une mise en œuvre manuelle des fonctions et formules d’Excel. Il est donc nécessaire de sortir du giron d’Excel et d’envisager d’autres options qui permettent de fusionner et de purger des données complexes tout en conservant une efficacité opérationnelle optimale.

Créer une stratégie réfléchie de fusion-purge

La fusion et l’épuration d’une base de données peut être une tâche longue et sujette aux erreurs, c’est pourquoi il est essentiel d’avoir une stratégie réfléchie avant de la mettre en œuvre.

Voici un guide rapide, étape par étape :

  1. Intégration de données provenant de plusieurs sources : La fusion de différentes bases de données provenant de diverses sources (SQL server, MySQL, Excel, ODBC etc.) et leur regroupement dans une structure commune est la première étape du processus de fusion. Vous aurez besoin d’un outil de purge de fusion comme DataMatch Enterprise pour importer, combiner et exporter vers les formats de base de données les plus courants. En outre, vous pouvez également mettre en correspondance automatiquement des champs similaires provenant de différentes sources de données.
  1. Identifier les doublons : Les doublons constituent la plus grande menace pour l’exactitude des données . Il faut être vigilant pour éviter que les doublons – qu’il s’agisse d’individus, de ménages ou d’entreprises – ne se retrouvent dans votre base de données, surtout lorsque vous combinez plusieurs listes pour un envoi. Les doublons sont identifiés par l’utilisation de lacorrespondance floue, l’identification d’acronymes (par exemple, International Business Machines à IBM), le nettoyage et l’élimination des déchets. lanormalisation des données avant la mise en correspondance et l’application de bibliothèques pour la normalisation, en particulier pour les prénoms comme (Jon, Jonathan, Johny etc.) Si vous utilisez un outil de purge de fusion automatisé, vous n’avez pas à vous soucier de la mise en œuvre manuelle de ces mécanismes.
  1. Correspondance des données pour fusionner et purger : Excel n’est pas très performant en matière de rapprochement de données. S’il peut éliminer les correspondances exactes certaines, il ne peut pas identifier les enregistrements probabilistes tels que l’utilisation de surnoms pour un individu. Les outils de la fonction de fusion ont des capacités avancées de rapprochement des données qui permettent de faire correspondre des enregistrements même si le prénom et le nom de famille varient. Par exemple, John Smit peut être la même personne que Johnny S. Dans les cas où les orthographes et les abréviations sont instantanées, vous devrez d’abord préparer les données avant de les soumettre à un processus de comparaison.
  1. Savoir quels enregistrements conserver : Une fois que vous avez repéré les enregistrements en double, nettoyé et normalisé vos données, vous pouvez décider des enregistrements à conserver et de ceux à « purger ». Ce processus, également connu sous le nom de survie des données, vous permet de créer des enregistrements propres et définitifs de vos données.
  1. Continuez à optimiser votre liste : L’activité de purge de la fusion n’est pas une activité ponctuelle. Au fur et à mesure que vous acquérez des données provenant de sources multiples et que vous continuez à développer l’image du client, vous devrez continuer à fusionner et à purger vos enregistrements. Une fois que vous avez l’enregistrement principal, il vous suffit de le comparer aux enregistrements 2, 3, 4, etc. pour continuer à enrichir vos données.

Un logiciel de purge par fusion vous aidera à mettre en œuvre cette stratégie. Cependant, d’après notre expérience, le meilleur résultat est celui où vous définissez à l’avance les enregistrements dont vous avez besoin et où vous utilisez simplement l’outil pour effectuer le rapprochement, la déduplication et le nettoyage. Plus vos objectifs de fusion/purge seront définis, plus vous pourrez utiliser l’outil pour atteindre ces objectifs rapidement et efficacement.

Comment le traitement des fusions et purges optimise le marketing et la vente directe

La fusion/purge est l’une des fonctions de traitement des données les plus importantes, qui a un impact considérable sur les objectifs, les tâches et les buts de marketing d’une entreprise. Il est évident qu’avec la complexité croissante des données, vous souhaitez optimiser vos listes et vos enregistrements afin de maximiser les objectifs de marketing, de service et de personnalisation des clients.

Au fil des ans, nous avons travaillé avec plusieurs clients du Fortune 500 pour traiter leurs données et les aider à tirer le meilleur parti d’un objectif de fusion/suppression. Les entreprises qui utilisent un outil de purge de fusion peuvent optimiser leurs listes de marketing et de vente directe de plusieurs façons, comme indiqué ci-dessous :

1. Segmentizer leurs listes jusqu’au T

Une activité de fusion/suppression ne consiste pas seulement à combiner et dédupliquer des enregistrements. Il s’agit principalement d’optimiser les listes. Vous voudriez avoir la possibilité de tester différents segments, de fusionner et de purger différentes listes et enregistrements, et d’identifier lesquelles de vos listes contribuent par leur activité aux retours sur investissement et aux objectifs marketing attendus.

Par exemple, vous voudriez diviser votre liste de marketing par courriel en catégories de produits ou de services. Supposons que vous ayez une liste active d’abonnés intéressés par les produits technologiques de votre site de commerce électronique, puis une autre liste intéressée par les produits parentaux, etc. Les outils de fusion et de purge vous permettent de séparer, de créer de nouveaux enregistrements, de sauvegarder d’anciens enregistrements et de les tester sans aucune limite.

2. Créer vos propres règles de fusion et définitions de correspondance

Les règles de fusion sont des instructions qui indiquent si vous souhaitez faire correspondre les doublons au niveau individuel (c’est-à-dire la même personne à la même adresse), au niveau du ménage (personnes ayant le même nom de famille et la même adresse) ou au niveau de l’adresse (toutes les personnes à cette adresse, quel que soit leur nom de famille). En outre, vous pouvez également créer vos propres règles si vous souhaitez établir des correspondances à différents niveaux, en fonction de votre objectif commercial. Par exemple, certains utilisateurs professionnels souhaitent faire correspondre leur liste à un niveau communautaire, organisationnel (tous les noms de l’organisation) ou même à un niveau de revenu.

En attribuant différentes règles de fusion et définitions, vous prenez des décisions en connaissance de cause plutôt que de lancer une fléchette dans le noir. En outre, ces règles vous aideront également à comprendre les lacunes de vos données et vous permettront d’obtenir un chiffre réel (par exemple, en découvrant que votre liste peut ne compter que 4 000 noms après la purge, alors que vous aviez prévu 7 000 noms).

3. Comparaison des listes avec les règles de conformité des données

La sécurité des données est l’une des principales raisons pour lesquelles les entreprises ont besoin d’outils de fusion et de purge des données. Il existe de multiples exemples de grands noms condamnés à des amendes par le gouvernement pour ne pas avoir fait correspondre leurs listes aux listes de sanctions américaines et autres bases de données autorisées.

En outre, vous pouvez également être lié par les lois GDPR, donc si vous avez une liste d’abonnés qui ne veulent pas recevoir de mails ou avoir leurs cookies stockés, vous ne pouvez pas violer cela et leur envoyer des mails. Pour les petites et moyennes entreprises, la conformité des données est d’une importance cruciale.

4. Vérifiez et validez vos données d’adresse auprès d’une base de données autorisée

Les données d’adresse sont l’un des composants les plus difficiles d’une source de données. Il est impératif de vérifier votre liste d’adresses auprès d’une base de données autorisée (comme l’USPS par exemple) pour garantir l’authenticité de vos données. En outre, il n’est pas rare qu’une entité possède plusieurs adresses, dont la plupart peuvent être fausses, non vérifiées et non valides. Il est donc logique de les valider et de les vérifier pendant le processus de fusion et de purge, afin de pouvoir se débarrasser de ceux qui sont obsolètes et d’obtenir celui qui convient.

Nous avons également abordé en détail la façon dont vous pouvez obtenir la liste de diffusion idéale, que vous pouvez consulter.

5. Réduire les coûts de marketing et augmenter l’efficacité

L’objectif final de toute activité de traitement des données est de réduire les coûts, d’augmenter le retour sur investissement et de maximiser l’efficacité opérationnelle. Le marketing est le département d’une organisation qui engendre le plus de coûts – en termes de campagnes de mailing, de campagnes sur les médias sociaux, de campagnes de newsletter, de campagnes de courrier postal et bien d’autres encore. Vous pouvez réduire considérablement les coûts de ces campagnes en ciblant des listes sélectionnées et en éliminant les doublons.

Par exemple, l’envoi de trois courriers à un utilisateur à trois adresses différentes, ou l’envoi de trois courriers à trois utilisateurs à la même adresse, est un gaspillage et pèse lourdement sur vos coûts opérationnels. À eux seuls, les retours de courrier vous coûteront des millions de dollars, sans parler des clients mécontents qui n’aiment pas recevoir plusieurs bulletins ou courriers promotionnels d’une même entreprise.

La fusion et la purge des données sont plus qu’un simple dédoublonnage rapide. Pour tirer le meilleur parti de vos données, vous devez utiliser tous les outils disponibles et planifier à l’avance. Plus vous planifierez et relierez vos listes à vos objectifs, plus vous tirerez profit de votre prochaine fusion/ purge.

La survie des données et la création du disque d’or

Le processus de purge par fusion vous permet d’identifier et de supprimer les doublons, ce qui vous laisse des enregistrements propres. Mais comment savoir quel enregistrement doit être sauvegardé et lequel doit être déplacé ?

Par exemple, comment savoir quelle est la bonne adresse d’une entité à conserver si elle a trois adresses différentes ? La réponse à cette question est « intelligente », c’est-à-dire qu’il faut établir des règles. Dans ce cas particulier, vous pouvez établir une règle des plus récentes. Toute adresse qui est la plus récemment enregistrée de l’entité sera mise à jour en utilisant la règle la plus récente.

Cette partie de la fusion des données est facile.

Le plus difficile est de savoir comment répliquer ces informations sur plusieurs bases de données qui peuvent être constituées d’anciennes adresses. Comment vous assurer que l’adresse de votre entité est mise à jour dans le CRM, l’ERP et les autres sources de données de votre organisation ?

Alors qu’auparavant, cela signifiait un autre cycle de fusion/purge, avec la disponibilité des options de survie des données dans la plupart des outils de fusion/purge, c’est devenu facile.

Il vous suffit de sélectionner les colonnes que vous souhaitez sauvegarder, ainsi que les sources vers lesquelles vous souhaitez sauvegarder les données, et la plateforme vous permettra d’écraser ces données dans vos nouveaux enregistrements. La survie des données à l’aide d’une plateforme comme DataMatch Enterprise n’est pas seulement devenue plus facile, mais permet également de gagner du temps et de l’accessibilité.

Cette capacité à obtenir une vue précise, complète et récente de votre dossier client est souvent appelée le Golden Record et constitue le but le plus précieux des objectifs de gestion des données d’une organisation. Et il est devenu beaucoup plus facile d’en faire une possibilité.

Comment fusionner des données de purge pour créer des enregistrements d’or

Pour en savoir plus, voyez comment nous avons aidé des entreprises à combiner des données provenant de sources multiples pour créer le dossier parfait.


Télécharger

Meilleures pratiques en matière de fusion et de purge des données

Quels que soient votre activité, votre secteur d’activité ou la taille de votre entreprise, une initiative de fusion/suppression constitue le fondement de vos objectifs axés sur les données. Ainsi, alors qu’historiquement, l’exercice de fusion/épuration se limitait à la combinaison et à l’élimination, il s’est transformé aujourd’hui en un mécanisme puissant qui permet aux utilisateurs de plonger en profondeur dans leurs ensembles de données.

Bien que le processus ait été largement automatisé grâce à l’utilisation d’outils avancés de purge par fusion, les utilisateurs devront toujours maintenir les meilleures pratiques. Nous recommandons à nos clients de :

  • Toujours se concentrer sur la qualité de leurs données : Des données de mauvaise qualité constituent un défi. Vous ne pouvez pas donner un sens à vos données si elles sont truffées de fautes de frappe, de faux identifiants, d’adresses invalides et de contenus désordonnés. Avant même de penser à effectuer une fusion et une purge, vous devez toujours nettoyer et normaliser les données. Cela facilite le processus de dédoublonnage. Si vous commencez par déduire les données sans les nettoyer, vous serez frustré et déçu par les résultats.
  • Ayez toujours un plan réaliste : Nous avons mentionné le plan à plusieurs reprises ci-dessus, mais nous ne pouvons nous empêcher de réitérer ce point : vous devez avoir un plan de fusion/purge. Si la simple fusion de données n’est pas ce que vous recherchez et que vous comprenez les possibilités illimitées qu’offre l’utilisation d’un outil pour aller jusqu’à la n-ième segmentation de liste, vous devez alors établir un plan qui évaluera le type d’enregistrements que vous souhaitez fusionner et purger.
  • Optimisez votre modèle : En général, après la première série de fusions/épurations, vous aurez une meilleure idée de votre modèle de données. Vous pouvez par exemple apprendre quels noms sont le plus souvent abrégés ou transformés en surnoms. Vous apprendrez à connaître les critères de correspondance, à savoir si vous souhaitez assouplir ou resserrer la correspondance (par exemple, correspondance individuelle ou correspondance à la même adresse). Une fois que vous avez une compréhension préliminaire de ce modèle, vous pouvez alors utiliser ces informations pour faire des indications de performance de campagne, des KPI et réduire le temps passé sur la prochaine activité de fusion/purge.
  • Conservez une trace de vos listes : Purger une liste ne signifie pas la supprimer entièrement. Les logiciels et outils de fusion/purge de données vous permettent de sauvegarder vos enregistrements et de maintenir une base de données de toutes les modifications que vous avez apportées à votre liste. Par exemple, dans un enregistrement, votre client peut avoir l’adresse A et maintenant il peut avoir déménagé après s’être marié. Vos enregistrements pour la même personne indiqueront l’adresse B. Cela signifie-t-il que vous supprimez l’adresse A ? Non. Au lieu de cela, vous mettrez à jour vos enregistrements en fusionnant l’adresse B dans, par exemple, une nouvelle colonne indiquant l’adresse actuelle. Vous pouvez également purger l’adresse A et créer un nouvel enregistrement avec l’adresse B, tout en conservant l’ancien enregistrement. Cette intelligence croissante peut vous aider à comprendre le comportement démographique.
  • Tenter de maintenir une source unique de vérité : des informations disparates sur vos données utilisateur vous feront perdre du temps et des efforts, à vous et à votre équipe. La meilleure utilisation d’une fonction de fusion/suppression est la création d’une source unique de vérité ou d’une vue unique du client qui contient tout ce que vous savez sur le client et qu’il est nécessaire de toujours tenir à jour. Vous recevrez des informations sur votre utilisateur à partir de plusieurs silos de données, c’est pourquoi vous devrez vous assurer que l’ancien et le nouveau sont bien alignés.

Cette source unique de vérité peut être obtenue par la mise en correspondance et la fusion de données entre plusieurs ensembles de données, au sein d’ensembles de données et entre ensembles de données. Autrement dit, vous pouvez faire correspondre l’enregistrement A [customer name] de l’ensemble de données 1 [Billing data] pour fusionner avec l’enregistrement A [customer name] de l’ensemble de données 2 [Sales data] ou Enregistrement A [customer name] avec l’enregistrement B [customer surname] de l’ensemble de données 1 et ainsi de suite.

Utilisation d’un outil de fusion-purge en libre-service

L’une des solutions les plus efficaces et les plus courantes pour créer le Golden Record sont les outils de purge de fusion qui peuvent vous aider à écraser les anciens enregistrements avec de nouvelles informations en utilisant une fonction de survie des données.

Un logiciel de fusion et de purge en libre-service permet aux utilisateurs et aux professionnels des entreprises de fusionner et de purger facilement leurs données sans nécessiter un apprentissage intensif ou des langages de programmation.

Cet outil est conçu pour aider les utilisateurs professionnels :

  • Préparer les données en les évaluant pour détecter les erreurs et la cohérence des informations.
  • Nettoyer et normaliser les données selon les règles de gestion définies.>
  • Faire correspondre plusieurs listes en utilisant une combinaison d’algorithmes propriétaires et établis
  • Supprimez les doublons avec un taux de précision de 95 à 100 %.
  • Créer des enregistrements dorés et obtenir une source unique de vérité

et bien plus encore.

Ces outils sont en train de devenir la solution phare à un problème séculaire de dépendance à l’égard de processus informatiques complexes pour fusionner/purger les données. À une époque où l’automatisation est la clé de la réussite commerciale, les entreprises ne peuvent se permettre cette dépendance et ce retard dans l’optimisation des données.

Conclusion – Utilisez une solution de fusion-purge pour créer la source parfaite de vérité

Vos données sont un bien précieux et, comme tout bien, elles doivent être entretenues. Aujourd’hui, les entreprises s’efforcent d’acquérir davantage de données et d’enrichir leur « collection », mais si les données sont inactives et occupent un espace de stockage ou de gestion de la relation client coûteux, elles doivent être éliminées. Vous pouvez simplifier un processus complexe en utilisant un logiciel de purge de fusion unique qui vous permet de fusionner vos sources de données et de créer des enregistrements de valeur.

Comment fonctionnent les meilleures solutions de correspondance floue de leur catégorie : Combinaison d’algorithmes établis et exclusifs


Télécharger

Commencez votre essai gratuit aujourd’hui

Aïe ! Nous n’avons pas retrouvé votre formulaire.

In this blog, you will find:

Try data matching today

No credit card required

« * » indique les champs nécessaires

Hidden
Ce champ n’est utilisé qu’à des fins de validation et devrait rester inchangé.

Want to know more?

Check out DME resources

Merging Data from Multiple Sources – Challenges and Solutions

Aïe ! Nous n’avons pas retrouvé votre formulaire.