Logiciel de correspondance floue

Trouvez rapidement et précisément des correspondances entre des sources de données disparates, et créez des configurations de correspondance évolutives et reproductibles. Variations floues, mal saisies et abrégées avec un minimum de faux positifs.

En toute confiance

En toute confiance

Définition

Qu'est-ce que la correspondance floue ?

La correspondance floue est utilisée pour relier des données résidant dans des tables ou des sources disparates qui ne contiennent pas d’identifiants uniques ou de clés primaires et étrangères appropriées. Dans ce cas, une combinaison d’attributs non uniques (tels que le nom de famille, le nom de l’entreprise ou l’adresse postale) est utilisée pour déterminer la probabilité que deux enregistrements soient similaires.

Pour trouver des correspondances précises, nous utilisons une combinaison de techniques de correspondance de données probabilistes brevetées et établies qui calculent la probabilité que deux chaînes de caractères soient similaires. Au lieu d’une réponse booléenne (en termes de Oui ou Non), un algorithme de correspondance floue produit une valeur en pourcentage ou un terme relatif qui marque l’indice de similarité.

Processus

Comment fonctionne la correspondance floue ?

Connexion à la source de données

Connectez la base de données, mappez les champs et sélectionnez une combinaison de champs pour la correspondance floue qui a de fortes chances d'être similaire au cas où les enregistrements appartiennent à la même entité.

Calcul du score flou

Les scores de correspondance sont calculés à l'aide de la meilleure combinaison d'algorithmes flous propriétaires et établis, tels que la distance de Levenstein, la distance d'édition, le Soundex, le Metaphone ou la similitude cosinus, etc.

Configuration de la correspondance floue

Choisissez des pondérations appropriées (donnez la priorité à certains champs plutôt qu'à d'autres), des niveaux de seuil (définissez la limite entre les correspondances et les non-correspondances) et le type de correspondance floue (basée sur les caractères, phonétique, etc.).

Classification et évaluation

Les scores sont utilisés pour classer et regrouper les enregistrements en tant que correspondance ou non-correspondance. Selon la nature des données, vous pouvez rencontrer des résultats faussement positifs et négatifs qui nécessitent une évaluation plus approfondie.

Solution

Laissez Data Ladder s'occuper de votre processus de comparaison floue.

Voir DataMatch Enterprise au travail

DataMatch Enterprise est un outil de comparaison floue très visuel et intuitif, qui automatise l’ensemble du processus de comparaison floue, vous libérant ainsi de l’effort manuel et de la main-d’œuvre nécessaires à la comparaison des champs de données. DME identifie intelligemment les acronymes, les inversions et variations de noms, les mots phonétiques, les fautes d’orthographe, ainsi que les abréviations.

DME utilise un certain nombre d’algorithmes de correspondance floue, ainsi que des correspondances exactes et phonétiques, pour identifier et faire correspondre des enregistrements parmi des millions de points de données provenant de sources multiples et disparates, notamment des bases de données relationnelles, des applications Web et des systèmes de gestion de la relation client.

Avantages pour les entreprises

Comment la correspondance floue peut-elle vous être utile ?

Facile à configurer

Réglez la sensibilité de la correspondance pour minimiser les faux positifs ou augmentez-la de quelques crans si vous préférez une saisie plus manuelle pour la précision.

Créer une vue unique du client

Brisez les silos de données en détectant les correspondances au sein de sources de données disparates et entre elles afin de créer des enregistrements en or pour une vue complète des clients.

Une plus grande précision d'adaptation

Contrairement à la correspondance déterministe, les algorithmes flous trouvent des correspondances plus précises en détectant les fausses clés, les abréviations et autres variations.

Réduire la pression sur les ressources informatiques

La mise en correspondance rapide des données en libre-service soulage le service et les ressources informatiques, ce qui permet de réduire de 80 % le temps nécessaire pour obtenir des informations.