Fuzzy-Matching-Software

Finden Sie schnell und präzise Übereinstimmungen in unterschiedlichen Datenquellen, und erstellen Sie skalierbare und wiederholbare Abgleichskonfigurationen. Unscharfe, falsch getippte und abgekürzte Varianten mit minimalen Fehlalarmen.

Vertrauenswürdig von

Vertrauenswürdig von

Definition

Was ist Fuzzy Matching?

Der unscharfe Abgleich wird verwendet, um Daten zu verknüpfen, die sich in unterschiedlichen Tabellen oder Quellen befinden und keine eindeutigen Bezeichner oder geeignete Primär- und Fremdschlüssel enthalten. In solchen Fällen wird eine Kombination von nicht eindeutigen Attributen (wie Nachname, Firmenname oder Adresse) verwendet, um die Wahrscheinlichkeit zu ermitteln, dass zwei Datensätze ähnlich sind.

Um genaue Übereinstimmungen zu finden, verwenden wir eine Kombination aus proprietären und bewährten probabilistischen Datenabgleichsverfahren, die die Wahrscheinlichkeit berechnen, dass zwei Zeichenfolgen ähnlich sind. Anstelle einer booleschen Antwort (im Sinne von Ja oder Nein) gibt ein Fuzzy-Matching-Algorithmus einen Prozentwert oder einen relativen Begriff aus, der den Ähnlichkeitsindexkennzeichnet .

Verfahren

Wie funktioniert der Fuzzy-Abgleich?

Verbindung zur Datenquelle

Verbinden Sie die Datenbank, ordnen Sie Felder zu und wählen Sie eine Kombination von Feldern für den Fuzzy-Abgleich aus, die mit hoher Wahrscheinlichkeit ähnlich sind, falls die Datensätze zur gleichen Entität gehören.

Fuzzy-Score-Berechnung

Die Übereinstimmungswerte werden mit der besten Kombination aus proprietären und etablierten Fuzzy-Algorithmen wie Levenstein-Distanz, Edit-Distanz, Soundex, Metaphone oder Cosinus-Ähnlichkeit usw. berechnet.

Fuzzy-Match-Konfiguration

Wählen Sie geeignete Gewichtungen (bestimmte Felder werden stärker gewichtet als andere), Schwellenwerte (legen Sie die Grenze zwischen Übereinstimmungen und Nicht-Übereinstimmungen fest) und die Art des Fuzzy-Abgleichs (zeichenbasiert, phonetisch usw.).

Klassifizierung und Bewertung

Scores werden verwendet, um Datensätze als übereinstimmend oder nicht übereinstimmend zu klassifizieren und zu gruppieren. Je nach Art der Daten können Sie auf einige falsch positive und negative Ergebnisse stoßen, die eine weitere Auswertung erfordern.

Lösung

Überlassen Sie Data Ladder Ihren Fuzzy-Matching-Prozess

Sehen Sie sich DataMatch Enterprise bei der Arbeit an

DataMatch Enterprise ist ein hochgradig visuelles und intuitives Fuzzy-Matching-Tool, das den gesamten Fuzzy-Matching-Prozess automatisiert und Ihnen den manuellen Aufwand für den Abgleich von Datenfeldern abnimmt. DME identifiziert auf intelligente Weise Akronyme, Namensumkehrungen und -variationen, phonetische Wörter, Rechtschreibfehler sowie Abkürzungen.

DME nutzt eine Reihe von Fuzzy-Matching-Algorithmen sowie exakten und phonetischen Abgleich, um Datensätze in Millionen von Datenpunkten aus verschiedenen und unterschiedlichen Datenquellen wie relationalen Datenbanken, Webanwendungen und CRMs zu identifizieren und abzugleichen.

Geschäftsvorteile

Wie können Sie vom Fuzzy Matching profitieren?

Einfach zu konfigurieren

Passen Sie die Abgleichsempfindlichkeit an, um Fehlalarme zu minimieren, oder erhöhen Sie sie um einige Stufen, wenn Sie mehr manuelle Eingaben für die Genauigkeit bevorzugen.

Erstellen einer Einzelkundenansicht

Brechen Sie Datensilos auf, indem Sie Übereinstimmungen innerhalb und zwischen verschiedenen Datenquellen erkennen, um goldene Datensätze für einen vollständigen Überblick über Kunden zu erstellen.

Höhere Anpassungsgenauigkeit

Im Gegensatz zum deterministischen Abgleich finden Fuzzy-Algorithmen präzisere Übereinstimmungen, indem sie falsch geschriebene, abgekürzte und andere Varianten erkennen.

Verringerung der Belastung der IT-Ressourcen

Schneller Self-Service-Fuzzy-Abgleich entlastet die IT-Abteilung und -Ressourcen und beschleunigt die Zeit bis zur Einsichtnahme um bis zu 80 %.

Relevant für reale Anwendungen

Fuzzy-Algorithmen eignen sich am besten für die Suche nach Übereinstimmungen, wenn Datensätze Tippfehler, System- und Formatierungsfehler sowie Eingabeprobleme aufweisen.

Daten anreichern für tiefere Einblicke

Durch die Verknüpfung ähnlicher Datensätze aus externen Quellen können Unternehmen goldene Datensätze mit zusätzlichen Daten und Informationen anreichern.

Lass uns vergleichen

Wie genau ist unsere Lösung?

Bei internen Implementierungen besteht eine Wahrscheinlichkeit von 10 %, dass internes Personal verloren geht, sodass über 5 Jahre hinweg die Hälfte der internen Implementierungen das Kernmitglied verlieren, das das Matching-Programm durchgeführt und verstanden hat.

Detaillierte Tests wurden an 15 verschiedenen Produktvergleichen mit Universitäten, Behörden und privaten Unternehmen durchgeführt (80.000 bis 8 Mio. Datensätze) und die folgenden Ergebnisse wurden gefunden: (Hinweis: Dies schließt die Auswirkungen von falsch positiven Ergebnissen ein)

Features of the solutionData LadderIBM Quality StageSAS DatafluxIn-House SolutionsComments
Match Accuracy (Between 40K to 8M record samples)96%91%84%65-85%Multi-threaded, in-memory, no-SQL processing to optimize for speed and accuracy. Speed is important, because the more match iterations you can run, the more accurate your results will be.
Software SpeedVery FastFastFastSlowA metric for ease of use. Here speed indicates time to first result, not necessary full cleansing.
Time to First Result15 Minutes2 Months+2 Months+3 Months+
Purchasing/Licensing Costing80 to 95% Below Competition$370K+$220K+$250K+Includes base license costs.

Häufig gestellte Fragen

Haben Sie weitere Fragen? Schau dir das an

Mehrere Faktoren können die Anzahl der falsch-negativen Ergebnisse Ihrer Fuzzy-Abgleiche erhöhen, z. B. die Auswahl ungeeigneter Datenfelder, zu enge Abgleichskriterien und ungeeignete Schwellenwerte für Fuzzy-Abgleiche.
Führen Sie vor dem Abgleich Datenprofilprüfungen durch, um den Zustand Ihrer Daten zu verstehen. Führen Sie bei Bedarf Datenbereinigungs- und Standardisierungsaktivitäten durch, um vorhandene Inkonsistenzen oder ungültige Informationen zu beseitigen. Darüber hinaus kann der Einsatz eines Self-Service-Tools für den Fuzzy-Abgleich die Geschwindigkeit und Genauigkeit des Abgleichs deutlich verbessern.

bereit? Lass uns gehen

Probieren Sie es jetzt aus oder holen Sie sich eine Demo mit einem Experten!

*“ zeigt erforderliche Felder an

Auswahl*
Dieses Feld dient zur Validierung und sollte nicht verändert werden.