Blog

Verwendung des Datenabgleichs zur Lösung von Identitätsauflösungsproblemen

Die Verbraucher interagieren mit einer Marke über Hunderte von Berührungspunkten auf verschiedenen Geräten, Plattformen und Kanälen. Während des Kaufprozesses nutzen die Verbraucher 3-4 Geräte mit Internetanschluss. Und bis 2021 soll die Zahl auf 13 Geräte ansteigen. Dieser exponentielle Anstieg der Gerätenutzung bedeutet auch einen plötzlichen Anstieg der Datenmenge. Diese Datenflut verlangt von den Unternehmen angemessene Strategien zur Datenbereinigung, damit ihre Unternehmensdaten stets aktuell, genau und konsistent sind.

Unternehmen sammeln diese Daten an verschiedenen Kontaktpunkten mit den Verbrauchern und nutzen sie, um bessere, personalisierte Erlebnisse für sie zu schaffen. Und wenn Daten über mehrere unterschiedliche Systeme erfasst werden – was heutzutage in der Regel der Fall ist -, ist es von entscheidender Bedeutung, eine Identitäts- oder Entitätsauflösung durchzuführen.

Identitätsauflösung: der Prozess der Verknüpfung mehrerer Datensätze auf der Grundlage von „eindeutigen Kennungen“, so dass alle übereinstimmenden Datensätze einen einzigen Nutzer/eine einzige Person darstellen.

Der Identitätsauflösungsprozess liefert eine einzige, genaue 360-Grad-Ansicht jeder Entität, einschließlich all ihrer Verhaltens-, Transaktions- und Engagement-Datensätze, die miteinander verbunden sind. Auf diese Weise sind Sie in der Lage, den gesamten Umfang des Benutzers zu verstehen, anstatt zu versuchen, aus unzusammenhängenden Informationen einen Sinn zu ziehen.

Warum braucht Ihr Unternehmen eine Identitätsauflösung?

Organisationen verkennen in der Regel die tatsächliche Bedeutung der Entitätsauflösung für ihr Unternehmen. Es geht nicht nur darum, einen Interessenten/Kunden in einer E-Mail mit seinem richtigen Vornamen anzusprechen. Vielmehr geht es darum, einen weiteren bewussten Schritt zu tun, um Ihre potenziellen Kunden besser kennenzulernen und personalisierte Erfahrungen für sie zu entwickeln. Es geht darum, Muster und Verhaltensweisen zu identifizieren, die mit einem einzelnen Nutzer über verschiedene Interaktionssysteme hinweg verbunden sind, und diese zu nutzen, um die Markenwirkung und die Lead-Konversion zu maximieren.

Wie in der Forrester-Studie erwähnt : Ist Ihr Identitätsprogramm auf einem Kartenhaus aufgebaut? finden Sie hier die 5 wichtigsten Gründe für die Implementierung von Entity Resolution in Ihren Datenbanken:

  1. Vollständigere Profile Ihrer Leads, Interessenten und Kunden, die es Ihnen ermöglichen, bessere, personalisierte Erlebnisse entsprechend ihrer Verhaltensmuster und Vorlieben zu gestalten.
  2. Bessere Datenkontrolle und -sicherheit für Ihre Unternehmensdaten, die Ihnen die Einhaltung von Standards und Richtlinien wie GDPR, CCPA, HIPAA usw. ermöglichen.
  3. Gelegenheiten zum Upselling und Cross-Selling Ihrer Produkte und Dienstleistungen an bestehende Kunden und zur Gestaltung der Customer Journey durch das Angebot relevanter Empfehlungen.
  4. Genauere und effektivere Messung von Marketingdaten wie qualifizierte Leads, Lead-Konversionsraten, Rentabilität von Marketinginvestitionen, Kundenbindung usw.
  5. Verbesserte Datenanalysen, die einen genauen, vollständigen und konsistenten Überblick über Markenimage, -wahrnehmung und -erfahrung bieten.

Wie wird die Identität aufgelöst?

Bei einem Identitätsauflösungsprozess werden drei Arten von Informationen über eine Person miteinander in Beziehung gesetzt:

Terrestrische Informationen: Dazu gehören die persönlichen Kontaktinformationen eines Nutzers, wie Name, Privat- und Arbeitsadresse, Telefonnummer usw.
Geräteinformationen: Dazu gehören IP-Daten oder andere Informationen zur eindeutigen Identifizierung der Geräte, die mit einem Nutzer verbunden sind.
Digitale Informationen: Dazu gehören E-Mail-Adressen, Profile in sozialen Medien, Website-Besuche, CTA-Klicks, Downloads von Ressourcen usw.

Der Prozess der Identitätsauflösung umfasst die folgenden fünf Schritte:

Schritt 1: Identifizieren Sie Variablen, die eine Entität darstellen:

Es geht darum, verschiedene Plattformen, Kanäle und Geräte zu identifizieren, die von einer Entität während ihrer Kaufreise genutzt werden.

Schritt 2: Abbildung aller Benutzerinteraktionen

In diesem Schritt werden die in Schritt 1 gesammelten Informationen miteinander in Beziehung gesetzt, um verschiedene Interaktionen oder Berührungspunkte zu konstruieren, die ein Nutzer mit Ihrer Marke hatte.

Schritt 3: Aufbau der Buyer’s Journey durch Datenabgleich

Nun, da Sie alle Berührungspunkte eines Nutzers identifiziert haben, ist es an der Zeit, die verschiedenen Interaktionen miteinander in Beziehung zu setzen, um die komplette Customer’s Journey zu verstehen. In diesem Schritt müssen Sie einen Datensatzabgleich all dieser Interaktionen durchführen, damit Sie beurteilen können, welche von ihnen zur selben Entität gehören.

In wenigen Fällen ist dieser Datenabgleich recht einfach, da es immer einige Informationen gibt, die für jeden Datensatz eindeutig sind, wie z. B. die E-Mail-Adresse oder die IP-Adresse. In Fällen, in denen es keine eindeutigen Identifikatoren gibt, müssen jedoch komplexe Algorithmen für den Datenabgleich implementiert werden, um einen phonetischen, numerischen oder unscharfen Abgleich durchzuführen.

Schritt 4: Validierung der übereinstimmenden Ergebnisse

In diesem Schritt müssen Sie überprüfen, ob die Interaktionen, die als zu derselben Person gehörig gekennzeichnet sind, angemessen erscheinen, und Sie müssen entscheiden, welche Interaktionen nicht zugeordnet werden sollen.

Schritt 5: Erstellen der Goldenen Schallplatte

Auf der Grundlage der abgeglichenen und validierten Ergebnisse können Sie nun einen goldenen Master-Datensatz erstellen, der als einzige Quelle der Wahrheit dient und die gesamte Reise Ihrer Leads, Interessenten und Kunden aufzeigt. Dies wird zur treibenden Kraft für alle Ihre Marketing- und Verkaufsanstrengungen, da es eine genaue, korrekte und konsistente Sicht auf die Daten ermöglicht.

Herausforderungen, die bei der Auflösung von Entitäten zu bewältigen sind

Der Prozess der Identitätsauflösung ist ziemlich einfach. Bei der Durchführung dieser Schritte treten jedoch zahlreiche Herausforderungen auf. Die wichtigsten Herausforderungen sind im Folgenden aufgeführt:

Fehlende, unvollständige oder inkonsistente eindeutige Erkennungsmerkmale

Wie im obigen Prozess erläutert, werden alle Nutzerinteraktionen miteinander in Beziehung gesetzt, um die komplette Buyer’s Journey zu konstruieren. Dies geschieht auf der Grundlage der Datenfelder, die die Entität eindeutig identifizieren, z. B. E-Mail-Adresse, Geräte-IP-Informationen usw. Es ist jedoch ziemlich schwierig, vollständige und konsistente eindeutige Bezeichner in all Ihren Datensätzen zu haben, die aus verschiedenen Systemen stammen. Hier sind einige Szenarien, die gelöst werden müssen, bevor ein genauer Datenabgleich stattfinden kann:

  1. Eindeutige Identifikatoren sind vorhanden, aber unvollständig: Dies geschieht, wenn verschiedene Systeme die eindeutig identifizierenden Datenfelder für einige Benutzerinteraktionen aus irgendeinem Grund nicht erfassen können.
  2. Es gibt zwar eindeutige Identifikatoren, aber sie sind inkonsistent: Dies geschieht, wenn Daten aus verschiedenen Systemen integriert werden, um den Weg des Käufers zu vervollständigen. In diesem Fall haben Sie in jedem Datensatz eindeutige Bezeichner, die jedoch nicht identisch sind. Vielleicht verwendet eine Anwendung die E-Mail-Adresse, um einen Benutzer zu identifizieren, während die andere Anwendung die IP-Adresse verwendet.
  3. Eindeutige Bezeichner gibt es überhaupt nicht: In diesem Fall müssen Sie verschiedene Felder miteinander kombinieren, um eine Interaktion eindeutig zu identifizieren. So kann beispielsweise das Namensfeld zusammen mit der Telefonnummer oder der Postanschrift einem Benutzerinteraktionsdatensatz Einzigartigkeit verleihen.

Unbereinigte und nicht standardisierte Daten

Schlechte Datenqualität ist ein weiteres häufiges Problem im Zusammenhang mit der Auflösung von Entitäten. Damit Ihre Datensätze vergleichbar und auflösbar sind, um Entitäten zu bilden, benötigen Sie saubere und standardisierte Daten. Dazu müssen Sie sicherstellen, dass Ihre Datensätze Informationen enthalten, die korrekt, vollständig, konsistent, eindeutig, gültig und aktuell sind. Wenn Ihre Datensätze diese sechs kritischen Dimensionen der Datenqualität nicht erfüllen, müssen Sie damit rechnen, dass Ihre aufgelösten Entitäten eine sehr geringe Genauigkeit aufweisen.

Rechnerische Komplexität

Bei der Auflösung von Entitäten geht es um den Vergleich von Datensätzen, um festzustellen, welche Datensätze zu ein und derselben Person gehören. Dabei muss jeder Datensatz mit jedem anderen Datensatz desselben Datensatzes verglichen werden. Und da die meisten Unternehmen mehrere Datenanwendungen verwenden, die Benutzerinteraktionen verfolgen, wird ein einzelner Datensatz auch mit allen Datensätzen in mehreren Datensätzen verglichen.

Es ist zu erwarten, dass der Rechenaufwand für diese Vergleiche mit der Größe der Datenbank quadratisch ansteigt. Dies zeigt, dass Ihr Identitätsauflösungsprozess mit einem Datensystem durchgeführt werden muss, das einer solch komplexen Rechenleistung standhalten kann.

Abstimmung von Algorithmen zum Abgleich von Datensätzen zur Maximierung der Genauigkeit

Da Datenabgleichsalgorithmen so abgestimmt werden müssen, dass sie bei einem bestimmten Datensatz eine maximale Genauigkeit erreichen, ist es eine große Herausforderung, sicherzustellen, dass mit den von Ihnen abgestimmten Variablen die geringste Anzahl falsch positiver und negativer Ergebnisse erzielt wird.

Eines der Hauptprobleme bei der Auflösung von Entitäten ist der hohe Aufwand, der mit der manuellen Überprüfung jedes falsch klassifizierten oder nicht zugeordneten Datensatzes verbunden ist. Herkömmliche Datenabgleichsmethoden, die sich ausschließlich auf deterministische Algorithmen stützen, helfen den Unternehmen kaum aus diesem Dilemma. Außerdem ermöglichen sie keine einfache Feinabstimmung, so dass es für den Nutzer schwierig ist, wirklich optimale Ergebnisse zu erzielen.

Verwendung einer Self-Service-Datenbereinigungs- und Abgleichsmaschine zur Identitätsauflösung

Wir haben den gesamten Prozess der Identitätsauflösung sowie die Herausforderungen, die bei seiner Umsetzung üblicherweise auftreten, untersucht. Zur Bewältigung dieser Herausforderungen können mehrere Lösungen und Systeme eingesetzt werden. Die klügste Entscheidung ist jedoch die Anpassung eines automatisierten Self-Service-Tools, das die verschiedenen Schritte der Datenprofilierung, -bereinigung, -abgleichung, -deduplizierung und -zusammenführung in einer einzigen Plattform durchführt.

Der Datenabgleich ist Teil des DataMatch Enterprise Datenqualitätsmanagement-Frameworks, das es den Benutzern ermöglicht, Datensätze über mehrere Datenquellen hinweg abzugleichen, zusammenzuführen und abzuleiten. Das Besondere an DME ist die Möglichkeit, mehrere Datenquellen gleichzeitig zu verbinden, um einen Abgleich über alle Datenquellen hinweg zu ermöglichen.

DataMatch Enterprise von Data Ladder basiert auf intelligenten Algorithmen des maschinellen Lernens und erreicht eine Trefferquote von 95 bis 100 %, da es mehrere Algorithmen gleichzeitig einsetzt, um Datenmuster auf mögliche Übereinstimmungen zu prüfen. Die Software ermöglicht auch die Feinabstimmung von Übereinstimmungen, so dass der Benutzer unbegrenzte Möglichkeiten hat, die Daten zu verfeinern.

Wie die besten Fuzzy-Matching-Lösungen funktionieren: Kombination von bewährten und eigenen Algorithmen


Herunterladen

Identitätsauflösung für Behörden und öffentliche Einrichtungen

Lesen Sie dieses Whitepaper, um zu erfahren, wie wir Behörden und öffentlichen Einrichtungen bei der Bewältigung von Herausforderungen bei der Identitätsauflösung mit unserer robusten Lösung geholfen haben.


Herunterladen

In this blog, you will find:

Try data matching today

No credit card required

*“ zeigt erforderliche Felder an

Hidden
Dieses Feld dient zur Validierung und sollte nicht verändert werden.

Want to know more?

Check out DME resources

Merging Data from Multiple Sources – Challenges and Solutions

Oops! Wir konnten dein Formular nicht lokalisieren.