{"id":62370,"date":"2021-03-31T00:00:00","date_gmt":"2021-03-31T04:00:00","guid":{"rendered":"https:\/\/dataladder.com\/ein-detaillierter-leitfaden-zur-verwendung-von-entity-resolution-tools-fuer-unternehmensdatenprojekte\/"},"modified":"2022-04-13T19:58:13","modified_gmt":"2022-04-13T19:58:13","slug":"ein-detaillierter-leitfaden-zur-verwendung-von-entity-resolution-tools-fuer-unternehmensdatenprojekte","status":"publish","type":"post","link":"https:\/\/dataladder.com\/de\/ein-detaillierter-leitfaden-zur-verwendung-von-entity-resolution-tools-fuer-unternehmensdatenprojekte\/","title":{"rendered":"Ein detaillierter Leitfaden zur Verwendung von Entity Resolution Tools f\u00fcr Unternehmensdatenprojekte"},"content":{"rendered":"<p>Unsaubere, unstrukturierte strukturierte Daten, mehr als ein Dutzend Namensvarianten und inkonsistente Felddefinitionen in verschiedenen Quellen. Dieser Wurmfortsatz ist f\u00fcr jeden Datenanalysten, der an einem Projekt mit Tausenden von Datens\u00e4tzen arbeitet, ein fast schon st\u00e4ndiges Berufsrisiko. Und die Auswirkungen sind alles andere als gew\u00f6hnlich:<\/p>\n<ol>\n<li>Globale Finanzinstitute wurden im Jahr 2020 wegen Nichteinhaltung von Compliance-Vorschriften mit Strafen in H\u00f6he <a href=\"https:\/\/www.caymancompass.com\/2020\/08\/25\/global-banks-hit-with-us5-6-billion-in-compliance-fines-in-2020\/\" target=\"_blank\" rel=\"noopener\"> von 5,6 Milliarden Dollar<\/a> belegt<\/li>\n<li>Eine Umfrage von Black Book Market Research hat ergeben, dass ein Drittel der Leistungsantr\u00e4ge in Gesundheitseinrichtungen wegen unzureichender Patientenzuordnung abgelehnt werden.<\/li>\n<li><a href=\"https:\/\/blog.zoominfo.com\/cure-for-the-common-cold-call-infographic\/\" target=\"_blank\" rel=\"noopener\">Vertriebsmitarbeiter verlieren 25 % ihrer Zeit<\/a> aufgrund von schlechten Interessentendaten.<\/li>\n<\/ol>\n<p>Hier ist also die Schl\u00fcsselfrage: Gibt es einen besseren Weg, diese Probleme zu \u00fcberwinden?<\/p>\n<p>Im Gegensatz zu Entity-Resolution-Tools, die Daten von mehreren Punkten aus erfassen und nicht exakte \u00dcbereinstimmungen in beispielloser Geschwindigkeit finden k\u00f6nnen, erweist sich die manuelle Entity-Resolution von Daten mithilfe komplexer Algorithmen und Techniken als ein weitaus kostspieligeres (um nicht zu sagen anstrengendes) Unterfangen. Untersuchungen von <a href=\"https:\/\/www.gartner.com\/smarterwithgartner\/how-to-create-a-business-case-for-data-quality-improvement\/\" target=\"_blank\" rel=\"noopener\">Gartner <\/a>haben ergeben, dass eine schlechte Datenqualit\u00e4t Unternehmen jedes Jahr 15 Millionen Dollar kostet &#8211; insbesondere bei Unternehmen, deren Gesch\u00e4ftst\u00e4tigkeit sich \u00fcber mehrere Gebiete und Gesch\u00e4ftseinheiten erstreckt.<\/p>\n<p>In diesem detaillierten Leitfaden erfahren Sie, wie die Entit\u00e4tsaufl\u00f6sung funktioniert, warum die manuelle Entit\u00e4tsaufl\u00f6sung f\u00fcr Unternehmen problematisch ist und warum die Entscheidung f\u00fcr Entit\u00e4tsaufl\u00f6sungstools optimal ist.<\/p>\n<h3><b>Was ist Entity Resolution?<\/b><\/h3>\n<p>Das Buch <a href=\"https:\/\/www.sciencedirect.com\/book\/9780123819727\/entity-resolution-and-information-quality\" target=\"_blank\" rel=\"noopener\">Entity Resolution and Information Quality<\/a> beschreibt die Entit\u00e4tsaufl\u00f6sung (ER) als &#8222;die Bestimmung, wann Verweise auf reale Entit\u00e4ten \u00e4quivalent sind (sich auf dieselbe Entit\u00e4t beziehen) oder nicht \u00e4quivalent (sich auf verschiedene Entit\u00e4ten beziehen)&#8220;.<\/p>\n<p>Mit anderen Worten, es handelt sich um den Prozess der Identifizierung und Verkn\u00fcpfung mehrerer Datens\u00e4tze mit derselben Entit\u00e4t, wenn die Datens\u00e4tze unterschiedlich beschrieben sind und umgekehrt.<\/p>\n<p>Sie stellt zum Beispiel die Frage: Sind die Dateneintr\u00e4ge &#8222;Jon Snow&#8220; und &#8222;John Snowden&#8220; dieselbe Person oder handelt es sich um zwei v\u00f6llig unterschiedliche Personen?<\/p>\n<p>Dies gilt auch f\u00fcr Adressen, Post- und Postleitzahlen, Sozialversicherungsnummern usw.<\/p>\n<p>ER wird durchgef\u00fchrt, indem die \u00c4hnlichkeit mehrerer Datens\u00e4tze anhand eindeutiger Bezeichner \u00fcberpr\u00fcft wird. Dies sind Datens\u00e4tze, die sich im Laufe der Zeit am wenigsten \u00e4ndern (z. B. Sozialversicherungsnummern, Geburtsdatum, Postleitzahlen usw.). Um herauszufinden, ob diese Datens\u00e4tze identisch sind oder nicht, m\u00fcssen sie mit einem eindeutigen Bezeichner abgeglichen werden:<\/p>\n<p><img src=\"https:\/\/dataladder.com\/wp-content\/uploads\/2020\/09\/xDL_Merging-Data-Cleansing-Graphic.png.pagespeed-1.jpg\" sizes=\"(max-width: 449px) 100vw, 449px\" srcset=\"https:\/\/dataladder.com\/wp-content\/uploads\/2020\/09\/xDL_Merging-Data-Cleansing-Graphic.png.pagespeed-1.jpg 449w, https:\/\/dataladder.com\/wp-content\/uploads\/2020\/09\/xDL_Merging-Data-Cleansing-Graphic.png.pagespeed-1-229x300.jpg 229w\" alt=\"\" width=\"449\" height=\"587\" \/><\/p>\n<p>Im obigen Beispiel werden John Oneil, Johnathan O und Johny O&#8217;neal durch einen eindeutigen Identifikator, n\u00e4mlich die nationale ID-Nummer, miteinander verglichen.<\/p>\n<p>ER besteht in der Regel aus der Verkn\u00fcpfung und dem Abgleich von Daten \u00fcber mehrere Datens\u00e4tze hinweg, um m\u00f6gliche Duplikate zu finden und die \u00fcbereinstimmenden Duplikate zu entfernen, weshalb es austauschbar mit verwendet wird:<\/p>\n<ol>\n<li><a href=\"https:\/\/dataladder.com\/de\/eine-kurzanleitung-fuer-software-zur-datensatzverknuepfung\/\" target=\"_blank\" rel=\"noopener\">Verkn\u00fcpfung von Datens\u00e4tzen<\/a><\/li>\n<li><a href=\"https:\/\/dataladder.com\/de\/fuzzy-matching-101-bereinigung-und-verknuepfung-ungeordneter-daten\/\" target=\"_blank\" rel=\"noopener\">Fuzzy-Matching<\/a><\/li>\n<li><a href=\"https:\/\/dataladder.com\/de\/merge-purge-software-integrierte-und-benutzerdefinierte-ueberlebensregeln-verwenden\/\" target=\"_blank\" rel=\"noopener\">Zusammenf\u00fchren\/S\u00e4ubern<\/a><\/li>\n<li>Clustering von Entit\u00e4ten<\/li>\n<li><a href=\"https:\/\/dataladder.com\/de\/datendeduplizierungssoftware-verwenden-sie-integrierte-und-benutzerdefinierte-regeln-fuer-die-crm-deduplizierung\/\" target=\"_blank\" rel=\"noopener\">Deduplizierung <\/a>und mehr<\/li>\n<\/ol>\n<h3><b>Wie die Entit\u00e4tsaufl\u00f6sung in der Praxis funktioniert<\/b><\/h3>\n<p>Bei einer ER-Aktivit\u00e4t sind mehrere Schritte erforderlich. Schauen wir uns diese im Detail an.<\/p>\n<h4><b>Verschlucken<\/b><\/h4>\n<p>Dabei werden alle Daten aus verschiedenen Quellen in einer zentralen Ansicht zusammengefasst. Ein Unternehmen hat oft Daten, die \u00fcber verschiedene Datenbanken, CRMs, Excel und PDFs verstreut sind und Datenformate wie String, Datum und beides enthalten.<\/p>\n<p>Ein gro\u00dfes Hypotheken- und Finanzdienstleistungsunternehmen kann beispielsweise \u00fcber eine zentrale Datenbank in MySQL, \u00fcber Antragsformulardaten im PDF-Format und \u00fcber die Liste seiner Hausbesitzer in Excel verf\u00fcgen. Durch den Import von Daten aus all diesen Quellen wird die Grundlage f\u00fcr die Verkn\u00fcpfung von Datens\u00e4tzen und das Auffinden von Duplikaten geschaffen. F\u00fcr weitere Informationen klicken Sie bitte <a href=\"https:\/\/dataladder.com\/de\/zusammenfuehrung-von-daten-aus-mehreren-quellen-herausforderungen-und-loesungen\/\" target=\"_blank\" rel=\"noopener\">hier<\/a>.<\/p>\n<p>In anderen F\u00e4llen kann die Kombination verschiedener Quellen zu einer einzigen auch bedeuten, dass das Schema der Datenbanken f\u00fcr die weitere Verarbeitung in ein einziges vordefiniertes Schema ge\u00e4ndert wird.<\/p>\n<h4><b>Profilierung<\/b><\/h4>\n<p>Nachdem die Datenquellen importiert wurden, wird in einem n\u00e4chsten Schritt ihr Zustand \u00fcberpr\u00fcft, um statistische Anomalien in Form von fehlenden und ungenauen Daten sowie Probleme mit der Gro\u00df- und Kleinschreibung zu erkennen. Im Idealfall versucht ein Datenanalyst, potenzielle Problembereiche zu finden, die behoben werden m\u00fcssen, bevor er irgendeine Art von Bereinigung und Entit\u00e4tsaufl\u00f6sung vornimmt.<\/p>\n<p>Hier kann ein Benutzer pr\u00fcfen, ob die Felder mit RegEx \u00fcbereinstimmen &#8211; regul\u00e4re Ausdr\u00fccke, die Zeichenkettentypen f\u00fcr verschiedene Datenfelder bestimmen. Auf dieser Grundlage kann der Benutzer feststellen, wie viele Datens\u00e4tze entweder unsauber sind oder nicht einer bestimmten Kodierung entsprechen.<\/p>\n<p>Dies kann dazu beitragen, wichtige Datenstatistiken zu ermitteln, einschlie\u00dflich, aber nicht beschr\u00e4nkt auf:<\/p>\n<ol>\n<li>Vorhandensein von Nullwerten, z. B. fehlende E-Mail-Adressen in Lead-Gen-Formularen<\/li>\n<li>Anzahl der Datens\u00e4tze mit vorangestellten und nachgestellten Leerzeichen z. B. David Matthews<\/li>\n<li>Probleme mit der Zeichensetzung, z. B. hotmail,com statt Hotmail.com<\/li>\n<li>Geh\u00e4useprobleme, z. B. NEW YORK, DAVID MATTHEWS, MICROSOFT<\/li>\n<li>Vorhandensein von Buchstaben in Zahlen und umgekehrt, z. B. TEL-516 570-9251 f\u00fcr die Kontaktnummer und NJ43 f\u00fcr den Staat<\/li>\n<\/ol>\n<h4><b>Deduplizierung und Datensatzverkn\u00fcpfung<\/b><\/h4>\n<p>Durch den Abgleich werden mehrere Datens\u00e4tze, die sich potenziell auf dieselbe Entit\u00e4t beziehen, zusammengef\u00fchrt, um Duplikate zu entfernen, oder anhand eindeutiger Kennungen dedupliziert. Die Abgleichtechniken k\u00f6nnen je nach Art des Feldes variieren, z. B. exakt, unscharf oder phonetisch.<\/p>\n<p>Bei Namen zum Beispiel wird h\u00e4ufig eine exakte \u00dcbereinstimmung verwendet, wenn eindeutige Identifikatoren wie die Sozialversicherungsnummer oder die Adresse im gesamten Datensatz korrekt sind. Wenn die eindeutigen Bezeichner ungenau oder ung\u00fcltig sind, erweist sich der unscharfe Abgleich als eine viel zuverl\u00e4ssigere Form des Abgleichs, um zwei \u00e4hnliche Datens\u00e4tze (z. B. John Snow und Jon Snowden) problemlos miteinander zu verbinden.<\/p>\n<p>Deduplizierung und Datensatzverkn\u00fcpfung werden in den meisten F\u00e4llen als ein und dieselbe Sache verstanden. Ein wesentlicher Unterschied besteht jedoch darin, dass es bei ersterem darum geht, <a href=\"https:\/\/dataladder.com\/de\/die-angst-vor-doppelten-daten-ein-leitfaden-zur-datendeduplizierung\/\" target=\"_blank\" rel=\"noopener\">Duplikate zu erkennen<\/a> und innerhalb desselben Datensatzes zu konsolidieren (d. h. das Schema zu normalisieren), w\u00e4hrend es bei letzterem darum geht, die deduplizierten Daten mit anderen Datens\u00e4tzen oder Datenquellen abzugleichen.<\/p>\n<h4><b>Kanonisierung<\/b><\/h4>\n<p>Die Kanonisierung ist ein weiterer wichtiger Schritt in ER, bei dem Entit\u00e4ten, die mehrere Darstellungen haben, in eine Standardform umgewandelt werden. Dabei werden die vollst\u00e4ndigsten Informationen als endg\u00fcltiger Datensatz verwendet und Ausrei\u00dfer oder verrauschte Daten, die die Daten verzerren k\u00f6nnten, ausgelassen.<\/p>\n<h4><b>Blockieren<\/b><\/h4>\n<p>Bei der Suche nach \u00dcbereinstimmungen f\u00fcr eine Entit\u00e4t in Hunderten und Tausenden von Datens\u00e4tzen k\u00f6nnen die potenziellen Kombinationen, die zu den richtigen \u00dcbereinstimmungen f\u00fchren k\u00f6nnten, in die Tausende (wenn nicht Millionen) gehen. Um dieses Problem zu vermeiden, wird das Blockieren verwendet, um die m\u00f6glichen Paarungen durch spezifische Gesch\u00e4ftsregeln einzuschr\u00e4nken.<\/p>\n<h3><b>Herausforderungen bei der Aufl\u00f6sung von Entit\u00e4ten<\/b><\/h3>\n<p>Trotz der vielen Ans\u00e4tze und Techniken, die f\u00fcr die Notaufnahme zur Verf\u00fcgung stehen, ist sie in vielerlei Hinsicht unzureichend. Dazu geh\u00f6ren:<\/p>\n<h4><b>1. ER funktioniert nur gut, wenn die Daten reichhaltig und konsistent sind<\/b><\/h4>\n<p>Das vielleicht gr\u00f6\u00dfte Problem von ER ist, dass die Genauigkeit der \u00dcbereinstimmungen von der Reichhaltigkeit und Konsistenz der Daten in den verschiedenen Datens\u00e4tzen abh\u00e4ngt.<\/p>\n<p>Der deterministische Abgleich ist zum Beispiel recht einfach. Angenommen, Sie haben &#8222;Mike Rogers&#8220; in Datenbank 1 und &#8222;Mike Rogers&#8220; in Datenbank 2. Durch einfache Datensatzverkn\u00fcpfung (oder exakte \u00dcbereinstimmung) k\u00f6nnen wir leicht feststellen, dass ein Datensatz ein Duplikat eines anderen ist.<\/p>\n<p>Ein probabilistischer Abgleich, bei dem \u00e4hnliche Datens\u00e4tze in Form von Schreibfehlern, Abk\u00fcrzungen oder Spitznamen existieren (z. B. &#8222;Mike Rogers&#8220; in Datenbank 1 und &#8222;Michael Rogers&#8220; in Datenbank 2), sieht jedoch anders aus. Ein eindeutiger Identifikator (z. B. Adresse, Sozialversicherungsnummer oder Geburtsdatum) ist m\u00f6glicherweise nicht in allen Datenbanken konsistent, und jede Art von exaktem oder deterministischem Abgleich wird nahezu unm\u00f6glich, insbesondere wenn es sich um gro\u00dfe Datenmengen handelt.<\/p>\n<h4><b>2. ER-Algorithmen sind nicht gut skalierbar<\/b><\/h4>\n<p>Big-Data-Unternehmensprojekte, die sich mit Terabytes von Daten in der Finanz-, Regierungs- oder Gesundheitsbranche befassen, haben zu viele Informationen, als dass herk\u00f6mmliche ER, Datensatzverkn\u00fcpfung und Deduplizierung richtig funktionieren k\u00f6nnten. Die Gesch\u00e4ftsregeln, die f\u00fcr das Funktionieren der Algorithmen erforderlich sind, m\u00fcssten viel gr\u00f6\u00dfere Daten ber\u00fccksichtigen, um konsistent zu funktionieren.<\/p>\n<p>So h\u00e4ngt zum Beispiel die Blockierungstechnik, die bei der Suche nach Duplikaten zur Begrenzung nicht \u00fcbereinstimmender Paare eingesetzt wird, von der Qualit\u00e4t der Datensatzfelder ab. Wenn Sie Felder mit Fehlern, fehlenden Werten und Variationen haben, k\u00f6nnen Sie Daten in die falschen Bl\u00f6cke einf\u00fcgen und mit einer h\u00f6heren Anzahl von falsch-negativen Ergebnissen rechnen.<\/p>\n<h4><b>3. Manuelles ER ist kompliziert<\/b><\/h4>\n<p>Es ist nicht ungew\u00f6hnlich, dass sich Unternehmen oder Institutionen, die mit gro\u00dfen Datenmengen zu tun haben, f\u00fcr interne ER-Projekte entscheiden. Der Grund daf\u00fcr ist, dass sie auf technische Ressourcen (Software-Ingenieure, Berater, Datenbankadministratoren) zur\u00fcckgreifen k\u00f6nnen, ohne eines der auf dem Markt erh\u00e4ltlichen Entity Resolution Tools kaufen zu m\u00fcssen.<\/p>\n<p>Dies birgt einige Probleme in sich. Erstens ist die Entit\u00e4tsaufl\u00f6sung keine Teilmenge der Softwareentwicklung. Sicher, es gibt \u00f6ffentlich verf\u00fcgbare Algorithmen und Blockierungstechniken, die n\u00fctzlich sein k\u00f6nnten. Aber im Gro\u00dfen und Ganzen sind die erforderlichen F\u00e4higkeiten sehr unterschiedlich. Das muss der Benutzer tun:<\/p>\n<ol>\n<li>Kombinieren unterschiedlicher unstrukturierter und strukturierter Datenquellen<\/li>\n<li>Achten Sie auf verschiedene Arten von Kodierungen, Spitznamen und Variationen, um die Genauigkeit zu erh\u00f6hen.<\/li>\n<li>Wissen, wie man Datens\u00e4tze f\u00fcr verschiedene Verwendungszwecke aufl\u00f6st<\/li>\n<li>Sicherstellen, dass verschiedene Abgleichtechniken einander erg\u00e4nzen, um Konsistenz zu gew\u00e4hrleisten<\/li>\n<\/ol>\n<p>Es kann unwahrscheinlich sein, dass der richtige Benutzer alle diese Kriterien erf\u00fcllt, und selbst wenn dies m\u00f6glich ist, besteht das Risiko, dass er das Unternehmen verl\u00e4sst, was das gesamte Projekt auf Eis legen kann.<\/p>\n<h3><b>4 Gr\u00fcnde, warum Entity Resolution Tools besser sind<\/b><\/h3>\n<p>Entit\u00e4tsaufl\u00f6sungstools k\u00f6nnen viele Vorteile bieten, die herk\u00f6mmliche ER nicht bieten k\u00f6nnen. Dazu geh\u00f6ren:<\/p>\n<h4><b>1. H\u00f6here Treffergenauigkeit<\/b><\/h4>\n<p>Spezielle Tools zur Entit\u00e4tsaufl\u00f6sung, die \u00fcber hochentwickelte Fuzzy-Matching-Algorithmen und Entit\u00e4tsaufl\u00f6sungsfunktionen verf\u00fcgen, k\u00f6nnen weitaus bessere Ergebnisse bei der Verkn\u00fcpfung und Deduplizierung von Datens\u00e4tzen erzielen als herk\u00f6mmliche ER-Algorithmen.<\/p>\n<p>Bei heterogenen Datenbest\u00e4nden kann die Feststellung der \u00c4hnlichkeit zweier Datens\u00e4tze aufgrund der unterschiedlichen Arten von Entit\u00e4ten, Kodierungen, Formatierungen und Sprachen au\u00dferordentlich schwierig sein. Auch Schema\u00e4nderungen k\u00f6nnen ein Problem darstellen. Organisationen des Gesundheitswesens verwenden beispielsweise sowohl SQL- als auch NoSQL-basierte Datenbanken, und die Konvertierung aller Daten in ein vordefiniertes Schema durch Schema-Matching und Datenaustausch kann riskant sein, da dabei viele wertvolle Informationen verloren gehen k\u00f6nnen.<\/p>\n<p>Dar\u00fcber hinaus muss ein Datenanalytiker unter Umst\u00e4nden mehrere String-Metriken verwenden, um Fuzzy Matching effektiv durchzuf\u00fchren, z. B. Levenshtein-Distanz, Jaro-Winkler-Distanz, Damerau-Levenshtein-Distanz und andere. Es kann problematisch sein, all diese Faktoren manuell einzubeziehen, um die Treffergenauigkeit zu verbessern.<\/p>\n<p>Entity-Resolution-Tools hingegen k\u00f6nnen Datens\u00e4tze nahtlos miteinander verkn\u00fcpfen, indem sie eine breite Palette von String-Metriken und anderen Algorithmen einsetzen, um bessere \u00dcbereinstimmungsergebnisse zu erzielen.<\/p>\n<h4><b>2. Geringere Zeit-bis-zum-Ersten-Ergebnis<\/b><\/h4>\n<p>In den meisten F\u00e4llen ist der Zeitfaktor bei ER-Projekten entscheidend, insbesondere bei Stammdatenmanagement-Initiativen (MDM), die eine einzige Quelle der Wahrheit erfordern. Die Informationen \u00fcber ein Unternehmen k\u00f6nnen sich innerhalb von Wochen oder Monaten schnell \u00e4ndern, was ernsthafte Risiken f\u00fcr die Datenqualit\u00e4t mit sich bringen kann.<\/p>\n<p>Nehmen wir an, eine B2B-Vertriebs- und Marketingorganisation m\u00f6chte Kampagnen f\u00fcr ihre Top-Kunden durchf\u00fchren. Idealerweise m\u00f6chte sie sicherstellen, dass die anvisierten Kunden nicht den Arbeitsplatz gewechselt, ihren Titel gewechselt oder sich zur Ruhe gesetzt haben, bevor sie ihre Marketingausgaben verschwendet. In solchen F\u00e4llen ist es von entscheidender Bedeutung, ER innerhalb einer bestimmten Frist zu erledigen.<\/p>\n<p>ER kann, wenn es manuell durchgef\u00fchrt wird, mehr als 6 Monate dauern, und in dieser Zeit k\u00f6nnen viele Datens\u00e4tze in den Datenbanken veraltet und ungenau sein. Tools zur Entit\u00e4tsaufl\u00f6sung k\u00f6nnen jedoch die H\u00e4lfte der Zeit in Anspruch nehmen, und fortschrittlichere Tools k\u00f6nnen die Zeit bis zum ersten Ergebnis auf 15 Minuten verk\u00fcrzen.<\/p>\n<h4><b>3. Bessere Skalierbarkeit<\/b><\/h4>\n<p>Tools zur Entit\u00e4tsaufl\u00f6sung sind weitaus geschickter bei der Aufnahme von Daten aus mehreren Punkten und f\u00fchren <a href=\"https:\/\/dataladder.com\/de\/software-zur-datensatzverknuepfung\/\" target=\"_blank\" rel=\"noopener\">Datensatzverkn\u00fcpfung<\/a>, Deduplizierung und <a href=\"https:\/\/dataladder.com\/de\/datenbereinigungssoftware-schnelles-und-kostenguenstiges-crm-datenbereinigungstool\/\">Bereinigungsaufgaben<\/a> in einem viel gr\u00f6\u00dferen Umfang durch. In staatlichen Datenbanken wie denen f\u00fcr Steuererhebungen und Volksz\u00e4hlungen werden Millionen (wenn nicht Billionen) von Datens\u00e4tzen gespeichert. Eine staatliche Einrichtung, die sich f\u00fcr ER zur Betrugspr\u00e4vention entscheidet, w\u00e4re beispielsweise auf die Verwendung manueller ER-Ans\u00e4tze und Algorithmen beschr\u00e4nkt. Ein Benutzer w\u00fcrde mit den Daten, die bearbeitet werden m\u00fcssen, \u00fcberschwemmt werden, und alle Gesch\u00e4ftsregeln f\u00fcr Blockierungstechniken &#8211; zur Minimierung der Anzahl \u00e4hnlicher Vergleiche &#8211; w\u00e4ren nutzlos.<\/p>\n<p>Tools zur Entit\u00e4tsaufl\u00f6sung k\u00f6nnen jedoch nicht nur Daten aus verschiedenen Quellen <a href=\"https:\/\/dataladder.com\/de\/datenimport-integrieren-sie-daten-aus-unterschiedlichen-quellen\/\">importieren<\/a>, sondern auch sicherstellen, dass die ER-Effizienz \u00fcber gro\u00dfe Datenmengen hinweg intakt bleibt.<\/p>\n<h4><b>4. Kostenersparnis<\/b><\/h4>\n<p>Tools zur Entit\u00e4tsaufl\u00f6sung, insbesondere f\u00fcr Anwendungen auf Unternehmensebene, k\u00f6nnen eine betr\u00e4chtliche Investition darstellen. Datenexperten, die mit ER betraut sind, k\u00f6nnten allein aus diesem Grund z\u00f6gern, eine Entscheidung zu treffen. Sie k\u00f6nnten argumentieren, dass eine manuelle Bearbeitung viel kosteng\u00fcnstiger w\u00e4re und ihre Chancen auf eine Bef\u00f6rderung verbessern w\u00fcrde.<\/p>\n<p>Auch wenn dies auf den ersten Blick vern\u00fcnftig klingt, k\u00f6nnen die Kosten f\u00fcr Projektverz\u00f6gerungen, schlechte Abgleichgenauigkeit und Arbeitsressourcen am Ende h\u00f6her sein als die eines ER-Tools.<\/p>\n<h3><b>Wie man die richtige Software zur Aufl\u00f6sung von Entit\u00e4ten ausw\u00e4hlt<\/b><\/h3>\n<p>Ebenso wichtig ist die Wahl der richtigen <a href=\"https:\/\/dataladder.com\/de\/entity-resolution-software-die-schnellste-und-genaueste-entity-resolution-der-branche\/\" target=\"_blank\" rel=\"noopener\">Software zur Aufl\u00f6sung von Entit\u00e4ten<\/a>. Viele Tools zur Entit\u00e4tsaufl\u00f6sung unterscheiden sich in ihren Funktionen, ihrem Umfang und ihrem Wert.<\/p>\n<h4><b>Unterschiedliche Datenquellen importieren<\/b><\/h4>\n<p>Unternehmen k\u00f6nnen Daten in einer Vielzahl von Formaten und Quellen speichern, z. B. in Excel, in Dateien mit Trennzeichen, in Webanwendungen, Datenbanken und CRM-Systemen. Eine Software zur Entit\u00e4tsaufl\u00f6sung muss in der Lage sein, Daten aus unterschiedlichen Quellen f\u00fcr den jeweiligen Anwendungsfall zu importieren.<\/p>\n<p>Das Importmodul von DataMatch Enterprise erm\u00f6glicht es Ihnen, Daten in verschiedenen Formaten zu importieren, wie oben gezeigt.<\/p>\n<h4><b>Profilierung und Bereinigung von Daten im gro\u00dfen Ma\u00dfstab<\/b><\/h4>\n<p>Die richtige Software zur Entit\u00e4tsaufl\u00f6sung muss auch in der Lage sein, ein Profil zu erstellen und die Daten zu bereinigen, bevor die Deduplizierung und Datensatzverkn\u00fcpfung durchgef\u00fchrt wird. <a href=\"https:\/\/dataladder.com\/de\/produkte\/datamatch-enterprise-bewertetes-datenqualitaetsmanagementprodukt-nr-1\/\" target=\"_blank\" rel=\"noopener\">DataMatch Enterprise<\/a> kann mithilfe von vorgefertigten Mustern, die auf Regex-Ausdr\u00fccken basieren, g\u00fcltige und ung\u00fcltige Datens\u00e4tze, ung\u00fcltige, eindeutige, f\u00fchrende und nachfolgende Leerzeichen und vieles mehr bestimmen.<\/p>\n<p><img src=\"https:\/\/dataladder.com\/wp-content\/uploads\/2021\/03\/Profiling.png\" sizes=\"(max-width: 602px) 100vw, 602px\" srcset=\"https:\/\/dataladder.com\/wp-content\/uploads\/2021\/03\/Profiling.png 602w, https:\/\/dataladder.com\/wp-content\/uploads\/2021\/03\/Profiling-300x127.png 300w, https:\/\/dataladder.com\/wp-content\/uploads\/2021\/03\/Profiling-600x255.png 600w\" alt=\"\" width=\"602\" height=\"255\" \/><\/p>\n<p>Sobald ein Profil erstellt ist, k\u00f6nnen die Daten mit verschiedenen Funktionen bereinigt werden, wie z. B:<\/p>\n<ol>\n<li>Felder zusammenf\u00fchren<\/li>\n<li>Zu entfernende Zeichen<\/li>\n<li>Zu ersetzende Zeichen<\/li>\n<li>Zu entfernende Nummern und mehr<\/li>\n<\/ol>\n<p><img src=\"https:\/\/dataladder.com\/wp-content\/uploads\/2021\/03\/Cleansing.png\" sizes=\"(max-width: 602px) 100vw, 602px\" srcset=\"https:\/\/dataladder.com\/wp-content\/uploads\/2021\/03\/Cleansing.png 602w, https:\/\/dataladder.com\/wp-content\/uploads\/2021\/03\/Cleansing-300x156.png 300w, https:\/\/dataladder.com\/wp-content\/uploads\/2021\/03\/Cleansing-600x313.png 600w\" alt=\"\" width=\"602\" height=\"313\" \/><\/p>\n<h4><b>Robuste Matching-F\u00e4higkeiten<\/b><\/h4>\n<p>Es gibt viele Tools zur Entit\u00e4tsaufl\u00f6sung, die behaupten, eine hohe Trefferquote zu erzielen. Die Abgleichsgenauigkeit h\u00e4ngt jedoch davon ab, wie ausgekl\u00fcgelt die Algorithmen sind, die zum Abgleich von Datens\u00e4tzen innerhalb und zwischen mehreren Datens\u00e4tzen verwendet werden. DataMatch Enterprise verwendet eine Reihe von Abgleichstypen (Exact, Fuzzy, Phonetic, string-metrics), um den Abstand zwischen den Entit\u00e4ten zu ermitteln, und nutzt dom\u00e4nenspezifische Bibliotheken (Spitznamen, Adressen, Telefonnummern), um eine h\u00f6here Trefferquote als in der Industrie zu erzielen.<\/p>\n<p>Eine <a href=\"https:\/\/www.kdnuggets.com\/2014\/10\/dataladder-outperforms-ibm-sas-record-linkage.html\" target=\"_blank\" rel=\"noopener\">unabh\u00e4ngige Studie der Curtin University<\/a> ergab, dass die Abgleichsgenauigkeit von DataMatch die anderer Anbieter wie IBMs Quality Stage und SAS Dataflux \u00fcbertraf.<\/p>\n<p><img src=\"https:\/\/dataladder.com\/wp-content\/uploads\/2021\/03\/Data-Ladder-v-IBM-SAS-In-House-1024x483.png\" sizes=\"(max-width: 1024px) 100vw, 1024px\" srcset=\"https:\/\/dataladder.com\/wp-content\/uploads\/2021\/03\/Data-Ladder-v-IBM-SAS-In-House-1024x483.png 1024w, https:\/\/dataladder.com\/wp-content\/uploads\/2021\/03\/Data-Ladder-v-IBM-SAS-In-House-300x142.png 300w, https:\/\/dataladder.com\/wp-content\/uploads\/2021\/03\/Data-Ladder-v-IBM-SAS-In-House-768x363.png 768w, https:\/\/dataladder.com\/wp-content\/uploads\/2021\/03\/Data-Ladder-v-IBM-SAS-In-House.png 1379w\" alt=\"\" width=\"1024\" height=\"483\" \/><\/p>\n<h3><b>Ende Anmerkung<\/b><\/h3>\n<p>So wichtig ER f\u00fcr Unternehmen auch ist, die manuelle Durchf\u00fchrung von Deduplizierung, Datensatzverkn\u00fcpfung und anderen ER-Aufgaben st\u00f6\u00dft an ernste Grenzen, wenn es darum geht, Daten \u00fcber Millionen und Billionen von Datens\u00e4tzen abzugleichen. Mit einer Software zur Entit\u00e4tsaufl\u00f6sung wie DataMatch Enterprise sind Unternehmen in einer weitaus besseren Position, um ihre Gesch\u00e4ftsziele unter den Gesichtspunkten der Skalierbarkeit, der Kosten und der Ergebnisse zu erreichen.<\/p>\n<p>F\u00fcr weitere Informationen zu DataMatch Enterprise klicken Sie auf die<a href=\"https:\/\/dataladder.com\/de\/entity-resolution-software-die-schnellste-und-genaueste-entity-resolution-der-branche\/\" target=\"_blank\" rel=\"noopener\"> Seite Entity Resolution<\/a> oder <a href=\"https:\/\/dataladder.com\/de\/kontaktieren-sie-uns-datenleiter\/\" target=\"_blank\" rel=\"noopener\">kontaktieren Sie uns<\/a>, um mit unserem Vertriebsteam in Kontakt zu treten.<\/p>\n<p><img src=\"https:\/\/dataladder.com\/wp-content\/uploads\/2019\/05\/fuzzy-whitepaper2.png\" sizes=\"(max-width: 887px) 100vw, 887px\" srcset=\"https:\/\/dataladder.com\/wp-content\/uploads\/2019\/05\/fuzzy-whitepaper2.png 887w, https:\/\/dataladder.com\/wp-content\/uploads\/2019\/05\/fuzzy-whitepaper2-300x183.png 300w, https:\/\/dataladder.com\/wp-content\/uploads\/2019\/05\/fuzzy-whitepaper2-768x468.png 768w\" alt=\"\" width=\"887\" height=\"541\" \/><\/p>\n<p><b>Wie die besten <a href=\"https:\/\/dataladder.com\/de\/fuzzy-matching-software-rated-1-fuzzy-name-matching-tool\/\">Fuzzy-Matching-L\u00f6sungen<\/a> funktionieren: Kombination von bew\u00e4hrten und eigenen Algorithmen<\/b><\/p>\n<p><a role=\"button\" href=\"https:\/\/content.dataladder.com\/How-Best-In-Class-Fuzzy-Matching-Solutions-Work-Combining-Established-and-Proprietary-Algorithms-WP.pdf\"><br \/>\nHerunterladen<br \/>\n<\/a><\/p>\n<p>Starten Sie noch heute Ihren kostenlosen Test<\/p>\n<!DOCTYPE html><html><head><meta charset='UTF-8' \/><\/head><body class='GF_AJAX_POSTBACK'><p class=\"gform_not_found\">Oops! Wir konnten dein Formular nicht lokalisieren.<\/p><\/body><\/html>\n","protected":false},"excerpt":{"rendered":"<p>Unsaubere, unstrukturierte strukturierte Daten, mehr als ein Dutzend Namensvarianten und inkonsistente Felddefinitionen in verschiedenen Quellen. Dieser Wurmfortsatz ist f\u00fcr jeden Datenanalysten, der an einem Projekt mit Tausenden von Datens\u00e4tzen arbeitet, ein fast schon st\u00e4ndiges Berufsrisiko. Und die Auswirkungen sind alles andere als gew\u00f6hnlich: Globale Finanzinstitute wurden im Jahr 2020 wegen Nichteinhaltung von Compliance-Vorschriften mit Strafen [&hellip;]<\/p>\n","protected":false},"author":9,"featured_media":58385,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"_lmt_disableupdate":"","_lmt_disable":"","_links_to":"","_links_to_target":""},"categories":[1250],"tags":[549,474,486,601,676],"acf":[],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v19.9 - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>Ein detaillierter Leitfaden zur Verwendung von Entity Resolution Tools f\u00fcr Unternehmensdatenprojekte - Data Ladder<\/title>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/dataladder.com\/de\/ein-detaillierter-leitfaden-zur-verwendung-von-entity-resolution-tools-fuer-unternehmensdatenprojekte\/\" \/>\n<meta property=\"og:locale\" content=\"de_DE\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Ein detaillierter Leitfaden zur Verwendung von Entity Resolution Tools f\u00fcr Unternehmensdatenprojekte - Data Ladder\" \/>\n<meta property=\"og:description\" content=\"Unsaubere, unstrukturierte strukturierte Daten, mehr als ein Dutzend Namensvarianten und inkonsistente Felddefinitionen in verschiedenen Quellen. Dieser Wurmfortsatz ist f\u00fcr jeden Datenanalysten, der an einem Projekt mit Tausenden von Datens\u00e4tzen arbeitet, ein fast schon st\u00e4ndiges Berufsrisiko. Und die Auswirkungen sind alles andere als gew\u00f6hnlich: Globale Finanzinstitute wurden im Jahr 2020 wegen Nichteinhaltung von Compliance-Vorschriften mit Strafen [&hellip;]\" \/>\n<meta property=\"og:url\" content=\"https:\/\/dataladder.com\/de\/ein-detaillierter-leitfaden-zur-verwendung-von-entity-resolution-tools-fuer-unternehmensdatenprojekte\/\" \/>\n<meta property=\"og:site_name\" content=\"Data Ladder\" \/>\n<meta property=\"article:publisher\" content=\"https:\/\/web.facebook.com\/DataLadderSoftware\" \/>\n<meta property=\"article:published_time\" content=\"2021-03-31T04:00:00+00:00\" \/>\n<meta property=\"article:modified_time\" content=\"2022-04-13T19:58:13+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/dataladder.com\/wp-content\/uploads\/2021\/09\/pexels-photo-97077.jpeg\" \/>\n\t<meta property=\"og:image:width\" content=\"1125\" \/>\n\t<meta property=\"og:image:height\" content=\"750\" \/>\n\t<meta property=\"og:image:type\" content=\"image\/jpeg\" \/>\n<meta name=\"author\" content=\"lbarrera\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"Verfasst von\" \/>\n\t<meta name=\"twitter:data1\" content=\"lbarrera\" \/>\n\t<meta name=\"twitter:label2\" content=\"Gesch\u00e4tzte Lesezeit\" \/>\n\t<meta name=\"twitter:data2\" content=\"12 Minuten\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"Article\",\"@id\":\"https:\/\/dataladder.com\/de\/ein-detaillierter-leitfaden-zur-verwendung-von-entity-resolution-tools-fuer-unternehmensdatenprojekte\/#article\",\"isPartOf\":{\"@id\":\"https:\/\/dataladder.com\/de\/ein-detaillierter-leitfaden-zur-verwendung-von-entity-resolution-tools-fuer-unternehmensdatenprojekte\/\"},\"author\":{\"name\":\"lbarrera\",\"@id\":\"https:\/\/dataladder.com\/de\/#\/schema\/person\/6cc3d6b3c83c611546541b5eb2d1e21b\"},\"headline\":\"Ein detaillierter Leitfaden zur Verwendung von Entity Resolution Tools f\u00fcr Unternehmensdatenprojekte\",\"datePublished\":\"2021-03-31T04:00:00+00:00\",\"dateModified\":\"2022-04-13T19:58:13+00:00\",\"mainEntityOfPage\":{\"@id\":\"https:\/\/dataladder.com\/de\/ein-detaillierter-leitfaden-zur-verwendung-von-entity-resolution-tools-fuer-unternehmensdatenprojekte\/\"},\"wordCount\":2623,\"publisher\":{\"@id\":\"https:\/\/dataladder.com\/de\/#organization\"},\"keywords\":[\"Datenabgleich\",\"Datenbereinigung\",\"Datenprofilerstellung\",\"Datensatzverkn\u00fcpfung\",\"Vorbereitung der Daten\"],\"articleSection\":[\"Werkzeuge f\u00fcr die Datenqualit\u00e4t\"],\"inLanguage\":\"de-DE\"},{\"@type\":\"WebPage\",\"@id\":\"https:\/\/dataladder.com\/de\/ein-detaillierter-leitfaden-zur-verwendung-von-entity-resolution-tools-fuer-unternehmensdatenprojekte\/\",\"url\":\"https:\/\/dataladder.com\/de\/ein-detaillierter-leitfaden-zur-verwendung-von-entity-resolution-tools-fuer-unternehmensdatenprojekte\/\",\"name\":\"Ein detaillierter Leitfaden zur Verwendung von Entity Resolution Tools f\u00fcr Unternehmensdatenprojekte - Data Ladder\",\"isPartOf\":{\"@id\":\"https:\/\/dataladder.com\/de\/#website\"},\"datePublished\":\"2021-03-31T04:00:00+00:00\",\"dateModified\":\"2022-04-13T19:58:13+00:00\",\"breadcrumb\":{\"@id\":\"https:\/\/dataladder.com\/de\/ein-detaillierter-leitfaden-zur-verwendung-von-entity-resolution-tools-fuer-unternehmensdatenprojekte\/#breadcrumb\"},\"inLanguage\":\"de-DE\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/dataladder.com\/de\/ein-detaillierter-leitfaden-zur-verwendung-von-entity-resolution-tools-fuer-unternehmensdatenprojekte\/\"]}]},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/dataladder.com\/de\/ein-detaillierter-leitfaden-zur-verwendung-von-entity-resolution-tools-fuer-unternehmensdatenprojekte\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Home\",\"item\":\"https:\/\/dataladder.com\/de\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Ein detaillierter Leitfaden zur Verwendung von Entity Resolution Tools f\u00fcr Unternehmensdatenprojekte\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/dataladder.com\/de\/#website\",\"url\":\"https:\/\/dataladder.com\/de\/\",\"name\":\"Data Ladder\",\"description\":\"Enterprise Data Profiling, Cleansing, and Matching\",\"publisher\":{\"@id\":\"https:\/\/dataladder.com\/de\/#organization\"},\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/dataladder.com\/de\/?s={search_term_string}\"},\"query-input\":\"required name=search_term_string\"}],\"inLanguage\":\"de-DE\"},{\"@type\":\"Organization\",\"@id\":\"https:\/\/dataladder.com\/de\/#organization\",\"name\":\"Data Ladder\",\"url\":\"https:\/\/dataladder.com\/de\/\",\"logo\":{\"@type\":\"ImageObject\",\"inLanguage\":\"de-DE\",\"@id\":\"https:\/\/dataladder.com\/de\/#\/schema\/logo\/image\/\",\"url\":\"https:\/\/dataladder.com\/wp-content\/uploads\/2018\/06\/DL-Logo-Ball-30.png\",\"contentUrl\":\"https:\/\/dataladder.com\/wp-content\/uploads\/2018\/06\/DL-Logo-Ball-30.png\",\"width\":413,\"height\":408,\"caption\":\"Data Ladder\"},\"image\":{\"@id\":\"https:\/\/dataladder.com\/de\/#\/schema\/logo\/image\/\"},\"sameAs\":[\"https:\/\/www.linkedin.com\/company\/dataladder-llc\/\",\"https:\/\/web.facebook.com\/DataLadderSoftware\"]},{\"@type\":\"Person\",\"@id\":\"https:\/\/dataladder.com\/de\/#\/schema\/person\/6cc3d6b3c83c611546541b5eb2d1e21b\",\"name\":\"lbarrera\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"de-DE\",\"@id\":\"https:\/\/dataladder.com\/de\/#\/schema\/person\/image\/\",\"url\":\"https:\/\/secure.gravatar.com\/avatar\/5198cb4dd374e7d879a15a9cf20299b3?s=96&d=mm&r=g\",\"contentUrl\":\"https:\/\/secure.gravatar.com\/avatar\/5198cb4dd374e7d879a15a9cf20299b3?s=96&d=mm&r=g\",\"caption\":\"lbarrera\"},\"url\":\"https:\/\/dataladder.com\/de\/author\/lbarrera\/\"}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Ein detaillierter Leitfaden zur Verwendung von Entity Resolution Tools f\u00fcr Unternehmensdatenprojekte - Data Ladder","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/dataladder.com\/de\/ein-detaillierter-leitfaden-zur-verwendung-von-entity-resolution-tools-fuer-unternehmensdatenprojekte\/","og_locale":"de_DE","og_type":"article","og_title":"Ein detaillierter Leitfaden zur Verwendung von Entity Resolution Tools f\u00fcr Unternehmensdatenprojekte - Data Ladder","og_description":"Unsaubere, unstrukturierte strukturierte Daten, mehr als ein Dutzend Namensvarianten und inkonsistente Felddefinitionen in verschiedenen Quellen. Dieser Wurmfortsatz ist f\u00fcr jeden Datenanalysten, der an einem Projekt mit Tausenden von Datens\u00e4tzen arbeitet, ein fast schon st\u00e4ndiges Berufsrisiko. Und die Auswirkungen sind alles andere als gew\u00f6hnlich: Globale Finanzinstitute wurden im Jahr 2020 wegen Nichteinhaltung von Compliance-Vorschriften mit Strafen [&hellip;]","og_url":"https:\/\/dataladder.com\/de\/ein-detaillierter-leitfaden-zur-verwendung-von-entity-resolution-tools-fuer-unternehmensdatenprojekte\/","og_site_name":"Data Ladder","article_publisher":"https:\/\/web.facebook.com\/DataLadderSoftware","article_published_time":"2021-03-31T04:00:00+00:00","article_modified_time":"2022-04-13T19:58:13+00:00","og_image":[{"width":1125,"height":750,"url":"https:\/\/dataladder.com\/wp-content\/uploads\/2021\/09\/pexels-photo-97077.jpeg","type":"image\/jpeg"}],"author":"lbarrera","twitter_card":"summary_large_image","twitter_misc":{"Verfasst von":"lbarrera","Gesch\u00e4tzte Lesezeit":"12 Minuten"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"Article","@id":"https:\/\/dataladder.com\/de\/ein-detaillierter-leitfaden-zur-verwendung-von-entity-resolution-tools-fuer-unternehmensdatenprojekte\/#article","isPartOf":{"@id":"https:\/\/dataladder.com\/de\/ein-detaillierter-leitfaden-zur-verwendung-von-entity-resolution-tools-fuer-unternehmensdatenprojekte\/"},"author":{"name":"lbarrera","@id":"https:\/\/dataladder.com\/de\/#\/schema\/person\/6cc3d6b3c83c611546541b5eb2d1e21b"},"headline":"Ein detaillierter Leitfaden zur Verwendung von Entity Resolution Tools f\u00fcr Unternehmensdatenprojekte","datePublished":"2021-03-31T04:00:00+00:00","dateModified":"2022-04-13T19:58:13+00:00","mainEntityOfPage":{"@id":"https:\/\/dataladder.com\/de\/ein-detaillierter-leitfaden-zur-verwendung-von-entity-resolution-tools-fuer-unternehmensdatenprojekte\/"},"wordCount":2623,"publisher":{"@id":"https:\/\/dataladder.com\/de\/#organization"},"keywords":["Datenabgleich","Datenbereinigung","Datenprofilerstellung","Datensatzverkn\u00fcpfung","Vorbereitung der Daten"],"articleSection":["Werkzeuge f\u00fcr die Datenqualit\u00e4t"],"inLanguage":"de-DE"},{"@type":"WebPage","@id":"https:\/\/dataladder.com\/de\/ein-detaillierter-leitfaden-zur-verwendung-von-entity-resolution-tools-fuer-unternehmensdatenprojekte\/","url":"https:\/\/dataladder.com\/de\/ein-detaillierter-leitfaden-zur-verwendung-von-entity-resolution-tools-fuer-unternehmensdatenprojekte\/","name":"Ein detaillierter Leitfaden zur Verwendung von Entity Resolution Tools f\u00fcr Unternehmensdatenprojekte - Data Ladder","isPartOf":{"@id":"https:\/\/dataladder.com\/de\/#website"},"datePublished":"2021-03-31T04:00:00+00:00","dateModified":"2022-04-13T19:58:13+00:00","breadcrumb":{"@id":"https:\/\/dataladder.com\/de\/ein-detaillierter-leitfaden-zur-verwendung-von-entity-resolution-tools-fuer-unternehmensdatenprojekte\/#breadcrumb"},"inLanguage":"de-DE","potentialAction":[{"@type":"ReadAction","target":["https:\/\/dataladder.com\/de\/ein-detaillierter-leitfaden-zur-verwendung-von-entity-resolution-tools-fuer-unternehmensdatenprojekte\/"]}]},{"@type":"BreadcrumbList","@id":"https:\/\/dataladder.com\/de\/ein-detaillierter-leitfaden-zur-verwendung-von-entity-resolution-tools-fuer-unternehmensdatenprojekte\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Home","item":"https:\/\/dataladder.com\/de\/"},{"@type":"ListItem","position":2,"name":"Ein detaillierter Leitfaden zur Verwendung von Entity Resolution Tools f\u00fcr Unternehmensdatenprojekte"}]},{"@type":"WebSite","@id":"https:\/\/dataladder.com\/de\/#website","url":"https:\/\/dataladder.com\/de\/","name":"Data Ladder","description":"Enterprise Data Profiling, Cleansing, and Matching","publisher":{"@id":"https:\/\/dataladder.com\/de\/#organization"},"potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/dataladder.com\/de\/?s={search_term_string}"},"query-input":"required name=search_term_string"}],"inLanguage":"de-DE"},{"@type":"Organization","@id":"https:\/\/dataladder.com\/de\/#organization","name":"Data Ladder","url":"https:\/\/dataladder.com\/de\/","logo":{"@type":"ImageObject","inLanguage":"de-DE","@id":"https:\/\/dataladder.com\/de\/#\/schema\/logo\/image\/","url":"https:\/\/dataladder.com\/wp-content\/uploads\/2018\/06\/DL-Logo-Ball-30.png","contentUrl":"https:\/\/dataladder.com\/wp-content\/uploads\/2018\/06\/DL-Logo-Ball-30.png","width":413,"height":408,"caption":"Data Ladder"},"image":{"@id":"https:\/\/dataladder.com\/de\/#\/schema\/logo\/image\/"},"sameAs":["https:\/\/www.linkedin.com\/company\/dataladder-llc\/","https:\/\/web.facebook.com\/DataLadderSoftware"]},{"@type":"Person","@id":"https:\/\/dataladder.com\/de\/#\/schema\/person\/6cc3d6b3c83c611546541b5eb2d1e21b","name":"lbarrera","image":{"@type":"ImageObject","inLanguage":"de-DE","@id":"https:\/\/dataladder.com\/de\/#\/schema\/person\/image\/","url":"https:\/\/secure.gravatar.com\/avatar\/5198cb4dd374e7d879a15a9cf20299b3?s=96&d=mm&r=g","contentUrl":"https:\/\/secure.gravatar.com\/avatar\/5198cb4dd374e7d879a15a9cf20299b3?s=96&d=mm&r=g","caption":"lbarrera"},"url":"https:\/\/dataladder.com\/de\/author\/lbarrera\/"}]}},"modified_by":null,"_links":{"self":[{"href":"https:\/\/dataladder.com\/de\/wp-json\/wp\/v2\/posts\/62370"}],"collection":[{"href":"https:\/\/dataladder.com\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/dataladder.com\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/dataladder.com\/de\/wp-json\/wp\/v2\/users\/9"}],"replies":[{"embeddable":true,"href":"https:\/\/dataladder.com\/de\/wp-json\/wp\/v2\/comments?post=62370"}],"version-history":[{"count":2,"href":"https:\/\/dataladder.com\/de\/wp-json\/wp\/v2\/posts\/62370\/revisions"}],"predecessor-version":[{"id":66867,"href":"https:\/\/dataladder.com\/de\/wp-json\/wp\/v2\/posts\/62370\/revisions\/66867"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/dataladder.com\/de\/wp-json\/wp\/v2\/media\/58385"}],"wp:attachment":[{"href":"https:\/\/dataladder.com\/de\/wp-json\/wp\/v2\/media?parent=62370"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/dataladder.com\/de\/wp-json\/wp\/v2\/categories?post=62370"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/dataladder.com\/de\/wp-json\/wp\/v2\/tags?post=62370"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}