{"id":62241,"date":"2021-11-15T11:23:47","date_gmt":"2021-11-15T11:23:47","guid":{"rendered":"https:\/\/dataladder.com\/warum-gibt-es-duplikate-und-wie-wird-man-sie-los\/"},"modified":"2021-12-21T13:52:48","modified_gmt":"2021-12-21T13:52:48","slug":"warum-gibt-es-duplikate-und-wie-wird-man-sie-los","status":"publish","type":"post","link":"https:\/\/dataladder.com\/de\/warum-gibt-es-duplikate-und-wie-wird-man-sie-los\/","title":{"rendered":"Warum gibt es Duplikate und wie wird man sie los?"},"content":{"rendered":"\n<p>Laut Natik Ameen, Marketingexperte bei <a href=\"https:\/\/www.canzmarketing.com\/\" target=\"_blank\" rel=\"noreferrer noopener nofollow\">Canz Marketing<\/a>, sind doppelte Daten im CRM des Unternehmens auf eine Reihe von Gr\u00fcnden zur\u00fcckzuf\u00fchren:  <\/p>\n\n<blockquote class=\"wp-block-quote\"><p>&#8222;<em>von menschlichem Versagen bis hin zu Kunden, die zu unterschiedlichen Zeitpunkten leicht abweichende Informationen in die Unternehmensdatenbank eingeben. Ein Verbraucher gibt beispielsweise auf einem Formular seinen Namen als Jonathan Smith und auf dem anderen als Jon Smith an. Die Herausforderung wird durch eine wachsende Datenbank noch versch\u00e4rft. F\u00fcr Administratoren wird es immer schwieriger, den \u00dcberblick \u00fcber die DB zu behalten und die relevanten Daten zu erfassen. Es wird immer schwieriger, sicherzustellen, dass die DB der Organisation korrekt bleibt.<\/em>&#8222;.  <\/p><\/blockquote>\n\n<p>Eine<a href=\"https:\/\/dataladder.com\/de\/datendeduplizierungssoftware-verwenden-sie-integrierte-und-benutzerdefinierte-regeln-fuer-die-crm-deduplizierung\/\">Datendeduplizierung<\/a> findet statt, wenn Sie Informationen \u00fcber ein und dieselbe Entit\u00e4t mehrfach speichern, anstatt einen einzigen Datensatz zu aktualisieren. In diesem Leitfaden werden einige grundlegende Konzepte im Zusammenhang mit der Datenduplizierung sowie eine Liste von Techniken und Algorithmen er\u00f6rtert, die \u00fcblicherweise zur Behebung dieser Probleme eingesetzt werden.  <\/p>\n\n<h3>Warum gibt es Duplikate?  <\/h3>\n\n<p>Daten haben mehrere Darstellungen &#8211; das hei\u00dft, dieselben Daten k\u00f6nnen auf unterschiedliche Weise dargestellt werden. Dies ist der Hauptgrund, warum doppelte Datens\u00e4tze in einer Datenbank existieren. Unabh\u00e4ngig davon, ob die Datens\u00e4tze aus unabh\u00e4ngigen Datenquellen zusammengef\u00fchrt oder im Laufe der Zeit in eine einzige Datenbank eingegeben werden, f\u00fchrt beides zu dem komplexen Problem der Datenduplizierung.  <\/p>\n\n<p>Im Idealfall sollte jeder Datensatz in einer Datenbank eine einzige, eindeutige Entit\u00e4t darstellen. Aus verschiedenen Gr\u00fcnden (die h\u00e4ufigsten werden im Folgenden genannt) stellen wir jedoch fest, dass sich die Informationen eines Unternehmens \u00fcber mehrere Datens\u00e4tze erstrecken.  <\/p>\n\n<h4><strong>1. Fehlen eindeutiger Identifikatoren  <\/strong><\/h4>\n\n<p>Eindeutige Bezeichner in Ihrer Datenbank sind der beste Weg, um die Speicherung von Duplikaten zu vermeiden. Ein eindeutiger Bezeichner ist ein Datenfeld, das f\u00fcr eine Einheit immer eindeutig ist (z. B. <em>Sozialversicherungsnummer (SSN)<\/em> f\u00fcr Kundendaten, <em>Hersteller-Teilenummer (MPN) <\/em> f\u00fcr Produktdaten, usw.). Bei jeder neuen Dateneingabe k\u00f6nnen Sie pr\u00fcfen, ob ein Datensatz mit demselben eindeutigen Bezeichner existiert. Wenn dies der Fall ist, k\u00f6nnen Sie ihn einfach aktualisieren oder zusammenf\u00fchren und vermeiden, einen neuen Datensatz f\u00fcr dieselbe Entit\u00e4t zu speichern. Wenn Ihre Datenbank jedoch keinen solchen eindeutigen Bezeichner enth\u00e4lt, wird der Prozess der Zuordnung neu eingehender Entit\u00e4ten zu bestehenden zu einer komplexen Aufgabe.  <\/p>\n\n<h4><strong>2. Fehlen von Validierungspr\u00fcfungen und Integrit\u00e4tsbeschr\u00e4nkungen  <\/strong><\/h4>\n\n<p>Selbst bei Vorhandensein eindeutiger Identifikatoren kann es zu Duplikaten in Ihrer Datenbank kommen. Dies ist der Fall, wenn die eindeutigen Bezeichner nicht mit g\u00fcltigen Mustern \u00fcbereinstimmen (z. B. <em>AAA-GG-SSSS<\/em> f\u00fcr <em>SSN<\/em>) oder keine strengen Integrit\u00e4tsbeschr\u00e4nkungen aufweisen (z. B. <em>11 Zeichen<\/em> f\u00fcr <em>SSN<\/em>).  <\/p>\n\n<h4><strong>3. Fehler bei der Dateneingabe  <\/strong><\/h4>\n\n<p>Die Fehlerquote bei der Dateneingabe liegt bei <a href=\"https:\/\/www.ocrolus.com\/blog\/human-error-8-eye-popping-sets-of-stats-and-examples\/\" target=\"_blank\" rel=\"noreferrer noopener nofollow\">400 pro 10.000 Eintr\u00e4ge<\/a>, was eine beachtliche Zahl ist. Selbst wenn eindeutige Bezeichner, Validierungspr\u00fcfungen und Integrit\u00e4tsbeschr\u00e4nkungen vorhanden sind, besteht also die M\u00f6glichkeit, dass menschliches Versagen eingreift und Duplikate in Ihrer Datenbank zul\u00e4sst.  <\/p>\n\n<h3><strong>Schwieriger Datenvergleich &#8211; Heterogenit\u00e4t der Daten<\/strong> <\/h3>\n\n<p>Um die Duplikate in Ihrer Datenbank loszuwerden, m\u00fcssen Sie die Datens\u00e4tze vergleichen und bewerten, welche zur gleichen Entit\u00e4t geh\u00f6ren. Wenn Sie jedoch Datens\u00e4tze vergleichen (entweder in derselben Datenbank oder in verschiedenen Datenbanken), werden Sie feststellen, dass sie einige systematische Unterschiede aufweisen, die einen genauen Vergleich erschweren. Dies wird gew\u00f6hnlich als<strong> Datenheterogenit\u00e4t<\/strong> bezeichnet.  <\/p>\n\n<p>Im Gro\u00dfen und Ganzen k\u00f6nnen Sie heterogene Daten als solche klassifizieren:  <\/p>\n\n<h4><strong>1. Strukturelle Heterogenit\u00e4t  <\/strong><\/h4>\n\n<p>Diese Art von Unterschieden tritt auf, wenn Felder verschiedener Datenbanken dieselbe Information auf strukturell unterschiedliche Weise darstellen. Eine Datenbank k\u00f6nnte beispielsweise den Namen eines Kontakts als <em>Kontaktname<\/em> speichern, w\u00e4hrend er in einer zweiten Datenbank in mehreren Spalten wie <em>Anrede,<\/em> <em>Vorname<\/em>, <em>mittlerer Name<\/em> und <em>Nachname<\/em>gespeichert wird <em>.<\/em> <\/p>\n\n<h4><strong>2. Lexikalische Heterogenit\u00e4t  <\/strong><\/h4>\n\n<p>Diese Art von Unterschieden tritt auf, wenn die Felder verschiedener Datenbanken strukturell gleich sind, aber dieselben Informationen auf unterschiedliche Art und Weise darstellen. So k\u00f6nnen beispielsweise zwei oder mehr Datenbanken dasselbe <em>Adressfeld <\/em>haben, aber eine kann einen Adresswert haben: <em>32 E St. 4<\/em>, w\u00e4hrend in der anderen der Wert <em>32 East, 4<\/em><em>\n  <sup>th<\/sup>\n<\/em><em> Stra\u00dfe<\/em>.  <\/p>\n\n<h3><strong>Prozess der Datendeduplizierung<\/strong> <\/h3>\n\n<p>Einfach ausgedr\u00fcckt, beinhaltet der Prozess der Deduplizierung:  <\/p>\n\n<ol><li><strong>Aufbereitung der Daten durch Standardisierung der Felder<\/strong> in allen Datenbanken<\/li><li><strong>Zuordnung der Felder<\/strong>, die dieselbe Information darstellen  <\/li><li><strong>Auswahl einer geeigneten Feldabgleichstechnik<\/strong> (je nach Art der Daten) und anschlie\u00dfende Berechnung der \u00c4hnlichkeit zwischen Datenfeldern  <\/li><\/ol>\n\n<p>In den n\u00e4chsten Abschnitten werden wir die oben genannten Schritte etwas ausf\u00fchrlicher erl\u00e4utern.  <\/p>\n\n<h4><strong>1. Datenaufbereitung  <\/strong><\/h4>\n\n<p>Der erste Schritt in diesem Prozess besteht darin, die Einheitlichkeit aller Datenbanken in Bezug auf die Datenstruktur und die Felder zu gew\u00e4hrleisten. Dieses Verfahren verringert die strukturelle Heterogenit\u00e4t der Datenbanken &#8211; zumindest bis zu einem gewissen Grad. Dabei sind zwei Schritte zu beachten:<\/p>\n\n<h5><strong>a. <a href=\"https:\/\/dataladder.com\/de\/datenbereinigungssoftware-schnelles-und-kostenguenstiges-crm-datenbereinigungstool\/\">Datenbereinigung<\/a> und <a href=\"https:\/\/dataladder.com\/de\/datenstandardisierungssoftware-schnelles-und-kostenguenstiges-datenstandardisierungstool\/\">-standardisierung<\/a> <\/strong><\/h5>\n\n<p>Dies beinhaltet die Beseitigung von Fehlern oder Abweichungen in Formaten und Datentypen von Werten oder in der Struktur von Datenbanken. Dies kann erreicht werden durch:  <\/p>\n\n<ol><li><strong>Parsing langer Zeichenketten<\/strong> zur Identifizierung wichtiger Datenkomponenten. Ein Beispiel hierf\u00fcr ist, wenn Sie die gesamte Adresse in einem Feld haben. Durch die Analyse des <em>Adressfeldes<\/em> erhalten Sie die nachfolgenden Datenkomponenten wie <em>Stra\u00dfenname<\/em>, <em>Hausnummer<\/em>, <em>Postleitzahl<\/em>, <em>Ort<\/em>, <em>Bundesland<\/em> und <em>Land<\/em>. Der Abgleich ist bei diesen geparsten Elementen wesentlich einfacher als beim Abgleich des gesamten Feldes.  <\/li><li><strong>Umwandlung von Datenwerten<\/strong>, um \u00e4hnliche Datentypen, Benennungskonventionen usw. zu erreichen. Dies kann durch die Umwandlung von Datentypen (z. B. Zeichenkette in Zahl), die Umbenennung von Spaltennamen oder die Zusammenf\u00fchrung von Feldern geschehen.  <\/li><li><strong>Standardisierung von Mustern<\/strong> f\u00fcr alle in einem Datenfeld enthaltenen Werte, so dass erwartet wird, dass jeder Wert dem angegebenen Muster entspricht. Ein Beispiel hierf\u00fcr ist, wenn Sie das Muster des Feldes <em>Telefonnummer<\/em> auf <em>XXX-XXX-XXXX<\/em> standardisieren. Dadurch werden Vergleiche und Abgleiche einfacher und genauer.  <\/li><\/ol>\n\n<h5><strong>b. Zuordnung der Datenfelder  <\/strong><\/h5>\n\n<p>Sobald die Datenbanken (so weit wie m\u00f6glich) standardisiert sind, besteht der n\u00e4chste Schritt darin, Felder zuzuordnen, die dieselben Informationen darstellen. Dies geschieht entweder manuell (z. B.,  <em>Adresse<\/em> an  <em>Adresse<\/em>,  <em>Rufnummer<\/em> an  <em>Telefonnummer<\/em> usw.), oder die Durchf\u00fchrung von Pr\u00fcfungen, um festzustellen, welche Feldwerte sich mit den Feldern der anderen Datenbank \u00fcberschneiden. Bei kleineren Datenbest\u00e4nden ist die erste Technik n\u00fctzlich, bei gro\u00dfen Datenbest\u00e4nden, bei denen die Spalten unterschiedlich benannt sind, ist die zweite Technik sehr hilfreich.  <\/p>\n\n<h4>2. Berechnung der \u00c4hnlichkeit mit Hilfe von Feld\u00fcbereinstimmungstechniken  <\/h4>\n\n<p>Sobald dies geschehen ist, sind die Daten in einem relativ besseren Zustand, um sie zu vergleichen und Duplikate zu identifizieren. Aber es gibt immer noch Rechtschreibfehler, menschliche Schreibfehler und konventionelle Varianten. Aus diesem Grund sind exakte Abgleichtechniken hier nicht sinnvoll, und wir ben\u00f6tigen Techniken, die diese Aspekte der Daten bei der Berechnung von Punktzahlen ber\u00fccksichtigen, um die \u00c4hnlichkeit zwischen einzelnen Werten und somit dem gesamten Datensatz zu bewerten.  <\/p>\n\n<h5><strong>a. Zeichenbasierte \u00c4hnlichkeitsmetriken  <\/strong><\/h5>\n\n<p>Da die meisten Tippfehler in Zeichenketten auftreten, werden in diesem Abschnitt die gebr\u00e4uchlichsten Techniken zum Abgleich der \u00c4hnlichkeit von Zeichenketten vorgestellt.  <\/p>\n\n<h6>i.  <strong>Entfernung bearbeiten<\/strong> <\/h6>\n\n<p>Dieser Algorithmus berechnet den Abstand zwischen zwei Zeichenketten, und zwar Zeichen f\u00fcr Zeichen. Der Abstand wird berechnet, indem die Anzahl der Bearbeitungen gez\u00e4hlt wird, die erforderlich sind, um die erste Zeichenfolge in die zweite Zeichenfolge umzuwandeln. Dann wird ein Schwellenwert festgelegt, der zwei Zeichenfolgen als \u00fcbereinstimmend (wenn der <em>Abstand &lt; Schwellenwert<\/em>) oder nicht \u00fcbereinstimmend (wenn <em>der Abstand &gt; Schwellenwert<\/em>) klassifiziert. F\u00fcr die Berechnung des Abstands sind drei Arten von \u00c4nderungen zul\u00e4ssig: <em>Einf\u00fcgen <\/em>eines Zeichens in die Zeichenfolge, <em>L\u00f6schen <\/em>eines Zeichens aus einer Zeichenfolge, <em>Ersetzen <\/em>eines Zeichens durch ein anderes in der Zeichenfolge.  <\/p>\n\n<p>Normalerweise wird der Z\u00e4hler eines Bearbeitungsvorgangs als &#8222;1&#8220; betrachtet. Die verschiedenen Modelle sehen jedoch unterschiedliche <em>Kosten<\/em> f\u00fcr jede Bearbeitung vor. Bei der <strong>Levenshtein-Distanz<\/strong> zum Beispiel werden die Kosten f\u00fcr jede Bearbeitung mit 1 angesetzt, w\u00e4hrend <strong>Needleman und Wunsch<\/strong> erkl\u00e4rten, dass die Kosten f\u00fcr jede Bearbeitung von der Art der Bearbeitung abh\u00e4ngen (das Ersetzen von O durch 0 hat geringere Kosten als das Ersetzen von T durch M).  <\/p>\n\n<h6><strong>ii. Affiner Spaltabstand  <\/strong><\/h6>\n\n<p>Der Editierabstandsalgorithmus funktioniert nicht gut bei Zeichenketten, die Initialen oder Kurzformen enthalten. Die Editierdistanz k\u00f6nnte zum Beispiel <em>Jennifer Lily Stevens<\/em> und <em>Jen L. Stevens<\/em> als Nicht\u00fcbereinstimmung klassifizieren. Hier kann der affine L\u00fcckenabstand n\u00fctzlich sein, da er zwei weitere Bearbeitungsoperationen einf\u00fchrt:  <\/p>\n\n<ul><li><strong>Offene L\u00fccke: <\/strong>bezieht sich auf das Hinzuf\u00fcgen einer L\u00fccke (oder eines Leerzeichens) zu einer Zeichenkette, wo keine vorhanden war.  <\/li><li><strong>L\u00fccke erweitern:<\/strong> bezieht sich auf das Hinzuf\u00fcgen einer L\u00fccke (oder eines Leerzeichens) zu einer Zeichenfolge, in der bereits eine L\u00fccke vorhanden war.  <\/li><\/ul>\n\n<p>Es liegt auf der Hand, dass die Kosten f\u00fcr die \u00d6ffnung einer L\u00fccke (wo es keine gab) h\u00f6her sind als die Kosten f\u00fcr die Erweiterung einer L\u00fccke (wo es bereits eine gab). Mit dieser Variante der Edit-Distanz k\u00f6nnen Sie auch die \u00c4hnlichkeit zwischen verk\u00fcrzten Zeichenfolgen berechnen.  <\/p>\n\n<h6><strong>iii. Smith-Waterman-Abstand  <\/strong><\/h6>\n\n<p>Dies ist eine weitere Variante des Editierabstands und des affinen L\u00fcckenabstands. Dieses Modell senkt die Kosten von Unstimmigkeiten am Anfang oder Ende von Zeichenketten, da die Pr\u00e4fixe und Suffixe h\u00e4ufig unterschiedlich sind. Zum Beispiel macht es mehr Sinn, diese beiden Strings mit dem S-W-Abstand zu vergleichen: <em>Dr. Jennifer Lily Stevens<\/em> und <em>Jennifer Lily Stevens, \u00c4rztin im Nat Medical Center.<\/em><\/p>\n\n<h6>iv.  <strong>Jaro Entfernung<\/strong> <\/h6>\n\n<p>Jaro hat eine Formel zum Vergleich der \u00c4hnlichkeit von Vor- und Nachnamen eingef\u00fchrt. Der Algorithmus zur Berechnung der Jaro-Metrik sieht folgenderma\u00dfen aus:  <\/p>\n\n<ol><li>Berechnen Sie die L\u00e4ngen der beiden zu vergleichenden Zeichenfolgen (S1 und S2).  <\/li><li>Ermitteln Sie die Anzahl der Zeichen, die in beiden Zeichenketten gemeinsam vorkommen (C).  <\/li><li>Vergleichen Sie jedes Zeichen der ersten Zeichenkette mit dem entsprechenden Zeichen der zweiten Zeichenkette, und berechnen Sie jedes nicht \u00fcbereinstimmende Zeichen als Transposition (T).  <\/li><li>Bewerten Sie die Jaro-Metrik als:  <br\/>Jaro = 1\/3 * [ (C\/S1) + (C\/S2) + ((C-(T\/2))\/C) ]  <\/li><\/ol>\n\n<p>Je niedriger der Wert der Jaro-Metrik, desto \u00e4hnlicher sind sich zwei Zeichenketten.  <\/p>\n\n<h6><strong>v. N-Gramm-Abstand.  <\/strong><\/h6>\n\n<p>Dieser Algorithmus erstellt aus den \u00fcbereinstimmenden Zeichenfolgen <em>N-stellige <\/em>Teilzeichenfolgen und vergleicht die Teilzeichenfolgen und nicht das gesamte Wort. Nehmen wir die W\u00f6rter <em>Guide <\/em>und <em>Guode <\/em>als Beispiel. Um die 2-Gramm-Distanz zwischen ihnen zu berechnen, werden folgende Teilstrings erstellt:  <\/p>\n\n<ul><li>Guide = {&#8218;gu&#8216;, &#8218;ui&#8216;, &#8218;id&#8216;, &#8218;de&#8216;}  <\/li><li>Guode = {&#8218;gu&#8216;, &#8218;uo&#8216;, &#8218;od&#8216;, &#8218;de&#8216;}  <\/li><\/ul>\n\n<p>Die \u00c4hnlichkeit wird dann berechnet, indem die Anzahl der gleichen Teilstrings bewertet wird. Dies zeigt deutlich, ob der Benutzer das gleiche Wort eingeben wollte oder ob es sich nur um einen Tippfehler handelt.  <\/p>\n\n<h5><strong>b. Token-basierte \u00c4hnlichkeitsmetriken  <\/strong><\/h5>\n\n<p>Token-basierte \u00c4hnlichkeitsmetriken kommen ins Spiel, wenn Sie Zeichenfolgen vergleichen wollen, die unterschiedlich angeordnet sind, aber dasselbe bedeuten. Zum Beispiel werden Vor- und Nachnamen in der Regel vertauscht, z. B. ist <em>Jennifer Stevens<\/em> dasselbe wie <em>Stevens, Jennifer<\/em>. Aber ein charakterbasierter Vergleich ist f\u00fcr solche Szenarien nicht geeignet. Hier verwenden wir tokenbasierte \u00c4hnlichkeitsmetriken.  <\/p>\n\n<h6><strong>i. Atomare Zeichenketten  <\/strong><\/h6>\n\n<p>Die gebr\u00e4uchlichste tokenbasierte \u00c4hnlichkeitsmetrik sind atomare Zeichenketten. Bei diesem Algorithmus wird die gesamte Zeichenkette in W\u00f6rter unterteilt, die durch Interpunktionen wie Leerzeichen, Komma, Punkt usw. getrennt sind. Und dann werden die W\u00f6rter miteinander verglichen und nicht die gesamte Zeichenkette.  <\/p>\n\n<h6><strong>ii. WHIRL  <\/strong><\/h6>\n\n<p>Der Algorithmus f\u00fcr atomare Zeichenketten weist den W\u00f6rtern beim Vergleich keine Gewichtung zu. Aus diesem Grund werden <em>Doctor Jennifer Stevens<\/em> und <em>Amanda Tates, Doctor<\/em> als einigerma\u00dfen \u00e4hnlich angesehen (da ein Wort eine vollst\u00e4ndige \u00dcbereinstimmung darstellt). WHIRL behebt dieses Problem, indem es h\u00e4ufig verwendeten W\u00f6rtern eine relativ geringe Gewichtung zuweist und die \u00c4hnlichkeit entsprechend berechnet.  <\/p>\n\n<h6><strong>iii. N-Gramme mit WHIRL  <\/strong><\/h6>\n\n<p>WHIRL hat in seinem Algorithmus f\u00fcr den \u00c4hnlichkeitsvergleich Rechtschreibfehler nicht ber\u00fccksichtigt. Sie wurde um die Technik des N-Gramm-Vergleichs erweitert, so dass anstelle ganzer W\u00f6rter (oder Token) N-Gramme verglichen wurden.  <\/p>\n\n<h5><strong>c. Phonetische \u00c4hnlichkeitsmetriken  <\/strong><\/h5>\n\n<p>Die zeichen- und tokenbasierten Algorithmen wurden entwickelt, um Zeichenfolgen zu vergleichen, die sich in ihrer Zeichenzusammensetzung \u00e4hneln. Andererseits gibt es andere F\u00e4lle, in denen wir Saiten vergleichen m\u00fcssen, die zwar nicht gleich aussehen, aber sehr \u00e4hnlich klingen, wenn sie ausgesprochen werden. An dieser Stelle kommen phonetische \u00c4hnlichkeitsmetriken ins Spiel. Werfen wir einen Blick auf die gebr\u00e4uchlichsten Techniken zur Berechnung von phonetischen \u00c4hnlichkeitsmetriken.  <\/p>\n\n<h6><strong>i. Soundex  <\/strong><\/h6>\n\n<p>Soundex wird h\u00e4ufig verwendet, um Nachnamen zu identifizieren, die sich zwar in der Schreibweise unterscheiden, aber phonetisch \u00e4hnlich sind. Auf diese Weise werden Tipp- oder Rechtschreibfehler, die bei der Eingabe der Daten aufgetreten sind, erkannt. Der Algorithmus funktioniert jedoch meist gut bei englischen Nachnamen und ist keine gute Wahl f\u00fcr Namen anderer Herkunft.  <\/p>\n\n<p>Soundex-Algorithmen berechnen einen Code f\u00fcr jede Zeichenkette und vergleichen, wie \u00e4hnlich die Codes f\u00fcr zwei verschiedene Zeichenketten sind. Der Soundex-Code wird wie folgt berechnet:  <\/p>\n\n<ol><li>Behalten Sie den Anfangsbuchstaben des Namens bei.  <\/li><li>Alle Vorkommen von <em>w<\/em> und <em>h<\/em>werden ignoriert <em>.<\/em><\/li><li>Die Buchstaben <em>a, e, i, o, u<\/em> und <em>y<\/em> sind nicht kodiert und werden nur vor\u00fcbergehend beibehalten (da sie im letzten Schritt ganz wegfallen).<\/li><li>Ersetzen Sie die folgenden Buchstaben durch diese Ziffern:  <ol><li><em>b, f, p, v<\/em> \u2192 1  <\/li><li><em>c, g, j, k, q, s, x, z <\/em>\u2192 2  <\/li><li><em>d, t <\/em>\u2192 3  <\/li><li><em>l <\/em>\u2192 4  <\/li><li><em>m, n<\/em> \u2192 5  <\/li><li><em>r <\/em>\u2192 6  <\/li><\/ol><\/li><li>Wenn zwei oder mehr identische Ziffern im Code vorhanden sind, wird nur das erste Vorkommen beibehalten und der Rest weggelassen.  <\/li><li>Streiche diese Buchstaben: <em>a, e, i, o, u<\/em> und <em>y.<\/em> <\/li><li>Behalten Sie den ersten Buchstaben (aus Schritt A.) und die ersten drei Ziffern, die erstellt wurden. Bei weniger als drei Ziffern sind Nullen anzuh\u00e4ngen.  <\/li><\/ol>\n\n<p>Die beiden Zeichenfolgen <em>&#8222;Fairdale&#8220; <\/em>und <em>&#8222;Faredayle&#8220; <\/em>ergeben beispielsweise den Soundex-Code <em>F634<\/em>, da sie phonetisch gleich sind. Soundex erweist sich bei der Suche nach \u00e4hnlich klingenden Nachnamen als 95,99 % genau.  <\/p>\n\n<h6><strong>ii. New York State Identification and Intelligence System (NYSIIS)  <\/strong><\/h6>\n\n<p>Wie der Name schon sagt, wurde dieser Algorithmus 1970 f\u00fcr das New York State Identification and Intelligence System entwickelt, das heute Teil der New York State Division of Criminal Justice Services ist. Die Genauigkeitsrate liegt bei 98,72 % (2,7 % mehr als bei Soundex), da die Details zur Vokalposition im Code erhalten bleiben (sie werden dem Buchstaben A zugeordnet). Au\u00dferdem werden die Konsonanten anderen Alphabeten und nicht den Zahlen zugeordnet, so dass ein vollst\u00e4ndiger Alpha-Code entsteht &#8211; ohne Zahlen.  <\/p>\n\n<h6><strong>iii. Metaphon, Doppelmetaphon und Metaphon 3  <\/strong><\/h6>\n\n<p>Lawrence Philips entwickelte 1990 eine bessere Version von Soundex namens Metaphone. Es schnitt bemerkenswert gut ab, da es die Details der Variationen und Ungereimtheiten in der englischen Aussprache und Rechtschreibung ber\u00fccksichtigte. In seinen Algorithmen verwendete er 16 Konsonantenlaute, die bei der Aussprache einer gro\u00dfen Anzahl englischer und nicht-englischer W\u00f6rter verwendet werden.  <\/p>\n\n<p>Sp\u00e4ter ver\u00f6ffentlichte Philips eine neuere Version mit dem Titel Double Metaphone, in der er neben dem Englischen auch Angaben zu einer Reihe von Sprachen machte. Schlie\u00dflich entwickelte er 2009 Metaphone 3, das eine 99-prozentige Genauigkeit f\u00fcr englische W\u00f6rter, andere den Amerikanern vertraute W\u00f6rter sowie in den USA gebr\u00e4uchliche Vor- und Nachnamen aufwies.  <\/p>\n\n<h5><strong>d. Numerische \u00c4hnlichkeitsmetriken  <\/strong><\/h5>\n\n<p>Es gibt viele Methoden zur Berechnung von String-basierten Differenzen, aber f\u00fcr numerische Datens\u00e4tze sind diese Methoden begrenzt. Einfache numerische Unterschiede werden in der Regel durch die Berechnung des Abstands der Werte zueinander bewertet, aber bei komplexen Berechnungen kann auch die Verteilung der numerischen Daten ber\u00fccksichtigt werden. Algorithmen wie die Cosinus-\u00c4hnlichkeit k\u00f6nnen auch zum Auffinden numerischer Unterschiede verwendet werden.  <\/p>\n\n<h3><strong>Welches Feldabgleichsverfahren ist zu verwenden?<\/strong> <\/h3>\n\n<p>Wie wir gerade gesehen haben, ist der Prozess der \u00c4hnlichkeitssuche zwischen zwei Datenfeldern recht komplex. Wir haben uns mehrere <a href=\"https:\/\/dataladder.com\/de\/datenabgleichssoftware-als-best-in-class-mit-96-match-genauigkeit-bewertet\/\">Datenabgleichstechniken<\/a> angesehen, aber festgestellt, dass jede von ihnen ein bestimmtes Problem der Datendeduplizierung l\u00f6st, und dass es keine einzige Technik gibt, die f\u00fcr alle Datentypen und -formate eine gute Leistung verspricht.  <\/p>\n\n<p>Die Wahl der passenden Technik h\u00e4ngt stark von diesen Faktoren ab:  <\/p>\n\n<ul><li><strong>Art Ihrer Daten &#8211; oder der Datentyp.  <\/strong>Die Jaro-Distanz beispielsweise eignet sich gut f\u00fcr Zeichenketten, w\u00e4hrend die Kosinus-\u00c4hnlichkeit f\u00fcr numerische Datens\u00e4tze am h\u00e4ufigsten verwendet wird.  <\/li><li><strong>Art der Duplikate, die in Ihrem Datensatz vorhanden sind.<\/strong>  So lassen sich beispielsweise Tipp- und Rechtschreibfehler besser mit zeichenbasierten \u00c4hnlichkeitsmetriken erfassen, w\u00e4hrend unterschiedlich formatierte Felder besser mit tokenbasierten \u00c4hnlichkeitsmetriken abgeglichen werden k\u00f6nnen.  <\/li><li><strong>Bereich Ihrer Daten.<\/strong>  Wenn Sie z. B. englische Vor- oder Nachnamen abgleichen, funktioniert Metaphone gut, aber wenn Ihr Datensatz auch nicht-englische Namen enth\u00e4lt, ist es sinnvoller, Doppel-Metaphone oder Metaphone 3 zu verwenden.  <\/li><\/ul>\n\n<h3><strong>Automatisieren des Deduplizierungsprozesses<\/strong> <\/h3>\n\n<p>Es ist eine schwierige Aufgabe, die Interna der Datenabgleichstechniken zu verstehen und eine geeignete Technik f\u00fcr Ihren Datensatz auszuw\u00e4hlen. In vielen Situationen reicht eine Technik nicht aus, und es wird eine Kombination von Techniken verwendet, um Daten genau abzuleiten. Aus diesem Grund steigt der Bedarf an digitalen Werkzeugen. Tools, die nicht nur den Zeit- und Arbeitsaufwand optimieren, sondern auch die Datenabgleichstechniken je nach Art Ihrer Datenstruktur und Werte intelligent ausw\u00e4hlen.  <\/p>\n\n<p><a href=\"https:\/\/dataladder.com\/de\/produkte\/datamatch-enterprise-bewertetes-datenqualitaetsmanagementprodukt-nr-1\/\" target=\"_blank\" rel=\"noreferrer noopener\">DataMatch Enterprise<\/a> ist ein solches Tool, das Ihren gesamten Datenqualit\u00e4tsprozess von Anfang bis Ende abwickelt. Es bietet eine Reihe von Modulen, die Daten aus verschiedenen Quellen unterst\u00fctzen, eine Feldzuordnung erm\u00f6glichen und eine Kombination von Abgleichsdefinitionen vorschlagen, die speziell auf Ihre Daten zugeschnitten sind. Sie k\u00f6nnen die vorgeschlagenen Abgleichsfelder und -algorithmen verwenden oder sie durch die Auswahl Ihrer eigenen \u00fcberschreiben. Das Tool kann auch verwendet werden, um die Treffergenauigkeit verschiedener Abgleichtechniken in Ihrem Datensatz zu bewerten und festzustellen, welcher Algorithmus am besten abschneidet.  <\/p>\n\n<p>Wenn Sie mehr wissen m\u00f6chten, <a href=\"https:\/\/dataladder.com\/de\/kostenlose-testversion-datenabgleichssoftware\/\" target=\"_blank\" rel=\"noreferrer noopener\">melden<\/a> Sie sich noch heute <a href=\"https:\/\/dataladder.com\/de\/kostenlose-testversion-datenabgleichssoftware\/\" target=\"{wpml_trans_unit_105_0_1_-1_1}\" rel=\"{wpml_trans_unit_105_0_1_-1_2} noopener\">f\u00fcr eine kostenlose Testversion an<\/a> oder vereinbaren Sie eine Demo mit einem unserer Experten, und beginnen Sie mit der Bereinigung Ihrer Daten!  <\/p>\n","protected":false},"excerpt":{"rendered":"<p>Laut Natik Ameen, Marketingexperte bei Canz Marketing, sind doppelte Daten im CRM des Unternehmens auf eine Reihe von Gr\u00fcnden zur\u00fcckzuf\u00fchren: &#8222;von menschlichem Versagen bis hin zu Kunden, die zu unterschiedlichen Zeitpunkten leicht abweichende Informationen in die Unternehmensdatenbank eingeben. Ein Verbraucher gibt beispielsweise auf einem Formular seinen Namen als Jonathan Smith und auf dem anderen als [&hellip;]<\/p>\n","protected":false},"author":9,"featured_media":60397,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_lmt_disableupdate":"","_lmt_disable":"","_links_to":"","_links_to_target":""},"categories":[],"tags":[765,683,676],"acf":[],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v19.9 - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>Warum gibt es Duplikate und wie wird man sie los? - Data Ladder<\/title>\n<meta name=\"description\" content=\"Daten haben mehrere Darstellungen - das hei\u00dft, dieselben Daten k\u00f6nnen auf unterschiedliche Weise dargestellt werden. Dies ist der Grund, warum es doppelte Daten gibt.\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/dataladder.com\/de\/warum-gibt-es-duplikate-und-wie-wird-man-sie-los\/\" \/>\n<meta property=\"og:locale\" content=\"de_DE\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Warum gibt es Duplikate und wie wird man sie los? - Data Ladder\" \/>\n<meta property=\"og:description\" content=\"Daten haben mehrere Darstellungen - das hei\u00dft, dieselben Daten k\u00f6nnen auf unterschiedliche Weise dargestellt werden. Dies ist der Grund, warum es doppelte Daten gibt.\" \/>\n<meta property=\"og:url\" content=\"https:\/\/dataladder.com\/de\/warum-gibt-es-duplikate-und-wie-wird-man-sie-los\/\" \/>\n<meta property=\"og:site_name\" content=\"Data Ladder\" \/>\n<meta property=\"article:publisher\" content=\"https:\/\/web.facebook.com\/DataLadderSoftware\" \/>\n<meta property=\"article:published_time\" content=\"2021-11-15T11:23:47+00:00\" \/>\n<meta property=\"article:modified_time\" content=\"2021-12-21T13:52:48+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/dataladder.com\/wp-content\/uploads\/2021\/11\/Why-duplicates-exist-and-how-to-get-rid-of-them.jpg\" \/>\n\t<meta property=\"og:image:width\" content=\"700\" \/>\n\t<meta property=\"og:image:height\" content=\"467\" \/>\n\t<meta property=\"og:image:type\" content=\"image\/jpeg\" \/>\n<meta name=\"author\" content=\"lbarrera\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"Verfasst von\" \/>\n\t<meta name=\"twitter:data1\" content=\"lbarrera\" \/>\n\t<meta name=\"twitter:label2\" content=\"Gesch\u00e4tzte Lesezeit\" \/>\n\t<meta name=\"twitter:data2\" content=\"14 Minuten\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"Article\",\"@id\":\"https:\/\/dataladder.com\/de\/warum-gibt-es-duplikate-und-wie-wird-man-sie-los\/#article\",\"isPartOf\":{\"@id\":\"https:\/\/dataladder.com\/de\/warum-gibt-es-duplikate-und-wie-wird-man-sie-los\/\"},\"author\":{\"name\":\"lbarrera\",\"@id\":\"https:\/\/dataladder.com\/de\/#\/schema\/person\/6cc3d6b3c83c611546541b5eb2d1e21b\"},\"headline\":\"Warum gibt es Duplikate und wie wird man sie los?\",\"datePublished\":\"2021-11-15T11:23:47+00:00\",\"dateModified\":\"2021-12-21T13:52:48+00:00\",\"mainEntityOfPage\":{\"@id\":\"https:\/\/dataladder.com\/de\/warum-gibt-es-duplikate-und-wie-wird-man-sie-los\/\"},\"wordCount\":2822,\"commentCount\":0,\"publisher\":{\"@id\":\"https:\/\/dataladder.com\/de\/#organization\"},\"keywords\":[\"Datenbereinigung\",\"Datenvervielf\u00e4ltigung\",\"Vorbereitung der Daten\"],\"inLanguage\":\"de-DE\",\"potentialAction\":[{\"@type\":\"CommentAction\",\"name\":\"Comment\",\"target\":[\"https:\/\/dataladder.com\/de\/warum-gibt-es-duplikate-und-wie-wird-man-sie-los\/#respond\"]}]},{\"@type\":\"WebPage\",\"@id\":\"https:\/\/dataladder.com\/de\/warum-gibt-es-duplikate-und-wie-wird-man-sie-los\/\",\"url\":\"https:\/\/dataladder.com\/de\/warum-gibt-es-duplikate-und-wie-wird-man-sie-los\/\",\"name\":\"Warum gibt es Duplikate und wie wird man sie los? - Data Ladder\",\"isPartOf\":{\"@id\":\"https:\/\/dataladder.com\/de\/#website\"},\"datePublished\":\"2021-11-15T11:23:47+00:00\",\"dateModified\":\"2021-12-21T13:52:48+00:00\",\"description\":\"Daten haben mehrere Darstellungen - das hei\u00dft, dieselben Daten k\u00f6nnen auf unterschiedliche Weise dargestellt werden. Dies ist der Grund, warum es doppelte Daten gibt.\",\"breadcrumb\":{\"@id\":\"https:\/\/dataladder.com\/de\/warum-gibt-es-duplikate-und-wie-wird-man-sie-los\/#breadcrumb\"},\"inLanguage\":\"de-DE\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/dataladder.com\/de\/warum-gibt-es-duplikate-und-wie-wird-man-sie-los\/\"]}]},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/dataladder.com\/de\/warum-gibt-es-duplikate-und-wie-wird-man-sie-los\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Home\",\"item\":\"https:\/\/dataladder.com\/de\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Warum gibt es Duplikate und wie wird man sie los?\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/dataladder.com\/de\/#website\",\"url\":\"https:\/\/dataladder.com\/de\/\",\"name\":\"Data Ladder\",\"description\":\"Enterprise Data Profiling, Cleansing, and Matching\",\"publisher\":{\"@id\":\"https:\/\/dataladder.com\/de\/#organization\"},\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/dataladder.com\/de\/?s={search_term_string}\"},\"query-input\":\"required name=search_term_string\"}],\"inLanguage\":\"de-DE\"},{\"@type\":\"Organization\",\"@id\":\"https:\/\/dataladder.com\/de\/#organization\",\"name\":\"Data Ladder\",\"url\":\"https:\/\/dataladder.com\/de\/\",\"logo\":{\"@type\":\"ImageObject\",\"inLanguage\":\"de-DE\",\"@id\":\"https:\/\/dataladder.com\/de\/#\/schema\/logo\/image\/\",\"url\":\"https:\/\/dataladder.com\/wp-content\/uploads\/2018\/06\/DL-Logo-Ball-30.png\",\"contentUrl\":\"https:\/\/dataladder.com\/wp-content\/uploads\/2018\/06\/DL-Logo-Ball-30.png\",\"width\":413,\"height\":408,\"caption\":\"Data Ladder\"},\"image\":{\"@id\":\"https:\/\/dataladder.com\/de\/#\/schema\/logo\/image\/\"},\"sameAs\":[\"https:\/\/www.linkedin.com\/company\/dataladder-llc\/\",\"https:\/\/web.facebook.com\/DataLadderSoftware\"]},{\"@type\":\"Person\",\"@id\":\"https:\/\/dataladder.com\/de\/#\/schema\/person\/6cc3d6b3c83c611546541b5eb2d1e21b\",\"name\":\"lbarrera\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"de-DE\",\"@id\":\"https:\/\/dataladder.com\/de\/#\/schema\/person\/image\/\",\"url\":\"https:\/\/secure.gravatar.com\/avatar\/5198cb4dd374e7d879a15a9cf20299b3?s=96&d=mm&r=g\",\"contentUrl\":\"https:\/\/secure.gravatar.com\/avatar\/5198cb4dd374e7d879a15a9cf20299b3?s=96&d=mm&r=g\",\"caption\":\"lbarrera\"},\"url\":\"https:\/\/dataladder.com\/de\/author\/lbarrera\/\"}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Warum gibt es Duplikate und wie wird man sie los? - Data Ladder","description":"Daten haben mehrere Darstellungen - das hei\u00dft, dieselben Daten k\u00f6nnen auf unterschiedliche Weise dargestellt werden. Dies ist der Grund, warum es doppelte Daten gibt.","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/dataladder.com\/de\/warum-gibt-es-duplikate-und-wie-wird-man-sie-los\/","og_locale":"de_DE","og_type":"article","og_title":"Warum gibt es Duplikate und wie wird man sie los? - Data Ladder","og_description":"Daten haben mehrere Darstellungen - das hei\u00dft, dieselben Daten k\u00f6nnen auf unterschiedliche Weise dargestellt werden. Dies ist der Grund, warum es doppelte Daten gibt.","og_url":"https:\/\/dataladder.com\/de\/warum-gibt-es-duplikate-und-wie-wird-man-sie-los\/","og_site_name":"Data Ladder","article_publisher":"https:\/\/web.facebook.com\/DataLadderSoftware","article_published_time":"2021-11-15T11:23:47+00:00","article_modified_time":"2021-12-21T13:52:48+00:00","og_image":[{"width":700,"height":467,"url":"https:\/\/dataladder.com\/wp-content\/uploads\/2021\/11\/Why-duplicates-exist-and-how-to-get-rid-of-them.jpg","type":"image\/jpeg"}],"author":"lbarrera","twitter_card":"summary_large_image","twitter_misc":{"Verfasst von":"lbarrera","Gesch\u00e4tzte Lesezeit":"14 Minuten"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"Article","@id":"https:\/\/dataladder.com\/de\/warum-gibt-es-duplikate-und-wie-wird-man-sie-los\/#article","isPartOf":{"@id":"https:\/\/dataladder.com\/de\/warum-gibt-es-duplikate-und-wie-wird-man-sie-los\/"},"author":{"name":"lbarrera","@id":"https:\/\/dataladder.com\/de\/#\/schema\/person\/6cc3d6b3c83c611546541b5eb2d1e21b"},"headline":"Warum gibt es Duplikate und wie wird man sie los?","datePublished":"2021-11-15T11:23:47+00:00","dateModified":"2021-12-21T13:52:48+00:00","mainEntityOfPage":{"@id":"https:\/\/dataladder.com\/de\/warum-gibt-es-duplikate-und-wie-wird-man-sie-los\/"},"wordCount":2822,"commentCount":0,"publisher":{"@id":"https:\/\/dataladder.com\/de\/#organization"},"keywords":["Datenbereinigung","Datenvervielf\u00e4ltigung","Vorbereitung der Daten"],"inLanguage":"de-DE","potentialAction":[{"@type":"CommentAction","name":"Comment","target":["https:\/\/dataladder.com\/de\/warum-gibt-es-duplikate-und-wie-wird-man-sie-los\/#respond"]}]},{"@type":"WebPage","@id":"https:\/\/dataladder.com\/de\/warum-gibt-es-duplikate-und-wie-wird-man-sie-los\/","url":"https:\/\/dataladder.com\/de\/warum-gibt-es-duplikate-und-wie-wird-man-sie-los\/","name":"Warum gibt es Duplikate und wie wird man sie los? - Data Ladder","isPartOf":{"@id":"https:\/\/dataladder.com\/de\/#website"},"datePublished":"2021-11-15T11:23:47+00:00","dateModified":"2021-12-21T13:52:48+00:00","description":"Daten haben mehrere Darstellungen - das hei\u00dft, dieselben Daten k\u00f6nnen auf unterschiedliche Weise dargestellt werden. Dies ist der Grund, warum es doppelte Daten gibt.","breadcrumb":{"@id":"https:\/\/dataladder.com\/de\/warum-gibt-es-duplikate-und-wie-wird-man-sie-los\/#breadcrumb"},"inLanguage":"de-DE","potentialAction":[{"@type":"ReadAction","target":["https:\/\/dataladder.com\/de\/warum-gibt-es-duplikate-und-wie-wird-man-sie-los\/"]}]},{"@type":"BreadcrumbList","@id":"https:\/\/dataladder.com\/de\/warum-gibt-es-duplikate-und-wie-wird-man-sie-los\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Home","item":"https:\/\/dataladder.com\/de\/"},{"@type":"ListItem","position":2,"name":"Warum gibt es Duplikate und wie wird man sie los?"}]},{"@type":"WebSite","@id":"https:\/\/dataladder.com\/de\/#website","url":"https:\/\/dataladder.com\/de\/","name":"Data Ladder","description":"Enterprise Data Profiling, Cleansing, and Matching","publisher":{"@id":"https:\/\/dataladder.com\/de\/#organization"},"potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/dataladder.com\/de\/?s={search_term_string}"},"query-input":"required name=search_term_string"}],"inLanguage":"de-DE"},{"@type":"Organization","@id":"https:\/\/dataladder.com\/de\/#organization","name":"Data Ladder","url":"https:\/\/dataladder.com\/de\/","logo":{"@type":"ImageObject","inLanguage":"de-DE","@id":"https:\/\/dataladder.com\/de\/#\/schema\/logo\/image\/","url":"https:\/\/dataladder.com\/wp-content\/uploads\/2018\/06\/DL-Logo-Ball-30.png","contentUrl":"https:\/\/dataladder.com\/wp-content\/uploads\/2018\/06\/DL-Logo-Ball-30.png","width":413,"height":408,"caption":"Data Ladder"},"image":{"@id":"https:\/\/dataladder.com\/de\/#\/schema\/logo\/image\/"},"sameAs":["https:\/\/www.linkedin.com\/company\/dataladder-llc\/","https:\/\/web.facebook.com\/DataLadderSoftware"]},{"@type":"Person","@id":"https:\/\/dataladder.com\/de\/#\/schema\/person\/6cc3d6b3c83c611546541b5eb2d1e21b","name":"lbarrera","image":{"@type":"ImageObject","inLanguage":"de-DE","@id":"https:\/\/dataladder.com\/de\/#\/schema\/person\/image\/","url":"https:\/\/secure.gravatar.com\/avatar\/5198cb4dd374e7d879a15a9cf20299b3?s=96&d=mm&r=g","contentUrl":"https:\/\/secure.gravatar.com\/avatar\/5198cb4dd374e7d879a15a9cf20299b3?s=96&d=mm&r=g","caption":"lbarrera"},"url":"https:\/\/dataladder.com\/de\/author\/lbarrera\/"}]}},"modified_by":null,"_links":{"self":[{"href":"https:\/\/dataladder.com\/de\/wp-json\/wp\/v2\/posts\/62241"}],"collection":[{"href":"https:\/\/dataladder.com\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/dataladder.com\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/dataladder.com\/de\/wp-json\/wp\/v2\/users\/9"}],"replies":[{"embeddable":true,"href":"https:\/\/dataladder.com\/de\/wp-json\/wp\/v2\/comments?post=62241"}],"version-history":[{"count":1,"href":"https:\/\/dataladder.com\/de\/wp-json\/wp\/v2\/posts\/62241\/revisions"}],"predecessor-version":[{"id":62242,"href":"https:\/\/dataladder.com\/de\/wp-json\/wp\/v2\/posts\/62241\/revisions\/62242"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/dataladder.com\/de\/wp-json\/wp\/v2\/media\/60397"}],"wp:attachment":[{"href":"https:\/\/dataladder.com\/de\/wp-json\/wp\/v2\/media?parent=62241"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/dataladder.com\/de\/wp-json\/wp\/v2\/categories?post=62241"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/dataladder.com\/de\/wp-json\/wp\/v2\/tags?post=62241"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}