{"id":63008,"date":"2020-10-02T00:00:00","date_gmt":"2020-10-02T04:00:00","guid":{"rendered":"https:\/\/dataladder.com\/wie-man-fehlende-daten-identifiziert-die-vollstaendigkeit-der-daten-sicherstellt-und-die-genauigkeit-der-daten-aufrechterhaelt\/"},"modified":"2022-04-14T11:45:58","modified_gmt":"2022-04-14T11:45:58","slug":"wie-man-fehlende-daten-identifiziert-die-vollstaendigkeit-der-daten-sicherstellt-und-die-genauigkeit-der-daten-aufrechterhaelt","status":"publish","type":"post","link":"https:\/\/dataladder.com\/de\/wie-man-fehlende-daten-identifiziert-die-vollstaendigkeit-der-daten-sicherstellt-und-die-genauigkeit-der-daten-aufrechterhaelt\/","title":{"rendered":"Wie man fehlende Daten identifiziert, die Vollst\u00e4ndigkeit der Daten sicherstellt und die Genauigkeit der Daten aufrechterh\u00e4lt"},"content":{"rendered":"<p>Daten aus der realen Welt werden immer unvollst\u00e4ndige oder fehlende Werte enthalten, insbesondere wenn sie aus verschiedenen Quellen stammen. Unvollst\u00e4ndige Daten k\u00f6nnen zu fehlerhaften Berichten und verzerrten Schlussfolgerungen im Forschungsbereich f\u00fchren. F\u00fcr Unternehmen bedeutet dies, dass sie nur unzureichende Einblicke in ihre Kunden erhalten, ungenaue Gesch\u00e4ftsinformationen erhalten und ihre Rentabilit\u00e4t verlieren.<\/p>\n<p>Die Vollst\u00e4ndigkeit der Daten ist daher eine wesentliche Komponente des Datenqualit\u00e4tsrahmens und steht in engem Zusammenhang mit der G\u00fcltigkeit und der Genauigkeit. Wenn die Daten fehlen, k\u00f6nnen die Informationen nicht validiert werden, und wenn sie nicht validiert sind, k\u00f6nnen sie nicht als korrekt angesehen werden.<\/p>\n<p>Unabh\u00e4ngig davon, ob Sie als Forscher mit Umfragedaten, als Gesch\u00e4ftsmann mit CRM-Daten oder als IT-Experte mit Organisationsdaten arbeiten, m\u00fcssen Sie in der Lage sein, fehlende und unvollst\u00e4ndige Datenwerte zu erkennen, um die n\u00e4chsten Schritte zu bestimmen.<\/p>\n<p>In diesem kurzen Beitrag gehe ich auf die wichtigsten Konzepte ein:<\/p>\n<ul>\n<li>Was bedeutet es, wenn Daten fehlen?<\/li>\n<li>Arten von fehlenden Daten<\/li>\n<li>Wie erkennen Sie fehlende Daten?<\/li>\n<li>Die Bedeutung der Vollst\u00e4ndigkeit der Daten<\/li>\n<li>Arten der Datenvollst\u00e4ndigkeit<\/li>\n<li>Wie man Vollst\u00e4ndigkeit misst<\/li>\n<li>Wie DataMatch Enterprise bei der Ermittlung fehlender Daten effektiver ist als Python<\/li>\n<\/ul>\n<h2>Was bedeutet es, wenn Daten fehlen?<\/h2>\n<p>Fehlende Daten beziehen sich auf Zeilen oder Spalten, die keine, leere oder unvollst\u00e4ndige Werte aufweisen.<\/p>\n<p>Beispiele:<\/p>\n<ul>\n<li>Fehlende Nachnamen, Telefonnummern, E-Mail-Adressen in einem CRM<\/li>\n<li>Fehlendes Alter und fehlende Besch\u00e4ftigungsjahre in einem Beobachtungsdatensatz<\/li>\n<li>Fehlende Einkommensangaben von Arbeitnehmern in Organisationsdaten<\/li>\n<\/ul>\n<p>Die Ursachen f\u00fcr fehlende Daten sind vielf\u00e4ltig, lassen sich aber auf drei h\u00e4ufige Gr\u00fcnde zusammenfassen:<\/p>\n<ul>\n<li>mangelnde Bereitschaft der Menschen, Informationen zu geben (z. B. Einkommensverh\u00e4ltnisse, sexuelle Orientierung usw.)<\/li>\n<li>Fehler bei der Dateneingabe, die auf mangelhafte Datenstandards zur\u00fcckzuf\u00fchren sind (Webformulare ohne Pflichtfelder)<\/li>\n<li>Felder, die f\u00fcr die Zielgruppe nicht relevant sind (z. B. wird eine Spalte, in der der Firmenname verlangt wird, leer gelassen, wenn die Mehrheit der Antwortenden im Ruhestand ist)<\/li>\n<li>F\u00fcr Forscher, die an L\u00e4ngsschnittstudien teilnehmen, ist die Abbruchquote (Teilnehmer, die aus der Studie aussteigen) ebenfalls eine der Hauptursachen f\u00fcr fehlende Daten.<\/li>\n<\/ul>\n<p>In statistischen Forschungsmodellen f\u00fchren diese Ursachen zu vier Arten von fehlenden Daten, die Forscher identifizieren m\u00fcssen, bevor sie versuchen, Korrekturen vorzunehmen. Obwohl die statistische Erfassung fehlender Datentypen nicht in den Rahmen dieses Artikels f\u00e4llt, werde ich Ihnen dennoch einen grundlegenden \u00dcberblick geben.<\/p>\n<p><strong><br \/>\n<em>Anmerkung: <\/em><br \/>\n<\/strong><em>F\u00fcr diejenigen, die an einem tieferen Verst\u00e4ndnis der Arten von fehlenden Daten in der Gesundheitsforschung und in L\u00e4ngsschnittstudien interessiert sind, ist der Artikel <a href=\"https:\/\/www.tandfonline.com\/doi\/full\/10.1080\/00949655.2018.1520854\" rel=\"nofollow\">&#8222;Strategies for handling missing data in longitudinal studies&#8220; <\/a>aus dem Journal of Statistical Computation and Simulation eine hervorragende Quelle. <\/em><\/p>\n<h2>Arten von fehlenden Daten:<\/h2>\n<p>In der statistischen Forschung werden fehlende Daten in vier Typen unterteilt:<\/p>\n<p><strong>Strukturell: <\/strong>Daten, die fehlen, weil sie logischerweise nicht existieren sollten.<\/p>\n<p><img src=\"https:\/\/dataladder.com\/wp-content\/uploads\/2020\/10\/datacompletenessexample1-1.png\" alt=\"missing data\" width=\"417\" height=\"110\" \/><\/p>\n<p style=\"text-align: center;\"><strong>Beispiel:<\/strong> Personen, die keine Kinder haben, lassen die Spalte [No .of Children] leer. Diese Personen k\u00f6nnen strukturell von den Schlussfolgerungen ausgeschlossen werden, ohne dass sich dies auf das Ergebnis einer Studie auswirkt, da sie dieses Feld logischerweise nicht ausf\u00fcllen m\u00fcssen.<\/p>\n<p><strong>Vollst\u00e4ndig zuf\u00e4llig fehlende Daten (MCAR): <\/strong>Die Spalten mit fehlenden Daten stehen nicht in einem Abh\u00e4ngigkeitsverh\u00e4ltnis zueinander.<\/p>\n<p><img src=\"https:\/\/dataladder.com\/wp-content\/uploads\/2020\/10\/datacompletenessexample2.png\" alt=\"Missing completely at random\" width=\"422\" height=\"92\" \/><\/p>\n<p style=\"text-align: center;\"><strong>Beispiel<\/strong>: Fehlende Altersangaben stehen nicht im Zusammenhang mit den GPA-Werten eines Sch\u00fclers in einer Studie zur Messung der akademischen Leistungen von K-12-Sch\u00fclern. Forscher k\u00f6nnen ein Durchschnittsalter annehmen (z. B. 16 bis 18 Jahre f\u00fcr K-12) und mit dem Abschluss eines Berichts fortfahren, ohne dessen Glaubw\u00fcrdigkeit zu beeintr\u00e4chtigen.<\/p>\n<p><strong>Fehlende Werte nach dem Zufallsprinzip (MAR): <\/strong>Im Gegensatz zu MCAR, bei dem es keine Verbindung zwischen fehlenden Werten und dem Studienteilnehmer gibt, erm\u00f6glicht MAR die Vorhersage eines Musters durch die Verwendung anderer Informationen \u00fcber die Person.<\/p>\n<p><img src=\"https:\/\/dataladder.com\/wp-content\/uploads\/2020\/10\/datacompletenessexample3.png\" alt=\"Missing at random\" width=\"417\" height=\"206\" \/><\/p>\n<p style=\"text-align: center;\"><strong>Beispiel:<\/strong> Im obigen Beispiel hat das Alter keinen Einfluss auf die GPA-Werte, wohl aber auf die Besch\u00e4ftigung. Die Forscher kommen zu dem Schluss, dass Sch\u00fcler im Alter von \u00fcber 14 Jahren aufgrund einer Teilzeitbesch\u00e4ftigung, die sich auf ihre Lernzeiten und ihre geistige Leistungsf\u00e4higkeit auswirkt, m\u00f6glicherweise schlechtere akademische Ergebnisse erzielen.<\/p>\n<p><strong>Nicht zuf\u00e4llig fehlende Daten (MNAR): <\/strong>MNAR ist etwas verwirrend und bezieht sich auf Daten, die absichtlich fehlen, d. h. auf Personen, die sich weigern zu antworten. In der oben genannten Studie weigern sich beispielsweise die meisten 14-J\u00e4hrigen *vielleicht*, ihre tats\u00e4chlichen Arbeitsstunden zu leisten. MNAR-Daten sind h\u00f6chst problematisch, da man weder auf einen bestimmten Grund schlie\u00dfen oder diesen vermuten kann, noch kann man die Standardmethoden f\u00fcr fehlende Daten anwenden, um eine schl\u00fcssige Antwort zu erhalten.<\/p>\n<p><em><strong>In der Gesch\u00e4ftswelt ist die Art der fehlenden oder unvollst\u00e4ndigen Daten eine andere. Sie m\u00fcssen sich zwar nicht mit MAR- oder MNAR-Problemen befassen, wohl aber mit fehlenden Kontaktinformationen<\/strong><\/em> (Telefonnummern, Nachnamen, E-Mails, Adressen, Postleitzahlen usw.).<\/p>\n<h2>Wie werden fehlende Daten identifiziert?<\/h2>\n<p>Forscher, die mit Statistikprogrammen wie SAS, SPSS oder Stata arbeiten, m\u00fcssen fehlende Werte manuell ermitteln, l\u00f6schen und ersetzen. Aber es gibt ein Problem.<\/p>\n<p>Die meisten dieser Programme entfernen automatisch fehlende Werte aus jeder von Ihnen durchgef\u00fchrten Analyse, weshalb die verschiedenen Variablen unterschiedlich viele fehlende Daten aufweisen. Daher m\u00fcssen die Forscher einen Datensatz auf fehlende Daten \u00fcberpr\u00fcfen <strong>, bevor<\/strong> sie entscheiden k\u00f6nnen, welche Daten sie entfernen wollen. Dieser Prozess ist manuell und erfordert neben der Beherrschung von Python &#8211; der Sprache, die zur Programmierung von Algorithmen zur Erkennung fehlender Daten verwendet wird &#8211; auch spezifische Plattformkenntnisse.<\/p>\n<p>Die Ermittlung der fehlenden Daten ist nur der erste Schritt des Problems. Sie m\u00fcssen zus\u00e4tzliche Kodierungen vornehmen, um fehlende Werte durch Imputationen zu ersetzen (d. h. Mittelwert, Median, um fehlende Werte zu ersetzen). Sie m\u00fcssen Spalten manuell abgleichen, Codes schreiben und den Vorgang so lange wiederholen, bis das gew\u00fcnschte Ergebnis erreicht ist. In einem Zeitalter, in dem Schnelligkeit die Norm ist, k\u00f6nnen Sie es sich nicht leisten, Monate damit zu verbringen, fehlende Werte zu ermitteln und sie zu beheben.<\/p>\n<p>Dasselbe Problem stellt sich auch im gesch\u00e4ftlichen Umfeld. CRMs sollten den Aufwand f\u00fcr die Datenverwaltung verringern, aber Probleme mit fehlenden Daten sind nach wie vor eine gro\u00dfe Herausforderung. Die Benutzer m\u00fcssen fehlende Werte manuell ermitteln und sie bereinigen, indem sie die Daten in ein XLS-Format exportieren, um Massen\u00e4nderungen vorzunehmen. Wenn nur grundlegende Kontaktinformationen fehlen, kann dies mit Excel behoben werden, aber was ist, wenn die Art der fehlenden Daten \u00fcber Kontaktinformationen hinausgeht? Was ist, wenn es sich um firmenbezogene oder psychografische Daten handelt?<\/p>\n<p>Wie entdeckt man unvollst\u00e4ndige Firmennamen (z. B. BOSE [a brand] vs. BOSE Corporation [a company]). Es ist nicht so einfach, dies manuell zu tun!<\/p>\n<p>Die wichtigste Frage, die es zu beantworten gilt, lautet: Wie lassen sich Probleme mit fehlenden Daten begrenzen und die Vollst\u00e4ndigkeit der Daten sicherstellen?<\/p>\n<h2>Was ist Datenvollst\u00e4ndigkeit und wie kann man sie messen?<\/h2>\n<p><em><strong>Im Rahmen der Datenqualit\u00e4t bezieht sich die Vollst\u00e4ndigkeit der Daten auf das Ausma\u00df, in dem alle Daten in einem Datensatz verf\u00fcgbar sind. Ein Ma\u00df f\u00fcr die Vollst\u00e4ndigkeit der Daten ist der Prozentsatz der fehlenden Dateneintr\u00e4ge. <\/strong><\/em><\/p>\n<p><strong>Eine Spalte mit 500 Feldern und 100 fehlenden Feldern hat zum Beispiel einen Vollst\u00e4ndigkeitsgrad von 80 %. Je nach Unternehmen k\u00f6nnen 20 % fehlende Eintr\u00e4ge den Verlust von Hunderttausenden von Dollar an Interessenten und Leads bedeuten! <\/strong><\/p>\n<p>Allerdings geht es bei der Vollst\u00e4ndigkeit der Daten nicht darum, dass 100 % der Felder vollst\u00e4ndig sind. Es geht darum zu bestimmen, welche Informationen wichtig und welche optional sind. So ben\u00f6tigen Sie zum Beispiel auf jeden Fall Telefonnummern, aber vielleicht keine Faxnummern.<\/p>\n<p>Die Vollst\u00e4ndigkeit gibt an, wie viele Informationen und Kenntnisse Sie \u00fcber Ihren Kunden haben und wie genau diese Informationen sind. Bei den Kontaktdaten kann es beispielsweise sein, dass Kinder und \u00e4ltere Menschen keine E-Mail-Adressen haben oder dass einige Kontakte keine Festnetz- oder Arbeitsnummern haben.<\/p>\n<p>Datenvollst\u00e4ndigkeit bedeutet also <strong>nicht, dass alle Datenattribute vorhanden oder ausgef\u00fcllt sein m\u00fcssen. Vielmehr m\u00fcssen Sie klassifizieren und ausw\u00e4hlen, welche Datens\u00e4tze wichtig sind und beibehalten werden m\u00fcssen und welche ignoriert werden k\u00f6nnen. <\/strong><\/p>\n<h2>Wie wird die Vollst\u00e4ndigkeit der Daten bewertet?<\/h2>\n<p>Traditionell wird die Datenvollst\u00e4ndigkeit im Data Warehouse durch ETL-Tests bewertet, bei denen Aggregatfunktionen wie <strong>(Summe, Maximum, Minimum, Anzahl)<\/strong> zur Bewertung der durchschnittlichen Vollst\u00e4ndigkeit einer Spalte oder eines Datensatzes verwendet werden. Dar\u00fcber hinaus wird die Datenprofilvalidierung auch durch manuelle Anweisungen unter Verwendung von Befehlen wie:<\/p>\n<p><img src=\"https:\/\/dataladder.com\/wp-content\/uploads\/2020\/10\/functionsformissingdata.png\" alt=\"\" width=\"399\" height=\"58\" \/><\/p>\n<p>um unterschiedliche Werte und die Anzahl der Zeilen f\u00fcr jeden unterschiedlichen Wert zu vergleichen. Bevor der Benutzer die Befehle ausf\u00fchrt, muss er jedoch die Art der Unvollst\u00e4ndigkeit bestimmen, mit der er zu tun hat, und die Art des Datenqualit\u00e4tsproblems ermitteln, das die Daten betrifft. Wenn z. B. bei allen Telefonnummern die Vorwahlen fehlen, k\u00f6nnte es sich um ein Problem der Datenqualit\u00e4t auf der Eingangsebene handeln. Wenn mehr als 50 % der Teilnehmer keine Antwort auf ein bestimmtes Problem geben, handelt es sich m\u00f6glicherweise um ein MNAR-Problem (missing not at random).<\/p>\n<p>All das ist gro\u00dfartig. Aber es gibt einen wichtigen Schritt, den alle Nutzer \u00fcbersehen:<\/p>\n<p>Sie k\u00f6nnen fehlende Werte nicht bereinigen, entfernen oder ersetzen, wenn Sie nicht wissen, was fehlt und wie viel Prozent dieser fehlenden Daten tolerierbar sind.<\/p>\n<p>Und dies geschieht durch Datenprofilierung!<\/p>\n<h2>Data Profiling &#8211; Der erste Schritt zur \u00dcberpr\u00fcfung der Datenvollst\u00e4ndigkeit und zur Identifizierung fehlender Werte auf Attributsebene<\/h2>\n<p>Bei der Datenprofilierung wird Ihr Datensatz ausgewertet, um eine Reihe von Problemen zu ermitteln, darunter:<\/p>\n<ul>\n<li>Fehlende Werte und Datens\u00e4tze<\/li>\n<li>Datenfehler wie Tippfehler<\/li>\n<li>Anomalien auf Attributsebene (Verwendung von Satzzeichen oder negativen Leerzeichen in Feldern)<\/li>\n<li>Standardisierungsprobleme (Inkonsistenz der Formate NYC vs. New York)<\/li>\n<\/ul>\n<p>und mehr.<\/p>\n<p>Die Erstellung von Datenprofilen ist eine sehr umfangreiche Aufgabe.<\/p>\n<p>Im Idealfall m\u00f6chten Sie in der Lage sein, einen Blick auf die Kundendaten zu werfen und die Nullwerte in den Daten einfach oder schnell zu identifizieren. Sie k\u00f6nnten dies nun manuell tun, indem Sie jede Spalte einzeln \u00fcberpr\u00fcfen oder Algorithmen ausf\u00fchren.<\/p>\n<p>Python erm\u00f6glicht es dem Benutzer, seine Daten auf der Grundlage seiner Wahrnehmung und seines Verst\u00e4ndnisses zu sortieren. Dies ist zwar ideal, wenn es um Kontrolle und Anpassung geht, aber nicht ideal, wenn Sie unter Zeitdruck stehen und es auf Genauigkeit ankommt.<\/p>\n<p>Sie m\u00fcssen st\u00e4ndig Codes erstellen und \u00fcberpr\u00fcfen. Sie m\u00fcssen st\u00e4ndig testen, messen und die Ergebnisse analysieren. Dies ist nicht nur kontraproduktiv, sondern verfehlt auch den Zweck der Nutzung von Daten zur Erreichung von Echtzeitzielen.<\/p>\n<p>K\u00f6nnen Ihre Marketingteams 4 Monate warten, bis Sie Kundendaten aus verschiedenen Quellen bereinigt, abgeleitet und konsolidiert haben?<\/p>\n<p>Kann es sich Ihr Unternehmen leisten, mit jedem Tag, der zu einem ROI-Verlust f\u00fchrt, diesen zu verlieren? Nicht wirklich.<\/p>\n<h2>Verwendung einer ML-basierten L\u00f6sung wie DataMatch Enterprise im Vergleich zu Python Scripting oder ETL-Tools<\/h2>\n<p>Python-Skripte und ETL-Tools sind ideal, weil Sie die Kontrolle dar\u00fcber haben. Die Verwendung eines automatisierten Tools bedeutet nicht, dass Sie die Kontrolle aufgeben oder die N\u00fctzlichkeit dieser Plattformen verwerfen. Es bedeutet lediglich, dass Sie <strong>den Prozess beschleunigen und bei Bedarf automatisieren. <\/strong><\/p>\n<p>Eine L\u00f6sung mit maschinellem Lernen wie <a href=\"https:\/\/dataladder.com\/de\/produkte\/datamatch-enterprise-bewertetes-datenqualitaetsmanagementprodukt-nr-1\/\">DataMatch Enterprise<\/a> von Data Ladder &#8211; eine L\u00f6sung f\u00fcr das Datenqualit\u00e4tsmanagement, mit der Sie fehlende Werte und unvollst\u00e4ndige Informationen erkennen k\u00f6nnen, ohne dass Codes oder Skripte erforderlich sind.<\/p>\n<p>Mit der <a href=\"https:\/\/dataladder.com\/de\/software-und-tools-zur-datenprofilerstellung-erhalten-sie-sofortige-ergebnisse-der-datenqualitaetsbewertung\/\">Datenprofilierungsfunktion<\/a> von DME k\u00f6nnen Sie den Prozentsatz der Datenvollst\u00e4ndigkeit auf Attributsebene \u00fcberpr\u00fcfen (dies ist \u00fcber ETL oder Kodierung nur schwer m\u00f6glich).<\/p>\n<p>Wenn zum Beispiel 30 von 100 Datens\u00e4tzen fehlende Werte aufweisen, werden diese automatisch hervorgehoben, damit Sie sie \u00fcberpr\u00fcfen k\u00f6nnen. Au\u00dferdem erhalten Sie f\u00fcr jede Spalte einen Gesundheitswert. In diesem Fall hat Ihre Spalte &#8222;Nachname&#8220; einen Gesundheitswert von 70 %. All dies ist innerhalb von nur 10 Minuten erledigt. Sie ersparen sich <strong>stundenlange manuelle \u00dcberpr\u00fcfungen, das Testen von Algorithmen und das Schreiben\/Umschreiben von Definitionen <\/strong>, nur um Ihre <a href=\"https:\/\/dataladder.com\/de\/was-ist-datengenauigkeit-warum-ist-sie-wichtig-und-wie-koennen-unternehmen-sicherstellen-dass-sie-ueber-korrekte-daten-verfuegen\/\">Daten auf Richtigkeit<\/a> oder Vollst\u00e4ndigkeit zu \u00fcberpr\u00fcfen.<\/p>\n<p><img src=\"https:\/\/dataladder.com\/wp-content\/uploads\/2020\/09\/Profiling-customer-data-1.png\" alt=\"DataMatch Enterprise vs Python Scripting or ETL Tools\" width=\"540\" height=\"332\" \/><\/p>\n<p>Das ist noch nicht alles.<\/p>\n<p>Manchmal ist es auch erforderlich, <strong>Daten zu konsolidieren und redundante Daten zu bereinigen. <\/strong>Sie stellen zum Beispiel fest, dass die Informationen \u00fcber Ihren Kunden in zwei verschiedenen Datenquellen gespeichert sind. Eine Quelle enth\u00e4lt alles, was Sie brauchen &#8211; Telefonnummern, E-Mail-Adressen, Standorte usw. Die andere Quelle enth\u00e4lt Informationen, die Sie nicht unbedingt ben\u00f6tigen &#8211; Alter, Geschlecht, Faxnummern usw. Sie m\u00f6chten beide kombinieren und diese Informationen entweder <a href=\"https:\/\/dataladder.com\/de\/merge-purge-software-integrierte-und-benutzerdefinierte-ueberlebensregeln-verwenden\/\">zusammenf\u00fchren oder bereinigen<\/a>, um die Vollst\u00e4ndigkeit zu gew\u00e4hrleisten. Stellen Sie sich den Zeitaufwand und die Prozesse vor, die Sie daf\u00fcr aufwenden m\u00fcssen. Allein der Gedanke daran ist anstrengend.<\/p>\n<p>Mit einem Tool wie DME k\u00f6nnen Sie eine Million Datens\u00e4tze innerhalb von 20 Minuten <a href=\"https:\/\/dataladder.com\/de\/datenabgleichssoftware-als-best-in-class-mit-96-match-genauigkeit-bewertet\/\">abgleichen<\/a> und <a href=\"https:\/\/dataladder.com\/de\/datendeduplizierungssoftware-verwenden-sie-integrierte-und-benutzerdefinierte-regeln-fuer-die-crm-deduplizierung\/\">ableiten<\/a>!<\/p>\n<h2>Das wahre Ziel der Datenvollst\u00e4ndigkeit<\/h2>\n<p>Es ist leicht zu <strong>fehlende Werte ignorieren und mit der Erstellung von Berichten oder der Durchf\u00fchrung von Aktivit\u00e4ten fortfahren, obwohl Sie wissen, dass Daten fehlen. <\/strong>Das Ergebnis sind Aufgaben, die zu schlechten Antworten f\u00fchren (z. B. eine E-Mail-Marketingkampagne, bei der fehlende Nachnamen ignoriert wurden und die mit Duplikaten zu k\u00e4mpfen hatte), Berichte mit irref\u00fchrenden Schlussfolgerungen, die sich auf politische Ma\u00dfnahmen und wichtige Reformen auswirken, Gesch\u00e4ftspl\u00e4ne, die scheitern, und Fehler, die rechtliche Auswirkungen haben.<\/p>\n<p>Das wahre Ziel der Datenvollst\u00e4ndigkeit besteht also nicht darin, perfekte, 100 %ige Daten zu haben. Es geht darum, sicherzustellen, dass die f\u00fcr Ihren Zweck wesentlichen Daten<strong> g\u00fcltig, vollst\u00e4ndig, genau und brauchbar<\/strong> sind. Die Ihnen zur Verf\u00fcgung stehenden Hilfsmittel, wie DME, sind Technologien, die Ihnen dabei helfen werden.<\/p>\n\n","protected":false},"excerpt":{"rendered":"<p>Daten aus der realen Welt werden immer unvollst\u00e4ndige oder fehlende Werte enthalten, insbesondere wenn sie aus verschiedenen Quellen stammen. Unvollst\u00e4ndige Daten k\u00f6nnen zu fehlerhaften Berichten und verzerrten Schlussfolgerungen im Forschungsbereich f\u00fchren. F\u00fcr Unternehmen bedeutet dies, dass sie nur unzureichende Einblicke in ihre Kunden erhalten, ungenaue Gesch\u00e4ftsinformationen erhalten und ihre Rentabilit\u00e4t verlieren. Die Vollst\u00e4ndigkeit der Daten [&hellip;]<\/p>\n","protected":false},"author":9,"featured_media":58353,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"_lmt_disableupdate":"","_lmt_disable":"","_links_to":"","_links_to_target":""},"categories":[1346],"tags":[486,529,680,678],"acf":[],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v19.9 - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>Wie man fehlende Daten identifiziert, die Vollst\u00e4ndigkeit der Daten sicherstellt und die Genauigkeit der Daten aufrechterh\u00e4lt - Data Ladder<\/title>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/dataladder.com\/de\/wie-man-fehlende-daten-identifiziert-die-vollstaendigkeit-der-daten-sicherstellt-und-die-genauigkeit-der-daten-aufrechterhaelt\/\" \/>\n<meta property=\"og:locale\" content=\"de_DE\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Wie man fehlende Daten identifiziert, die Vollst\u00e4ndigkeit der Daten sicherstellt und die Genauigkeit der Daten aufrechterh\u00e4lt - Data Ladder\" \/>\n<meta property=\"og:description\" content=\"Daten aus der realen Welt werden immer unvollst\u00e4ndige oder fehlende Werte enthalten, insbesondere wenn sie aus verschiedenen Quellen stammen. Unvollst\u00e4ndige Daten k\u00f6nnen zu fehlerhaften Berichten und verzerrten Schlussfolgerungen im Forschungsbereich f\u00fchren. F\u00fcr Unternehmen bedeutet dies, dass sie nur unzureichende Einblicke in ihre Kunden erhalten, ungenaue Gesch\u00e4ftsinformationen erhalten und ihre Rentabilit\u00e4t verlieren. Die Vollst\u00e4ndigkeit der Daten [&hellip;]\" \/>\n<meta property=\"og:url\" content=\"https:\/\/dataladder.com\/de\/wie-man-fehlende-daten-identifiziert-die-vollstaendigkeit-der-daten-sicherstellt-und-die-genauigkeit-der-daten-aufrechterhaelt\/\" \/>\n<meta property=\"og:site_name\" content=\"Data Ladder\" \/>\n<meta property=\"article:publisher\" content=\"https:\/\/web.facebook.com\/DataLadderSoftware\" \/>\n<meta property=\"article:published_time\" content=\"2020-10-02T04:00:00+00:00\" \/>\n<meta property=\"article:modified_time\" content=\"2022-04-14T11:45:58+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/dataladder.com\/wp-content\/uploads\/2021\/09\/Easy-Identification-of-Missing-Information-Identify-Gaps-in-Data-Entry-Procedures_Excel-Deduplication-Graphic.png\" \/>\n\t<meta property=\"og:image:width\" content=\"1943\" \/>\n\t<meta property=\"og:image:height\" content=\"1919\" \/>\n\t<meta property=\"og:image:type\" content=\"image\/png\" \/>\n<meta name=\"author\" content=\"lbarrera\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"Verfasst von\" \/>\n\t<meta name=\"twitter:data1\" content=\"lbarrera\" \/>\n\t<meta name=\"twitter:label2\" content=\"Gesch\u00e4tzte Lesezeit\" \/>\n\t<meta name=\"twitter:data2\" content=\"11 Minuten\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"Article\",\"@id\":\"https:\/\/dataladder.com\/de\/wie-man-fehlende-daten-identifiziert-die-vollstaendigkeit-der-daten-sicherstellt-und-die-genauigkeit-der-daten-aufrechterhaelt\/#article\",\"isPartOf\":{\"@id\":\"https:\/\/dataladder.com\/de\/wie-man-fehlende-daten-identifiziert-die-vollstaendigkeit-der-daten-sicherstellt-und-die-genauigkeit-der-daten-aufrechterhaelt\/\"},\"author\":{\"name\":\"lbarrera\",\"@id\":\"https:\/\/dataladder.com\/de\/#\/schema\/person\/6cc3d6b3c83c611546541b5eb2d1e21b\"},\"headline\":\"Wie man fehlende Daten identifiziert, die Vollst\u00e4ndigkeit der Daten sicherstellt und die Genauigkeit der Daten aufrechterh\u00e4lt\",\"datePublished\":\"2020-10-02T04:00:00+00:00\",\"dateModified\":\"2022-04-14T11:45:58+00:00\",\"mainEntityOfPage\":{\"@id\":\"https:\/\/dataladder.com\/de\/wie-man-fehlende-daten-identifiziert-die-vollstaendigkeit-der-daten-sicherstellt-und-die-genauigkeit-der-daten-aufrechterhaelt\/\"},\"wordCount\":2243,\"publisher\":{\"@id\":\"https:\/\/dataladder.com\/de\/#organization\"},\"keywords\":[\"Datenprofilerstellung\",\"Datenqualit\u00e4t\",\"fehlende Daten\",\"Vollst\u00e4ndigkeit der Daten\"],\"articleSection\":[\"Metriken zur Datenqualit\u00e4t\"],\"inLanguage\":\"de-DE\"},{\"@type\":\"WebPage\",\"@id\":\"https:\/\/dataladder.com\/de\/wie-man-fehlende-daten-identifiziert-die-vollstaendigkeit-der-daten-sicherstellt-und-die-genauigkeit-der-daten-aufrechterhaelt\/\",\"url\":\"https:\/\/dataladder.com\/de\/wie-man-fehlende-daten-identifiziert-die-vollstaendigkeit-der-daten-sicherstellt-und-die-genauigkeit-der-daten-aufrechterhaelt\/\",\"name\":\"Wie man fehlende Daten identifiziert, die Vollst\u00e4ndigkeit der Daten sicherstellt und die Genauigkeit der Daten aufrechterh\u00e4lt - Data Ladder\",\"isPartOf\":{\"@id\":\"https:\/\/dataladder.com\/de\/#website\"},\"datePublished\":\"2020-10-02T04:00:00+00:00\",\"dateModified\":\"2022-04-14T11:45:58+00:00\",\"breadcrumb\":{\"@id\":\"https:\/\/dataladder.com\/de\/wie-man-fehlende-daten-identifiziert-die-vollstaendigkeit-der-daten-sicherstellt-und-die-genauigkeit-der-daten-aufrechterhaelt\/#breadcrumb\"},\"inLanguage\":\"de-DE\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/dataladder.com\/de\/wie-man-fehlende-daten-identifiziert-die-vollstaendigkeit-der-daten-sicherstellt-und-die-genauigkeit-der-daten-aufrechterhaelt\/\"]}]},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/dataladder.com\/de\/wie-man-fehlende-daten-identifiziert-die-vollstaendigkeit-der-daten-sicherstellt-und-die-genauigkeit-der-daten-aufrechterhaelt\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Home\",\"item\":\"https:\/\/dataladder.com\/de\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Wie man fehlende Daten identifiziert, die Vollst\u00e4ndigkeit der Daten sicherstellt und die Genauigkeit der Daten aufrechterh\u00e4lt\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/dataladder.com\/de\/#website\",\"url\":\"https:\/\/dataladder.com\/de\/\",\"name\":\"Data Ladder\",\"description\":\"Enterprise Data Profiling, Cleansing, and Matching\",\"publisher\":{\"@id\":\"https:\/\/dataladder.com\/de\/#organization\"},\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/dataladder.com\/de\/?s={search_term_string}\"},\"query-input\":\"required name=search_term_string\"}],\"inLanguage\":\"de-DE\"},{\"@type\":\"Organization\",\"@id\":\"https:\/\/dataladder.com\/de\/#organization\",\"name\":\"Data Ladder\",\"url\":\"https:\/\/dataladder.com\/de\/\",\"logo\":{\"@type\":\"ImageObject\",\"inLanguage\":\"de-DE\",\"@id\":\"https:\/\/dataladder.com\/de\/#\/schema\/logo\/image\/\",\"url\":\"https:\/\/dataladder.com\/wp-content\/uploads\/2018\/06\/DL-Logo-Ball-30.png\",\"contentUrl\":\"https:\/\/dataladder.com\/wp-content\/uploads\/2018\/06\/DL-Logo-Ball-30.png\",\"width\":413,\"height\":408,\"caption\":\"Data Ladder\"},\"image\":{\"@id\":\"https:\/\/dataladder.com\/de\/#\/schema\/logo\/image\/\"},\"sameAs\":[\"https:\/\/www.linkedin.com\/company\/dataladder-llc\/\",\"https:\/\/web.facebook.com\/DataLadderSoftware\"]},{\"@type\":\"Person\",\"@id\":\"https:\/\/dataladder.com\/de\/#\/schema\/person\/6cc3d6b3c83c611546541b5eb2d1e21b\",\"name\":\"lbarrera\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"de-DE\",\"@id\":\"https:\/\/dataladder.com\/de\/#\/schema\/person\/image\/\",\"url\":\"https:\/\/secure.gravatar.com\/avatar\/5198cb4dd374e7d879a15a9cf20299b3?s=96&d=mm&r=g\",\"contentUrl\":\"https:\/\/secure.gravatar.com\/avatar\/5198cb4dd374e7d879a15a9cf20299b3?s=96&d=mm&r=g\",\"caption\":\"lbarrera\"},\"url\":\"https:\/\/dataladder.com\/de\/author\/lbarrera\/\"}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Wie man fehlende Daten identifiziert, die Vollst\u00e4ndigkeit der Daten sicherstellt und die Genauigkeit der Daten aufrechterh\u00e4lt - Data Ladder","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/dataladder.com\/de\/wie-man-fehlende-daten-identifiziert-die-vollstaendigkeit-der-daten-sicherstellt-und-die-genauigkeit-der-daten-aufrechterhaelt\/","og_locale":"de_DE","og_type":"article","og_title":"Wie man fehlende Daten identifiziert, die Vollst\u00e4ndigkeit der Daten sicherstellt und die Genauigkeit der Daten aufrechterh\u00e4lt - Data Ladder","og_description":"Daten aus der realen Welt werden immer unvollst\u00e4ndige oder fehlende Werte enthalten, insbesondere wenn sie aus verschiedenen Quellen stammen. Unvollst\u00e4ndige Daten k\u00f6nnen zu fehlerhaften Berichten und verzerrten Schlussfolgerungen im Forschungsbereich f\u00fchren. F\u00fcr Unternehmen bedeutet dies, dass sie nur unzureichende Einblicke in ihre Kunden erhalten, ungenaue Gesch\u00e4ftsinformationen erhalten und ihre Rentabilit\u00e4t verlieren. Die Vollst\u00e4ndigkeit der Daten [&hellip;]","og_url":"https:\/\/dataladder.com\/de\/wie-man-fehlende-daten-identifiziert-die-vollstaendigkeit-der-daten-sicherstellt-und-die-genauigkeit-der-daten-aufrechterhaelt\/","og_site_name":"Data Ladder","article_publisher":"https:\/\/web.facebook.com\/DataLadderSoftware","article_published_time":"2020-10-02T04:00:00+00:00","article_modified_time":"2022-04-14T11:45:58+00:00","og_image":[{"width":1943,"height":1919,"url":"https:\/\/dataladder.com\/wp-content\/uploads\/2021\/09\/Easy-Identification-of-Missing-Information-Identify-Gaps-in-Data-Entry-Procedures_Excel-Deduplication-Graphic.png","type":"image\/png"}],"author":"lbarrera","twitter_card":"summary_large_image","twitter_misc":{"Verfasst von":"lbarrera","Gesch\u00e4tzte Lesezeit":"11 Minuten"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"Article","@id":"https:\/\/dataladder.com\/de\/wie-man-fehlende-daten-identifiziert-die-vollstaendigkeit-der-daten-sicherstellt-und-die-genauigkeit-der-daten-aufrechterhaelt\/#article","isPartOf":{"@id":"https:\/\/dataladder.com\/de\/wie-man-fehlende-daten-identifiziert-die-vollstaendigkeit-der-daten-sicherstellt-und-die-genauigkeit-der-daten-aufrechterhaelt\/"},"author":{"name":"lbarrera","@id":"https:\/\/dataladder.com\/de\/#\/schema\/person\/6cc3d6b3c83c611546541b5eb2d1e21b"},"headline":"Wie man fehlende Daten identifiziert, die Vollst\u00e4ndigkeit der Daten sicherstellt und die Genauigkeit der Daten aufrechterh\u00e4lt","datePublished":"2020-10-02T04:00:00+00:00","dateModified":"2022-04-14T11:45:58+00:00","mainEntityOfPage":{"@id":"https:\/\/dataladder.com\/de\/wie-man-fehlende-daten-identifiziert-die-vollstaendigkeit-der-daten-sicherstellt-und-die-genauigkeit-der-daten-aufrechterhaelt\/"},"wordCount":2243,"publisher":{"@id":"https:\/\/dataladder.com\/de\/#organization"},"keywords":["Datenprofilerstellung","Datenqualit\u00e4t","fehlende Daten","Vollst\u00e4ndigkeit der Daten"],"articleSection":["Metriken zur Datenqualit\u00e4t"],"inLanguage":"de-DE"},{"@type":"WebPage","@id":"https:\/\/dataladder.com\/de\/wie-man-fehlende-daten-identifiziert-die-vollstaendigkeit-der-daten-sicherstellt-und-die-genauigkeit-der-daten-aufrechterhaelt\/","url":"https:\/\/dataladder.com\/de\/wie-man-fehlende-daten-identifiziert-die-vollstaendigkeit-der-daten-sicherstellt-und-die-genauigkeit-der-daten-aufrechterhaelt\/","name":"Wie man fehlende Daten identifiziert, die Vollst\u00e4ndigkeit der Daten sicherstellt und die Genauigkeit der Daten aufrechterh\u00e4lt - Data Ladder","isPartOf":{"@id":"https:\/\/dataladder.com\/de\/#website"},"datePublished":"2020-10-02T04:00:00+00:00","dateModified":"2022-04-14T11:45:58+00:00","breadcrumb":{"@id":"https:\/\/dataladder.com\/de\/wie-man-fehlende-daten-identifiziert-die-vollstaendigkeit-der-daten-sicherstellt-und-die-genauigkeit-der-daten-aufrechterhaelt\/#breadcrumb"},"inLanguage":"de-DE","potentialAction":[{"@type":"ReadAction","target":["https:\/\/dataladder.com\/de\/wie-man-fehlende-daten-identifiziert-die-vollstaendigkeit-der-daten-sicherstellt-und-die-genauigkeit-der-daten-aufrechterhaelt\/"]}]},{"@type":"BreadcrumbList","@id":"https:\/\/dataladder.com\/de\/wie-man-fehlende-daten-identifiziert-die-vollstaendigkeit-der-daten-sicherstellt-und-die-genauigkeit-der-daten-aufrechterhaelt\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Home","item":"https:\/\/dataladder.com\/de\/"},{"@type":"ListItem","position":2,"name":"Wie man fehlende Daten identifiziert, die Vollst\u00e4ndigkeit der Daten sicherstellt und die Genauigkeit der Daten aufrechterh\u00e4lt"}]},{"@type":"WebSite","@id":"https:\/\/dataladder.com\/de\/#website","url":"https:\/\/dataladder.com\/de\/","name":"Data Ladder","description":"Enterprise Data Profiling, Cleansing, and Matching","publisher":{"@id":"https:\/\/dataladder.com\/de\/#organization"},"potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/dataladder.com\/de\/?s={search_term_string}"},"query-input":"required name=search_term_string"}],"inLanguage":"de-DE"},{"@type":"Organization","@id":"https:\/\/dataladder.com\/de\/#organization","name":"Data Ladder","url":"https:\/\/dataladder.com\/de\/","logo":{"@type":"ImageObject","inLanguage":"de-DE","@id":"https:\/\/dataladder.com\/de\/#\/schema\/logo\/image\/","url":"https:\/\/dataladder.com\/wp-content\/uploads\/2018\/06\/DL-Logo-Ball-30.png","contentUrl":"https:\/\/dataladder.com\/wp-content\/uploads\/2018\/06\/DL-Logo-Ball-30.png","width":413,"height":408,"caption":"Data Ladder"},"image":{"@id":"https:\/\/dataladder.com\/de\/#\/schema\/logo\/image\/"},"sameAs":["https:\/\/www.linkedin.com\/company\/dataladder-llc\/","https:\/\/web.facebook.com\/DataLadderSoftware"]},{"@type":"Person","@id":"https:\/\/dataladder.com\/de\/#\/schema\/person\/6cc3d6b3c83c611546541b5eb2d1e21b","name":"lbarrera","image":{"@type":"ImageObject","inLanguage":"de-DE","@id":"https:\/\/dataladder.com\/de\/#\/schema\/person\/image\/","url":"https:\/\/secure.gravatar.com\/avatar\/5198cb4dd374e7d879a15a9cf20299b3?s=96&d=mm&r=g","contentUrl":"https:\/\/secure.gravatar.com\/avatar\/5198cb4dd374e7d879a15a9cf20299b3?s=96&d=mm&r=g","caption":"lbarrera"},"url":"https:\/\/dataladder.com\/de\/author\/lbarrera\/"}]}},"modified_by":null,"_links":{"self":[{"href":"https:\/\/dataladder.com\/de\/wp-json\/wp\/v2\/posts\/63008"}],"collection":[{"href":"https:\/\/dataladder.com\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/dataladder.com\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/dataladder.com\/de\/wp-json\/wp\/v2\/users\/9"}],"replies":[{"embeddable":true,"href":"https:\/\/dataladder.com\/de\/wp-json\/wp\/v2\/comments?post=63008"}],"version-history":[{"count":2,"href":"https:\/\/dataladder.com\/de\/wp-json\/wp\/v2\/posts\/63008\/revisions"}],"predecessor-version":[{"id":66886,"href":"https:\/\/dataladder.com\/de\/wp-json\/wp\/v2\/posts\/63008\/revisions\/66886"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/dataladder.com\/de\/wp-json\/wp\/v2\/media\/58353"}],"wp:attachment":[{"href":"https:\/\/dataladder.com\/de\/wp-json\/wp\/v2\/media?parent=63008"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/dataladder.com\/de\/wp-json\/wp\/v2\/categories?post=63008"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/dataladder.com\/de\/wp-json\/wp\/v2\/tags?post=63008"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}