{"id":63218,"date":"2018-10-23T00:00:00","date_gmt":"2018-10-23T04:00:00","guid":{"rendered":"https:\/\/dataladder.com\/wie-datenqualitaet-eine-wichtige-herausforderung-bei-der-data-lake-ingestion-ist-und-was-sie-tun-koennen-damit-ihr-data-lake-projekt-ein-erfolg-wird\/"},"modified":"2022-05-09T06:58:17","modified_gmt":"2022-05-09T06:58:17","slug":"wie-datenqualitaet-eine-wichtige-herausforderung-bei-der-data-lake-ingestion-ist-und-was-sie-tun-koennen-damit-ihr-data-lake-projekt-ein-erfolg-wird","status":"publish","type":"post","link":"https:\/\/dataladder.com\/de\/wie-datenqualitaet-eine-wichtige-herausforderung-bei-der-data-lake-ingestion-ist-und-was-sie-tun-koennen-damit-ihr-data-lake-projekt-ein-erfolg-wird\/","title":{"rendered":"Wie Datenqualit\u00e4t eine wichtige Herausforderung bei der Data Lake-Ingestion ist und was Sie tun k\u00f6nnen, damit Ihr Data Lake-Projekt ein Erfolg wird"},"content":{"rendered":"<p><a href=\"https:\/\/aws.amazon.com\/big-data\/datalakes-and-analytics\/what-is-a-data-lake\/\">Data Lakes<\/a> wurden als L\u00f6sung f\u00fcr die Speicherung unstrukturierter Daten entwickelt &#8211; eine Alternative zur restriktiven Natur von Data Warehouses. Diese Erleichterung bringt jedoch eine Reihe einzigartiger Herausforderungen mit sich, die von den Unternehmen nur schwer zu bew\u00e4ltigen sind.<\/p>\n<p>Tats\u00e4chlich sind einige Herausforderungen des Data Lake so schwer zu bew\u00e4ltigen, dass Unternehmen die Idee, einen Data Lake zu unterhalten, aufgeben.<\/p>\n<blockquote><p>F\u00fchrende Analystenfirmen geben schon seit einiger Zeit <em>Ausfallraten<\/em> von 85 % f\u00fcr <em>Data Lakes<\/em> an. <a href=\"https:\/\/www.teradata.com\/Blogs\/The-Data-Lake-is-Dead-Long-Live-the-Data-Lake\">(Teradata)<\/a><\/p><\/blockquote>\n<p>Worin bestehen diese besonderen Herausforderungen und gibt es eine M\u00f6glichkeit f\u00fcr Unternehmen, ihren Data Lake zu pflegen und den Zweck zu erf\u00fcllen, f\u00fcr den er konzipiert wurde?<\/p>\n<p>Lassen Sie uns mehr entdecken.<\/p>\n<h2><strong>Warum Data Lakes und nicht Data Warehouses? <\/strong><\/h2>\n<p>Eine Organisation auf Unternehmensebene ist mit mindestens 464 Anwendungen verbunden. Die Menge an Informationen, die von all diesen Anwendungen hereinstr\u00f6mt, muss irgendwo gespeichert werden. Wir sprechen \u00fcber alle Arten von strukturierten und halbstrukturierten Daten, die \u00fcber verschiedene Datenquellen gesammelt werden: mobile Anwendungen, Webanwendungen, Aktivit\u00e4tsprotokolle, Telefonprotokolle, soziale Medien und Hunderte anderer Quellen.<\/p>\n<p>Alle diese Daten zusammen bilden die Business Intelligence, die Unternehmen ben\u00f6tigen, um strategische Gesch\u00e4ftsentscheidungen zu treffen.<\/p>\n<p>Data Warehouses, die traditionellen Methoden zur Speicherung von Unternehmensdaten, erfordern eine Strukturierung der Daten. Sie k\u00f6nnen die Daten nicht in ein Data Warehouse einspeisen, ohne sie zu sortieren oder an der definierten Struktur auszurichten.<\/p>\n<p>Mit Data Lakes wurde diese Einschr\u00e4nkung \u00fcberwunden. Mit der Implementierung von Datenpipelines konnten alle Datenquellen in den See transportiert und dort aufbewahrt werden, bis das Unternehmen Daten f\u00fcr Analysen, Berichte und BI ben\u00f6tigte.<\/p>\n<p>Data Lakes l\u00f6sten zwar das Problem der Datenhaltung, stellten aber auch eine gro\u00dfe Herausforderung dar &#8211; die <strong>der Datenqualit\u00e4t. <\/strong><\/p>\n<p>Da die Daten einfach in das System eingespeist werden, scheint es f\u00fcr die Analysten keine M\u00f6glichkeit zu geben, die Datenqualit\u00e4t zu bestimmen. Eine Erstuntersuchung wurde nicht durchgef\u00fchrt. Dar\u00fcber hinaus ist die gr\u00f6\u00dfte Herausforderung angesichts der j\u00fcngsten Vorschriften der Datenschutz und die Einhaltung der Datenschutzbestimmungen. Ohne jemanden, der f\u00fcr die Qualit\u00e4t der Daten verantwortlich ist, sind Unternehmen beim Umgang mit Rohdaten aufgeschmissen.<\/p>\n<p>Erm\u00f6glicht die Aufnahme von Daten.<\/p>\n<h2><strong>Wie hilft Data Ingestion bei der Bew\u00e4ltigung von Data Lake-Herausforderungen? <\/strong><\/h2>\n<p>Die Dateneingabe ist die Schicht zwischen den Datenquellen und dem Data Lake selbst. Diese Schicht wurde eingef\u00fchrt, um auf Rohdaten aus Datenquellen zuzugreifen, sie zu optimieren und sie dann in den <a href=\"https:\/\/www.swooptalent.com\/talent-insights-blog\/talent-data-what-you-need-to-know\">Data Lake<\/a> einzuspeisen.<\/p>\n<p>Dennoch ist es \u00fcberraschend zu sehen, dass die Dateneingabe erst im Nachhinein oder nach dem Einf\u00fcgen der Daten in den See erfolgt. Tats\u00e4chlich verpassen die meisten Unternehmen den Prozess der Datenaufnahme v\u00f6llig, da sie die Komplexit\u00e4t der \u00dcbertragung von Daten aus Datenquellen in den Data Lake untersch\u00e4tzen. Erst in einem kritischen Moment, in dem sie Daten ben\u00f6tigen, wird ihnen bewusst, dass sie vor einer gro\u00dfen Herausforderung stehen.<\/p>\n<p>Wenn man es genau betrachtet, besteht der Zweck eines Data Lake darin, Daten zu speichern, die sp\u00e4ter verwendet werden k\u00f6nnen, ohne sich um ihre Struktur zu k\u00fcmmern &#8211; aber das bedeutet nicht, dass sie buchst\u00e4blich in das System eingespeist werden, ohne sie zu bereinigen oder sicherzustellen, dass sie einen Mehrwert bieten.<\/p>\n<p>Wenn die Daten nicht verwaltet werden, wird der Datensee zu einem Datensumpf, in dem un\u00fcbersichtliche Daten in einem Repository liegen, die weder verwendet noch analysiert werden k\u00f6nnen. Dies widerspricht dem Zweck eines Data Lakes und ist somit die Hauptursache f\u00fcr das Scheitern der meisten Data-Lake-Projekte.<\/p>\n<p>Lassen Sie uns das wiederholen:<\/p>\n<blockquote><p><strong>Die \u00dcbernahme ist ein geplanter Prozess, der separat durchgef\u00fchrt werden muss, bevor die Daten in das System eingegeben werden. Dieser geplante Prozess muss das Ziel verfolgen, im Laufe der Zeit \u00fcber vollst\u00e4ndige, genaue und konsistente Daten zu verf\u00fcgen. <\/strong><\/p><\/blockquote>\n<p>Beachten Sie, dass die Datenaufnahme nicht gleichbedeutend ist mit der Perfektionierung der Rohdaten. Es erm\u00f6glicht einfach die Pflege einer grundlegenden Organisation, bei der Duplikate entfernt und unvollst\u00e4ndige oder ung\u00fcltige Informationen hervorgehoben werden, so dass jeder Datensatz sofort f\u00fcr eine Analyse zur Verf\u00fcgung steht.<\/p>\n<h3><strong>Funktionen zur Daten\u00fcbernahme <\/strong><\/h3>\n<p>Obwohl die meisten Data Lakes heute \u00fcber eine Dateneingabe verf\u00fcgen, werden wichtige Funktionen oft \u00fcbersehen. Hier sind drei wichtige Funktionen der Datenaufnahme, die implementiert werden m\u00fcssen, damit ein Data Lake \u00fcber brauchbare, wertvolle Daten verf\u00fcgt.<\/p>\n<ol>\n<li><strong>Der Prozess der Datenerfassung:<\/strong> Der Hauptzweck der Datenaufnahme besteht darin, Daten aus verschiedenen Quellen in verschiedenen Formaten &#8211; strukturiert, unstrukturiert, halbstrukturiert oder multistrukturiert &#8211; zu sammeln, sie in Form von Datenstr\u00f6men oder Stapeln verf\u00fcgbar zu machen und sie in den Data Lake zu \u00fcbertragen.<\/li>\n<li><strong>Der Filtrationsprozess: <\/strong>In dieser fr\u00fchen Phase des Datenlebenszyklus durchlaufen die Daten einen grundlegenden Filter- und Bereinigungsprozess, bei dem Parsing- und Deduplizierungsaktivit\u00e4ten durchgef\u00fchrt werden. Auch andere komplexe Vorg\u00e4nge wie das Erkennen und Entfernen ung\u00fcltiger oder ung\u00fcltiger Datenwerte k\u00f6nnen mit Skripten durchgef\u00fchrt werden.<\/li>\n<li><strong>Der Transportprozess: <\/strong>Der Transport der Daten in ihre jeweiligen Speicher innerhalb des Data Lake ist ein Prozess, der von der Klarheit der Routing-Regeln und den eingerichteten Automatisierungsverfahren abh\u00e4ngt.<\/li>\n<\/ol>\n<h3><strong>Batch vs. Streaming Ingestion <\/strong><\/h3>\n<p>Es gibt zwei Arten von Ingestionsmodellen, und beide h\u00e4ngen von den Anforderungen oder Erwartungen ab, die Unternehmen an ihre Daten stellen.<\/p>\n<p><strong>Stapelverarbeitung: <\/strong>Dies ist die h\u00e4ufigste Art der Datenaufnahme, bei der Gruppen von Quelldaten regelm\u00e4\u00dfig gesammelt und an das Zielsystem gesendet werden. Es k\u00f6nnte ein einfacher Zeitplan erstellt werden, in dem die Quelldaten nach einer logischen Reihenfolge oder bestimmten Bedingungen gruppiert werden. Die Stapelverarbeitung ist in der Regel durch Automatisierung einfacher zu handhaben und zudem ein kosteng\u00fcnstiges Modell.<\/p>\n<p><strong>Streaming: <\/strong>Hierbei handelt es sich um eine Echtzeitverarbeitung, die keine Gruppierung vorsieht. Die Daten werden geladen, sobald sie erscheinen und von der Ingestion-Schicht erkannt werden. Dies ist zwar ein teures und komplexeres Modell, aber f\u00fcr Unternehmen, die sofortige, kontinuierliche und aktualisierte Daten ben\u00f6tigen, funktioniert es gut.<\/p>\n<h2><strong>Data Lake Ingestion-Herausforderungen <\/strong><\/h2>\n<p>W\u00e4hrend die Datenaufnahme versucht, die Herausforderungen des Data Lake zu l\u00f6sen, ist sie nicht ohne eine Reihe von Herausforderungen. Bestimmte Schwierigkeiten k\u00f6nnen sich auf die Ingestion-Ebene auswirken, was wiederum die Leistung des Data Lake beeintr\u00e4chtigt.<\/p>\n<p>Werfen wir einen Blick auf einige der wichtigsten Herausforderungen.<\/p>\n<h3><strong>Schnelle Bew\u00e4ltigung der eingehenden Datenmenge <\/strong><\/h3>\n<p>Die Datenmengen sind explodiert, und mit der zunehmenden Vernetzung und Integration des globalen \u00d6kosystems werden die Datenmengen exponentiell ansteigen. Au\u00dferdem entwickeln sich die Datenquellen selbst st\u00e4ndig weiter, was bedeutet, dass Data Lakes und Dateneingabeebenen robust genug sein m\u00fcssen, um diese Datenmenge und -vielfalt aufzunehmen. Diese Herausforderung ist noch schwieriger zu bew\u00e4ltigen, wenn Unternehmen einen Echtzeit-Dateningestionsprozess implementieren, der eine schnelle Aktualisierung und Ingestion der Daten erfordert.<\/p>\n<p>Da es sich bei der Datenerfassung und den Data Lakes um relativ neue Technologien handelt, m\u00fcssen sie erst noch eine rasante Geschwindigkeit erreichen. Je nach Anwendung kann die Verarbeitung von Echtzeitdaten bis zu 10 Minuten f\u00fcr jede Aktualisierung dauern.<\/p>\n<h3><strong>Erf\u00fcllung der neuen Richtlinien zur Dateneinhaltung <\/strong><\/h3>\n<p>Die Einhaltung gesetzlicher Datenvorschriften in L\u00e4ndern rund um den Globus hat es f\u00fcr Unternehmen schwierig gemacht, ihre Daten entsprechend den gesetzlichen Vorschriften zu sortieren. Unternehmen m\u00fcssen die europ\u00e4ische Datenschutz-Grundverordnung (GDPR) sowie Dutzende anderer Compliance-Vorschriften in den USA einhalten. Daher m\u00fcssen die Daten auf der Ingestionsebene nach diesen Vorschriften sortiert werden, um sp\u00e4tere Probleme zu vermeiden. Dies erfordert eine ganzheitliche Planung der Dateneingabe.<\/p>\n<h3><strong>Bereinigung von Daten f\u00fcr die Datenaufbereitung <\/strong><\/h3>\n<p>Dies ist eine h\u00e4ufig \u00fcbersehene Herausforderung von Data Lakes. Irgendwie geht man davon aus, dass der Bereinigungsprozess nur dann stattfinden sollte, wenn die Daten f\u00fcr die Analyse ben\u00f6tigt werden. Dieser Ansatz f\u00fchrt nicht nur zu erheblichen Engp\u00e4ssen, sondern setzt das Unternehmen auch den beiden anderen oben genannten Herausforderungen des Datenschutzes und der Datensicherheit aus.<\/p>\n<p>Das Bereinigen von Daten f\u00fcr die <a href=\"https:\/\/dataladder.com\/de\/ein-kurzleitfaden-fuer-datenaufbereitungssoftware-loesungen-und-bewaehrte-verfahren\/\">Datenaufbereitung<\/a> muss idealerweise beginnen, bevor die Daten in den See eingespeist werden. Die Durchf\u00fchrung der grundlegenden Bereinigung erspart es dem Datenteam, seine Zeit mit dem Versuch zu verschwenden, aus den Rohdaten einen Sinn zu machen. In diesem Stadium sollten die Rohdaten auf Duplikate, unvollst\u00e4ndige und ung\u00fcltige Felder usw. gefiltert werden. Danach k\u00f6nnen die Analysten weitere Anpassungen oder Optimierungen f\u00fcr den beabsichtigten Zweck vornehmen.<\/p>\n<h3><strong>Datenqualit\u00e4t im Data Lake Ingestion <\/strong><\/h3>\n<p>Ob in der Phase der Datenaufnahme oder der Datentransformation, eine <a href=\"https:\/\/dataladder.com\/de\/testversion-der-datenqualitaetssoftware\/\">Datenqualit\u00e4tsl\u00f6sung<\/a> ist erforderlich, um Daten zu verarbeiten, bevor sie f\u00fcr Analysen verwendet werden. Wenn wir \u00fcber Datenqualit\u00e4t sprechen, geht es in erster Linie um Folgendes:<\/p>\n<ul>\n<li>Bereinigung der Rohdaten von Tippfehlern, strukturellen Problemen wie Rechtschreibung, Gro\u00df- und Kleinschreibung usw.<\/li>\n<li>Ung\u00fcltige, unvollst\u00e4ndige, nichtige oder ung\u00fcltige Felder<\/li>\n<li>Und vor allem: doppelte Daten, die zu einem gro\u00dfen Engpass werden<\/li>\n<\/ul>\n<p>F\u00fcr die <a href=\"https:\/\/dataladder.com\/de\/datenbereinigungssoftware-schnelles-und-kostenguenstiges-crm-datenbereinigungstool\/\">Datenbereinigung<\/a> ben\u00f6tigen Sie ein Datenqualit\u00e4tstool, mit dem Sie Rohdaten direkt aus Ihrer Datenquelle verarbeiten k\u00f6nnen.<\/p>\n<p><a href=\"https:\/\/dataladder.com\/de\/produkte\/datamatch-enterprise-bewertetes-datenqualitaetsmanagementprodukt-nr-1\/\">DataMatch Enterprise<\/a> von Data Ladder ist ein leistungsf\u00e4higes Tool, das zum Bereinigen, <a href=\"https:\/\/dataladder.com\/de\/datenabgleichssoftware-als-best-in-class-mit-96-match-genauigkeit-bewertet\/\">Abgleichen<\/a> und <a href=\"https:\/\/dataladder.com\/de\/datendeduplizierungssoftware-verwenden-sie-integrierte-und-benutzerdefinierte-regeln-fuer-die-crm-deduplizierung\/\">Deduplizieren von<\/a> Rohdaten verwendet werden kann. Es erm\u00f6glicht die Integration von mehr als 150 Anwendungen und Datenbanken, was bedeutet, dass Sie es als Tool zur Erfassung Ihrer Daten verwenden k\u00f6nnen, bevor diese in den Data Lake \u00fcbertragen werden.<\/p>\n<p>Es kann auch in der Phase der Datentransformation eingesetzt werden, wenn Sie tiefer in die Problematik Ihrer Daten eindringen wollen, z. B. bei der <a href=\"https:\/\/dataladder.com\/de\/software-und-tools-zur-datenprofilerstellung-erhalten-sie-sofortige-ergebnisse-der-datenqualitaetsbewertung\/\">Erstellung von Datenprofilen<\/a>, der <a href=\"https:\/\/dataladder.com\/de\/adressverifizierungssoftware-integrierter-adressabgleich-bereinigung-und-geokodierung\/\">\u00dcberpr\u00fcfung und Validierung von Adressen<\/a> usw.<\/p>\n<p>Das Tool wird als Vor-Ort-L\u00f6sung bereitgestellt, die Sie auf Ihrem Desktop- oder Cloud-Server verwenden k\u00f6nnen. Pluspunkt? Dieses Tool f\u00fchrt sowohl Stapelverarbeitung als auch Echtzeitverarbeitung durch und erm\u00f6glicht es Ihnen au\u00dferdem, zuk\u00fcnftige Prozesse zu planen.<\/p>\n<h2><strong>Die Quintessenz<\/strong><\/h2>\n<p>Es ist wichtig, eine geeignete Ingestion-Infrastruktur zu implementieren, die es dem Data Lake erm\u00f6glicht, vollst\u00e4ndige, zeitlich gut abgestimmte und verbrauchsfertige Daten zu speichern. Im Gegensatz zu einem Data Warehouse zeichnen sich Data Lakes dadurch aus, dass sie die Verf\u00fcgbarkeit gro\u00dfer Mengen koh\u00e4renter Daten nutzen, um die Entscheidungsanalyse in Echtzeit zu verbessern. Sie ist nicht nur in fortgeschrittenen pr\u00e4diktiven analytischen Anwendungen n\u00fctzlich, sondern kann auch in der zuverl\u00e4ssigen organisatorischen Berichterstattung produktiv sein, insbesondere wenn sie verschiedene Datendesigns enth\u00e4lt.<\/p>\n<p>Damit Data Lakes jedoch funktionieren, muss die Datenaufnahme als separate Aktivit\u00e4t geplant werden und die Datenqualit\u00e4t muss das Hauptziel sein. Wenn die Datenqualit\u00e4t ignoriert wird, f\u00fchrt dies zu einer Reihe von Problemen, die sich auf die gesamte Pipeline auswirken &#8211; von der Datenerfassung bis zum Endprodukt.<\/p>\n<p>M\u00f6chten Sie mehr dar\u00fcber erfahren, wie wir Sie bei der Dateneingabe unterst\u00fctzen k\u00f6nnen? Setzen Sie sich mit uns in Verbindung und lassen Sie sich von unserem L\u00f6sungsarchitekten durch die Reise f\u00fchren.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Data Lakes wurden als L\u00f6sung f\u00fcr die Speicherung unstrukturierter Daten entwickelt &#8211; eine Alternative zur restriktiven Natur von Data Warehouses. Diese Erleichterung bringt jedoch eine Reihe einzigartiger Herausforderungen mit sich, die von den Unternehmen nur schwer zu bew\u00e4ltigen sind. Tats\u00e4chlich sind einige Herausforderungen des Data Lake so schwer zu bew\u00e4ltigen, dass Unternehmen die Idee, einen [&hellip;]<\/p>\n","protected":false},"author":9,"featured_media":58157,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"_lmt_disableupdate":"","_lmt_disable":"","_links_to":"","_links_to_target":""},"categories":[1212,1326,443,1245],"tags":[1016,1006,1012,973,1015,1017],"acf":[],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v19.9 - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>Wie Datenqualit\u00e4t eine wichtige Herausforderung bei der Data Lake-Ingestion ist und was Sie tun k\u00f6nnen, damit Ihr Data Lake-Projekt ein Erfolg wird - Data Ladder<\/title>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/dataladder.com\/de\/wie-datenqualitaet-eine-wichtige-herausforderung-bei-der-data-lake-ingestion-ist-und-was-sie-tun-koennen-damit-ihr-data-lake-projekt-ein-erfolg-wird\/\" \/>\n<meta property=\"og:locale\" content=\"de_DE\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Wie Datenqualit\u00e4t eine wichtige Herausforderung bei der Data Lake-Ingestion ist und was Sie tun k\u00f6nnen, damit Ihr Data Lake-Projekt ein Erfolg wird - Data Ladder\" \/>\n<meta property=\"og:description\" content=\"Data Lakes wurden als L\u00f6sung f\u00fcr die Speicherung unstrukturierter Daten entwickelt &#8211; eine Alternative zur restriktiven Natur von Data Warehouses. Diese Erleichterung bringt jedoch eine Reihe einzigartiger Herausforderungen mit sich, die von den Unternehmen nur schwer zu bew\u00e4ltigen sind. Tats\u00e4chlich sind einige Herausforderungen des Data Lake so schwer zu bew\u00e4ltigen, dass Unternehmen die Idee, einen [&hellip;]\" \/>\n<meta property=\"og:url\" content=\"https:\/\/dataladder.com\/de\/wie-datenqualitaet-eine-wichtige-herausforderung-bei-der-data-lake-ingestion-ist-und-was-sie-tun-koennen-damit-ihr-data-lake-projekt-ein-erfolg-wird\/\" \/>\n<meta property=\"og:site_name\" content=\"Data Ladder\" \/>\n<meta property=\"article:publisher\" content=\"https:\/\/web.facebook.com\/DataLadderSoftware\" \/>\n<meta property=\"article:published_time\" content=\"2018-10-23T04:00:00+00:00\" \/>\n<meta property=\"article:modified_time\" content=\"2022-05-09T06:58:17+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/dataladder.com\/wp-content\/uploads\/2021\/09\/5066752-screen-shot-2017-04-24-at-111511-am-3783ixy9uk06tqzjcrmi2o.png\" \/>\n\t<meta property=\"og:image:width\" content=\"860\" \/>\n\t<meta property=\"og:image:height\" content=\"320\" \/>\n\t<meta property=\"og:image:type\" content=\"image\/png\" \/>\n<meta name=\"author\" content=\"lbarrera\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"Verfasst von\" \/>\n\t<meta name=\"twitter:data1\" content=\"lbarrera\" \/>\n\t<meta name=\"twitter:label2\" content=\"Gesch\u00e4tzte Lesezeit\" \/>\n\t<meta name=\"twitter:data2\" content=\"8 Minuten\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"Article\",\"@id\":\"https:\/\/dataladder.com\/de\/wie-datenqualitaet-eine-wichtige-herausforderung-bei-der-data-lake-ingestion-ist-und-was-sie-tun-koennen-damit-ihr-data-lake-projekt-ein-erfolg-wird\/#article\",\"isPartOf\":{\"@id\":\"https:\/\/dataladder.com\/de\/wie-datenqualitaet-eine-wichtige-herausforderung-bei-der-data-lake-ingestion-ist-und-was-sie-tun-koennen-damit-ihr-data-lake-projekt-ein-erfolg-wird\/\"},\"author\":{\"name\":\"lbarrera\",\"@id\":\"https:\/\/dataladder.com\/de\/#\/schema\/person\/6cc3d6b3c83c611546541b5eb2d1e21b\"},\"headline\":\"Wie Datenqualit\u00e4t eine wichtige Herausforderung bei der Data Lake-Ingestion ist und was Sie tun k\u00f6nnen, damit Ihr Data Lake-Projekt ein Erfolg wird\",\"datePublished\":\"2018-10-23T04:00:00+00:00\",\"dateModified\":\"2022-05-09T06:58:17+00:00\",\"mainEntityOfPage\":{\"@id\":\"https:\/\/dataladder.com\/de\/wie-datenqualitaet-eine-wichtige-herausforderung-bei-der-data-lake-ingestion-ist-und-was-sie-tun-koennen-damit-ihr-data-lake-projekt-ein-erfolg-wird\/\"},\"wordCount\":1792,\"publisher\":{\"@id\":\"https:\/\/dataladder.com\/de\/#organization\"},\"keywords\":[\"Data Lake Ingestion\",\"Daten\",\"Datenerfassung\",\"Datenlager\",\"Datensee\",\"Datenseen\"],\"articleSection\":[\"Data quality management\",\"Dateneingabe und -integration\",\"Unkategorisiert\",\"Verwaltung der Datenqualit\u00e4t\"],\"inLanguage\":\"de-DE\"},{\"@type\":\"WebPage\",\"@id\":\"https:\/\/dataladder.com\/de\/wie-datenqualitaet-eine-wichtige-herausforderung-bei-der-data-lake-ingestion-ist-und-was-sie-tun-koennen-damit-ihr-data-lake-projekt-ein-erfolg-wird\/\",\"url\":\"https:\/\/dataladder.com\/de\/wie-datenqualitaet-eine-wichtige-herausforderung-bei-der-data-lake-ingestion-ist-und-was-sie-tun-koennen-damit-ihr-data-lake-projekt-ein-erfolg-wird\/\",\"name\":\"Wie Datenqualit\u00e4t eine wichtige Herausforderung bei der Data Lake-Ingestion ist und was Sie tun k\u00f6nnen, damit Ihr Data Lake-Projekt ein Erfolg wird - Data Ladder\",\"isPartOf\":{\"@id\":\"https:\/\/dataladder.com\/de\/#website\"},\"datePublished\":\"2018-10-23T04:00:00+00:00\",\"dateModified\":\"2022-05-09T06:58:17+00:00\",\"breadcrumb\":{\"@id\":\"https:\/\/dataladder.com\/de\/wie-datenqualitaet-eine-wichtige-herausforderung-bei-der-data-lake-ingestion-ist-und-was-sie-tun-koennen-damit-ihr-data-lake-projekt-ein-erfolg-wird\/#breadcrumb\"},\"inLanguage\":\"de-DE\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/dataladder.com\/de\/wie-datenqualitaet-eine-wichtige-herausforderung-bei-der-data-lake-ingestion-ist-und-was-sie-tun-koennen-damit-ihr-data-lake-projekt-ein-erfolg-wird\/\"]}]},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/dataladder.com\/de\/wie-datenqualitaet-eine-wichtige-herausforderung-bei-der-data-lake-ingestion-ist-und-was-sie-tun-koennen-damit-ihr-data-lake-projekt-ein-erfolg-wird\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Home\",\"item\":\"https:\/\/dataladder.com\/de\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Wie Datenqualit\u00e4t eine wichtige Herausforderung bei der Data Lake-Ingestion ist und was Sie tun k\u00f6nnen, damit Ihr Data Lake-Projekt ein Erfolg wird\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/dataladder.com\/de\/#website\",\"url\":\"https:\/\/dataladder.com\/de\/\",\"name\":\"Data Ladder\",\"description\":\"Enterprise Data Profiling, Cleansing, and Matching\",\"publisher\":{\"@id\":\"https:\/\/dataladder.com\/de\/#organization\"},\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/dataladder.com\/de\/?s={search_term_string}\"},\"query-input\":\"required name=search_term_string\"}],\"inLanguage\":\"de-DE\"},{\"@type\":\"Organization\",\"@id\":\"https:\/\/dataladder.com\/de\/#organization\",\"name\":\"Data Ladder\",\"url\":\"https:\/\/dataladder.com\/de\/\",\"logo\":{\"@type\":\"ImageObject\",\"inLanguage\":\"de-DE\",\"@id\":\"https:\/\/dataladder.com\/de\/#\/schema\/logo\/image\/\",\"url\":\"https:\/\/dataladder.com\/wp-content\/uploads\/2018\/06\/DL-Logo-Ball-30.png\",\"contentUrl\":\"https:\/\/dataladder.com\/wp-content\/uploads\/2018\/06\/DL-Logo-Ball-30.png\",\"width\":413,\"height\":408,\"caption\":\"Data Ladder\"},\"image\":{\"@id\":\"https:\/\/dataladder.com\/de\/#\/schema\/logo\/image\/\"},\"sameAs\":[\"https:\/\/www.linkedin.com\/company\/dataladder-llc\/\",\"https:\/\/web.facebook.com\/DataLadderSoftware\"]},{\"@type\":\"Person\",\"@id\":\"https:\/\/dataladder.com\/de\/#\/schema\/person\/6cc3d6b3c83c611546541b5eb2d1e21b\",\"name\":\"lbarrera\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"de-DE\",\"@id\":\"https:\/\/dataladder.com\/de\/#\/schema\/person\/image\/\",\"url\":\"https:\/\/secure.gravatar.com\/avatar\/5198cb4dd374e7d879a15a9cf20299b3?s=96&d=mm&r=g\",\"contentUrl\":\"https:\/\/secure.gravatar.com\/avatar\/5198cb4dd374e7d879a15a9cf20299b3?s=96&d=mm&r=g\",\"caption\":\"lbarrera\"},\"url\":\"https:\/\/dataladder.com\/de\/author\/lbarrera\/\"}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Wie Datenqualit\u00e4t eine wichtige Herausforderung bei der Data Lake-Ingestion ist und was Sie tun k\u00f6nnen, damit Ihr Data Lake-Projekt ein Erfolg wird - Data Ladder","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/dataladder.com\/de\/wie-datenqualitaet-eine-wichtige-herausforderung-bei-der-data-lake-ingestion-ist-und-was-sie-tun-koennen-damit-ihr-data-lake-projekt-ein-erfolg-wird\/","og_locale":"de_DE","og_type":"article","og_title":"Wie Datenqualit\u00e4t eine wichtige Herausforderung bei der Data Lake-Ingestion ist und was Sie tun k\u00f6nnen, damit Ihr Data Lake-Projekt ein Erfolg wird - Data Ladder","og_description":"Data Lakes wurden als L\u00f6sung f\u00fcr die Speicherung unstrukturierter Daten entwickelt &#8211; eine Alternative zur restriktiven Natur von Data Warehouses. Diese Erleichterung bringt jedoch eine Reihe einzigartiger Herausforderungen mit sich, die von den Unternehmen nur schwer zu bew\u00e4ltigen sind. Tats\u00e4chlich sind einige Herausforderungen des Data Lake so schwer zu bew\u00e4ltigen, dass Unternehmen die Idee, einen [&hellip;]","og_url":"https:\/\/dataladder.com\/de\/wie-datenqualitaet-eine-wichtige-herausforderung-bei-der-data-lake-ingestion-ist-und-was-sie-tun-koennen-damit-ihr-data-lake-projekt-ein-erfolg-wird\/","og_site_name":"Data Ladder","article_publisher":"https:\/\/web.facebook.com\/DataLadderSoftware","article_published_time":"2018-10-23T04:00:00+00:00","article_modified_time":"2022-05-09T06:58:17+00:00","og_image":[{"width":860,"height":320,"url":"https:\/\/dataladder.com\/wp-content\/uploads\/2021\/09\/5066752-screen-shot-2017-04-24-at-111511-am-3783ixy9uk06tqzjcrmi2o.png","type":"image\/png"}],"author":"lbarrera","twitter_card":"summary_large_image","twitter_misc":{"Verfasst von":"lbarrera","Gesch\u00e4tzte Lesezeit":"8 Minuten"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"Article","@id":"https:\/\/dataladder.com\/de\/wie-datenqualitaet-eine-wichtige-herausforderung-bei-der-data-lake-ingestion-ist-und-was-sie-tun-koennen-damit-ihr-data-lake-projekt-ein-erfolg-wird\/#article","isPartOf":{"@id":"https:\/\/dataladder.com\/de\/wie-datenqualitaet-eine-wichtige-herausforderung-bei-der-data-lake-ingestion-ist-und-was-sie-tun-koennen-damit-ihr-data-lake-projekt-ein-erfolg-wird\/"},"author":{"name":"lbarrera","@id":"https:\/\/dataladder.com\/de\/#\/schema\/person\/6cc3d6b3c83c611546541b5eb2d1e21b"},"headline":"Wie Datenqualit\u00e4t eine wichtige Herausforderung bei der Data Lake-Ingestion ist und was Sie tun k\u00f6nnen, damit Ihr Data Lake-Projekt ein Erfolg wird","datePublished":"2018-10-23T04:00:00+00:00","dateModified":"2022-05-09T06:58:17+00:00","mainEntityOfPage":{"@id":"https:\/\/dataladder.com\/de\/wie-datenqualitaet-eine-wichtige-herausforderung-bei-der-data-lake-ingestion-ist-und-was-sie-tun-koennen-damit-ihr-data-lake-projekt-ein-erfolg-wird\/"},"wordCount":1792,"publisher":{"@id":"https:\/\/dataladder.com\/de\/#organization"},"keywords":["Data Lake Ingestion","Daten","Datenerfassung","Datenlager","Datensee","Datenseen"],"articleSection":["Data quality management","Dateneingabe und -integration","Unkategorisiert","Verwaltung der Datenqualit\u00e4t"],"inLanguage":"de-DE"},{"@type":"WebPage","@id":"https:\/\/dataladder.com\/de\/wie-datenqualitaet-eine-wichtige-herausforderung-bei-der-data-lake-ingestion-ist-und-was-sie-tun-koennen-damit-ihr-data-lake-projekt-ein-erfolg-wird\/","url":"https:\/\/dataladder.com\/de\/wie-datenqualitaet-eine-wichtige-herausforderung-bei-der-data-lake-ingestion-ist-und-was-sie-tun-koennen-damit-ihr-data-lake-projekt-ein-erfolg-wird\/","name":"Wie Datenqualit\u00e4t eine wichtige Herausforderung bei der Data Lake-Ingestion ist und was Sie tun k\u00f6nnen, damit Ihr Data Lake-Projekt ein Erfolg wird - Data Ladder","isPartOf":{"@id":"https:\/\/dataladder.com\/de\/#website"},"datePublished":"2018-10-23T04:00:00+00:00","dateModified":"2022-05-09T06:58:17+00:00","breadcrumb":{"@id":"https:\/\/dataladder.com\/de\/wie-datenqualitaet-eine-wichtige-herausforderung-bei-der-data-lake-ingestion-ist-und-was-sie-tun-koennen-damit-ihr-data-lake-projekt-ein-erfolg-wird\/#breadcrumb"},"inLanguage":"de-DE","potentialAction":[{"@type":"ReadAction","target":["https:\/\/dataladder.com\/de\/wie-datenqualitaet-eine-wichtige-herausforderung-bei-der-data-lake-ingestion-ist-und-was-sie-tun-koennen-damit-ihr-data-lake-projekt-ein-erfolg-wird\/"]}]},{"@type":"BreadcrumbList","@id":"https:\/\/dataladder.com\/de\/wie-datenqualitaet-eine-wichtige-herausforderung-bei-der-data-lake-ingestion-ist-und-was-sie-tun-koennen-damit-ihr-data-lake-projekt-ein-erfolg-wird\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Home","item":"https:\/\/dataladder.com\/de\/"},{"@type":"ListItem","position":2,"name":"Wie Datenqualit\u00e4t eine wichtige Herausforderung bei der Data Lake-Ingestion ist und was Sie tun k\u00f6nnen, damit Ihr Data Lake-Projekt ein Erfolg wird"}]},{"@type":"WebSite","@id":"https:\/\/dataladder.com\/de\/#website","url":"https:\/\/dataladder.com\/de\/","name":"Data Ladder","description":"Enterprise Data Profiling, Cleansing, and Matching","publisher":{"@id":"https:\/\/dataladder.com\/de\/#organization"},"potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/dataladder.com\/de\/?s={search_term_string}"},"query-input":"required name=search_term_string"}],"inLanguage":"de-DE"},{"@type":"Organization","@id":"https:\/\/dataladder.com\/de\/#organization","name":"Data Ladder","url":"https:\/\/dataladder.com\/de\/","logo":{"@type":"ImageObject","inLanguage":"de-DE","@id":"https:\/\/dataladder.com\/de\/#\/schema\/logo\/image\/","url":"https:\/\/dataladder.com\/wp-content\/uploads\/2018\/06\/DL-Logo-Ball-30.png","contentUrl":"https:\/\/dataladder.com\/wp-content\/uploads\/2018\/06\/DL-Logo-Ball-30.png","width":413,"height":408,"caption":"Data Ladder"},"image":{"@id":"https:\/\/dataladder.com\/de\/#\/schema\/logo\/image\/"},"sameAs":["https:\/\/www.linkedin.com\/company\/dataladder-llc\/","https:\/\/web.facebook.com\/DataLadderSoftware"]},{"@type":"Person","@id":"https:\/\/dataladder.com\/de\/#\/schema\/person\/6cc3d6b3c83c611546541b5eb2d1e21b","name":"lbarrera","image":{"@type":"ImageObject","inLanguage":"de-DE","@id":"https:\/\/dataladder.com\/de\/#\/schema\/person\/image\/","url":"https:\/\/secure.gravatar.com\/avatar\/5198cb4dd374e7d879a15a9cf20299b3?s=96&d=mm&r=g","contentUrl":"https:\/\/secure.gravatar.com\/avatar\/5198cb4dd374e7d879a15a9cf20299b3?s=96&d=mm&r=g","caption":"lbarrera"},"url":"https:\/\/dataladder.com\/de\/author\/lbarrera\/"}]}},"modified_by":null,"_links":{"self":[{"href":"https:\/\/dataladder.com\/de\/wp-json\/wp\/v2\/posts\/63218"}],"collection":[{"href":"https:\/\/dataladder.com\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/dataladder.com\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/dataladder.com\/de\/wp-json\/wp\/v2\/users\/9"}],"replies":[{"embeddable":true,"href":"https:\/\/dataladder.com\/de\/wp-json\/wp\/v2\/comments?post=63218"}],"version-history":[{"count":2,"href":"https:\/\/dataladder.com\/de\/wp-json\/wp\/v2\/posts\/63218\/revisions"}],"predecessor-version":[{"id":67150,"href":"https:\/\/dataladder.com\/de\/wp-json\/wp\/v2\/posts\/63218\/revisions\/67150"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/dataladder.com\/de\/wp-json\/wp\/v2\/media\/58157"}],"wp:attachment":[{"href":"https:\/\/dataladder.com\/de\/wp-json\/wp\/v2\/media?parent=63218"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/dataladder.com\/de\/wp-json\/wp\/v2\/categories?post=63218"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/dataladder.com\/de\/wp-json\/wp\/v2\/tags?post=63218"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}