{"id":63091,"date":"2020-05-13T00:00:00","date_gmt":"2020-05-13T04:00:00","guid":{"rendered":"https:\/\/dataladder.com\/datos-dispares-sucios-y-duplicados-como-entender-las-3d-de-los-datos-erroneos\/"},"modified":"2022-03-14T17:19:44","modified_gmt":"2022-03-14T17:19:44","slug":"datos-dispares-sucios-y-duplicados-como-entender-las-3d-de-los-datos-erroneos","status":"publish","type":"post","link":"https:\/\/dataladder.com\/es\/datos-dispares-sucios-y-duplicados-como-entender-las-3d-de-los-datos-erroneos\/","title":{"rendered":"Datos dispares, sucios y duplicados: c\u00f3mo entender las 3D de los datos err\u00f3neos."},"content":{"rendered":"<p>En un mundo fascinado por las oportunidades ilimitadas de la IA, el ML y el <a href=\"https:\/\/www.nexoya.com\/blog\/the-benefits-of-predictive-analytics-in-marketing-infographic\/\">an\u00e1lisis predictivo<\/a>, la calidad de los datos se ha convertido en un reto importante. Las empresas est\u00e1n al l\u00edmite: necesitan datos precisos para crear experiencias personalizadas, pero no tienen la capacidad de lidiar con datos malos.<\/p>\n<p>Las empresas deben hacer frente a dos aspectos debilitantes de la calidad de los datos, los datos sucios (datos duplicados, problemas de ortograf\u00eda, informaci\u00f3n incompleta, etc.) y los datos no conformes. Esto incluye datos que ponen a las organizaciones en riesgo de violaciones del GDPR, an\u00e1lisis inexactos e informes defectuosos.<\/p>\n<p>En este art\u00edculo, nos centraremos en:<\/p>\n<ul>\n<li>Comprender los retos cr\u00edticos de la calidad de los datos<\/li>\n<li>Principales retos de la calidad de los datos que las empresas tienen que afrontar<\/li>\n<li>Comprender las 3D con un estudio de caso<\/li>\n<li>C\u00f3mo ayuda Data Ladder a superar estos retos<\/li>\n<\/ul>\n<p>Vamos a sumergirnos.<\/p>\n<h2><strong>Retos clave de la calidad de los datos con los que las empresas est\u00e1n teniendo dificultades <\/strong><\/h2>\n<p>A los expertos les gusta utilizar la expresi\u00f3n \u00abbasura que entra, basura que sale\u00bb para definir el problema de la calidad de los datos.<\/p>\n<p>Una de las conclusiones del <a href=\"https:\/\/www.oreilly.com\/radar\/the-state-of-data-quality-in-2020\/\">informe de OReilly sobre el estado de la calidad de los datos<\/a> es que:<\/p>\n<blockquote><p>\u00abLas organizaciones se enfrentan a m\u00faltiples problemas simult\u00e1neos de calidad de datos. Tienen demasiadas fuentes de datos diferentes y demasiados datos incoherentes. No disponen de los recursos necesarios para solucionar los problemas de calidad de datos. Y eso es s\u00f3lo el principio\u00bb.<\/p><\/blockquote>\n<p>\u00bfLa buena noticia? Los altos cargos de las organizaciones son conscientes de este importante reto.<\/p>\n<p>\u00bfLa mala noticia? Carecen de herramientas, recursos y soluciones para resolver este problema. Muchos siguen teniendo problemas con los procesos b\u00e1sicos de gesti\u00f3n de datos.<\/p>\n<p>En nuestra experiencia con m\u00e1s de 4.500 clientes, incluidos los de la Administraci\u00f3n y las empresas de la lista Fortune 500, solemos ver tres problemas comunes:<\/p>\n<ol>\n<li>Datos almacenados en m\u00faltiples fuentes o sistemas dispares<\/li>\n<li>Datos que no cumplen los objetivos de calidad<\/li>\n<li>La falta de una soluci\u00f3n s\u00f3lida de cotejo de datos que pueda eliminar los duplicados profundamente enterrados<\/li>\n<\/ol>\n<p>Las empresas necesitan desesperadamente ayuda para manejar datos dispares, sucios y duplicados.<\/p>\n<h2><strong>Entender las 3D de los datos<\/strong><\/h2>\n<p>Los datos sucios, dispares y duplicados afectan a las empresas a un nivel m\u00e1s profundo. Afectan a los procesos organizativos y a la <a href=\"https:\/\/www.kdnuggets.com\/2020\/03\/bad-data-affecting-organizations-operational-efficiency.html\">eficiencia operativa<\/a>. Dificultan los esfuerzos por crear una cultura basada en los datos y son la principal causa de los an\u00e1lisis e informes err\u00f3neos.<\/p>\n<h3><strong>Datos dispares: <\/strong><\/h3>\n<p>De media, una empresa est\u00e1 conectada a m\u00e1s de 461 aplicaciones o sistemas. Estos sistemas recogen datos en m\u00faltiples formatos que luego se vuelcan en un lago de datos. Las empresas que no tienen lagos de datos intentan a\u00f1adir estos datos a sus ERP, pero los problemas de formato y mapeo de datos hacen que este proceso sea tedioso. En consecuencia, los datos nunca se clasifican ni se tratan hasta que existe una necesidad cr\u00edtica y urgente.<\/p>\n<p>Tomemos, por ejemplo, el caso del Bell Bank, un banco de renombre con una l\u00ednea de servicios que se extiende por los 50 estados de EE.UU. Como parte de su valor principal de proporcionar experiencias personalizadas a los clientes, el banco quer\u00eda entender mejor a sus clientes evaluando su relaci\u00f3n e interacci\u00f3n en varios puntos de contacto. Para ello, necesitaban crear una \u00fanica versi\u00f3n de la verdad para cada uno de sus clientes. Para ello, tuvieron que <a href=\"https:\/\/dataladder.com\/es\/software-de-purga-de-fusiones-utilizar-reglas-de-supervivencia-incorporadas-y-personalizadas\/\">depurar<\/a>, desduplicar y limpiar millones de filas de datos para obtener finalmente una imagen consolidada del recorrido de sus clientes.<\/p>\n<p>Pero, \u00bfqu\u00e9 es exactamente la disparidad de fuentes de datos? \u00bfSon s\u00f3lo datos almacenados en diferentes fuentes?<\/p>\n<p>Pues no.<\/p>\n<p>Los datos dispares no s\u00f3lo se almacenan en distintas fuentes, sino que tambi\u00e9n tienen formatos de datos diferentes, variedades en los est\u00e1ndares y suelen considerarse datos de baja calidad. <strong>Los datos son claramente diferentes en cuanto a su tipo, calidad o car\u00e1cter.<\/strong><\/p>\n<p>Bell Bank tendr\u00e1 que obtener datos de marketing, ventas, atenci\u00f3n al cliente y terceros proveedores para tener una imagen clara del perfil de un cliente, su interacci\u00f3n con la empresa, los datos de su hogar y mucho m\u00e1s. Todos estos datos \u00abdispares\u00bb tendr\u00e1n que consolidarse a trav\u00e9s de un proceso de <a href=\"https:\/\/dataladder.com\/es\/software-de-comparacion-de-datos-calificado-como-el-mejor-de-su-clase-con-una-precision-de-coincidencia-del-96\/\">cotejo de datos<\/a> que finalmente dar\u00e1 al banco su tan necesaria versi\u00f3n de la verdad.<\/p>\n<p>Bell Bank es s\u00f3lo un ejemplo de las muchas empresas, bancos, minoristas e instituciones que se est\u00e1n dando cuenta de la importancia de obtener una <a href=\"https:\/\/dataladder.com\/es\/resolucion-de-entidades-para-una-vista-de-cliente-unico\/\">visi\u00f3n singular del cliente<\/a>. En una \u00e9poca en la que los clientes exigen experiencias personalizadas incluso antes de pedirlas, una visi\u00f3n consolidada ayuda a las organizaciones a ir un paso por delante. Como Bell Bank entiende el recorrido de su cliente, podr\u00e1 ofrecer servicios personalizados como tarjetas especiales de fidelidad, descuentos, ventajas para los socios, etc. Los datos desarticulados impiden a las empresas obtener este conocimiento m\u00e1s profundo, por lo que les resulta imposible obtener ning\u00fan valor de sus datos.<\/p>\n<h3><strong>Datos sucios <\/strong><\/h3>\n<p>Mantenga todos los problemas de las fuentes de datos dispares anteriores y a\u00f1ada cuestiones como:<\/p>\n<ul>\n<li>Ortograf\u00eda incorrecta<\/li>\n<li>Informaci\u00f3n incompleta (datos de direcci\u00f3n sin c\u00f3digos postales, d\u00edgitos que faltan en los n\u00fameros de tel\u00e9fono, etc.)<\/li>\n<li>Uso de la puntuaci\u00f3n en los campos de datos<\/li>\n<li>Espacios negativos<\/li>\n<li>Problemas de formato<\/li>\n<\/ul>\n<p>Se podr\u00eda pensar que esto es algo sencillo de gestionar con filtros y autocorrecciones. Pero hay empresas que no hacen m\u00e1s que limpiar las direcciones f\u00edsicas de las calles en las bases de datos, porque la gente utiliza t\u00e9rminos diferentes para la calle. (por ejemplo, Street, St., ST). Sus analistas y especialistas de datos tienen que dedicar m\u00e1s del 80% de su tiempo a arreglar estos datos brutos, el tiempo y el talento que se supon\u00eda que era para el an\u00e1lisis y no para arreglar la ortograf\u00eda o las abreviaturas.<\/p>\n<p>Por desgracia, los datos recogidos a trav\u00e9s de sitios web y centros de llamadas suelen estar plagados de errores. Los datos extra\u00eddos de las redes sociales tambi\u00e9n son problem\u00e1ticos en t\u00e9rminos de validez y precisi\u00f3n. Los datos que se recogen a trav\u00e9s de la entrada humana casi nunca son limpios. Pero hacer que un analista de datos se siente ante millones de filas de datos y que la fijaci\u00f3n de datos sea una parte permanente de su trabajo no es la soluci\u00f3n.<\/p>\n<p><a href=\"https:\/\/dataladder.com\/es\/la-guia-completa-de-herramientas-soluciones-y-mejores-practicas-de-limpieza-de-datos-para-empresas\/\">La limpieza de datos es una necesidad constante.<\/a> Esto significa que su empresa necesita una soluci\u00f3n automatizada que sea supervisada y manejada por un analista de datos o un usuario de la empresa, dej\u00e1ndoles el tiempo necesario para centrarse en la obtenci\u00f3n de informaci\u00f3n.<\/p>\n<h3><strong>Datos duplicados <\/strong><\/h3>\n<p>La duplicaci\u00f3n de datos se produce cuando la misma informaci\u00f3n se recoge y almacena en diferentes fuentes de datos con formatos distintos. Y esto ocurre con una frecuencia alarmante.<\/p>\n<p>Cada vez que un usuario utiliza dos correos electr\u00f3nicos para registrarse en un formulario web, se crea un registro duplicado. Cada vez que un operador de entrada de datos introduce una clave de identificaci\u00f3n \u00fanica o incorrecta (como n\u00fameros de tel\u00e9fono o SSN), se crea un registro duplicado. Cuando una fuente de datos no puede utilizar los SSN, las posibilidades de duplicaci\u00f3n aumentan porque el operador de datos tiene que asignar sus propias claves \u00fanicas a los campos y cuando este registro debe fusionarse con otro, se produce una mayor probabilidad de duplicaci\u00f3n. Cada vez que un sistema tiene un fallo, se puede crear un duplicado. De hecho, hay demasiadas posibilidades de que se creen duplicados con facilidad.<\/p>\n<p>La duplicaci\u00f3n de datos es una tarea que lleva mucho tiempo. Las empresas cometen un error cl\u00e1sico aqu\u00ed: creen que esto se puede resolver f\u00e1cilmente probando diferentes algoritmos, pero es mucho m\u00e1s complejo. S\u00f3lo se pueden eliminar los duplicados que tienen propiedades exactas mediante los m\u00e9todos tradicionales. No puede eliminar los duplicados que aparentemente comparten las mismas propiedades.<\/p>\n<p><strong>Por ejemplo:<\/strong><\/p>\n<p>Un cliente, Catherine, escribe su nombre como Catherine Davis, Cath Davis, C. Davis en diferentes lugares. Ahora bien, si adem\u00e1s ha cambiado su n\u00famero de tel\u00e9fono o su direcci\u00f3n de correo electr\u00f3nico en varias ocasiones durante el proceso de introducci\u00f3n de datos, el sistema ya ha creado duplicados.<\/p>\n<p>Un algoritmo que trabaja con coincidencias exactas puede identificar los duplicados siempre que el nombre de Catherine se escriba igual en otro registro.<\/p>\n<p>Pero si hay otras variaciones, no puede atrapar el duplicado.<\/p>\n<p>Por eso, la precisi\u00f3n es fundamental a la hora de <a href=\"https:\/\/dataladder.com\/es\/software-de-deduplicacion-de-datos-utilice-reglas-integradas-y-personalizadas-para-la-deduplicacion-de-crm\/\">desduplicar los datos<\/a>.<\/p>\n<p>Se necesita una soluci\u00f3n que pueda ejecutar coincidencias para millones de filas de datos, utilizando una combinaci\u00f3n de algoritmos<a href=\"https:\/\/dataladder.com\/es\/comparacion-difusa-101-limpieza-y-vinculacion-de-datos-desordenados\/\">(difusos<\/a>, deterministas, soundex, etc.) para eliminar incluso los casos menos probables. En este sentido, la precisi\u00f3n de la soluci\u00f3n DataMatch Enterprise de Data Ladder no tiene rival.<\/p>\n<h3><strong>\u00bfC\u00f3mo ayuda Data Ladder a las empresas a manejar estos 3 tipos malos? <\/strong><\/h3>\n<p>Durante la \u00faltima d\u00e9cada, Data Ladder ha ayudado a las organizaciones a dar sentido a sus datos. Gracias a nuestra soluci\u00f3n de concordancia patentada, en combinaci\u00f3n con otros algoritmos de <a href=\"https:\/\/dataladder.com\/es\/software-de-comparacion-de-datos-calificado-como-el-mejor-de-su-clase-con-una-precision-de-coincidencia-del-96\/\">concordancia de datos<\/a>, ayudamos a las empresas a desduplicar los datos con el m\u00e1ximo nivel de precisi\u00f3n y rapidez.<\/p>\n<p>Comprendemos muy bien las dificultades a las que se enfrentan las organizaciones hoy en d\u00eda. Los datos son el nuevo combustible, pero para que esos datos ayuden a las organizaciones a cumplir sus objetivos empresariales, deben ser limpios, precisos y utilizables. Las empresas siguen avanzando a medida que empiezan a comprender los problemas que plantean sus datos, pero necesitan una soluci\u00f3n que pueda resolver estos problemas de forma r\u00e1pida, eficaz e inteligente.<\/p>\n<p>Y as\u00ed es como ayuda Data Ladder.<\/p>\n<p><img src=\"https:\/\/dataladder.com\/wp-content\/uploads\/2020\/05\/dataquality-1024x485.png\" alt=\"calidad de los datos\" width=\"1024\" height=\"485\" \/><\/p>\n<ol>\n<li>Contamos con un marco de 7 etapas que comienza con la integraci\u00f3n de datos y termina con la fusi\u00f3n de datos y la supervivencia.<\/li>\n<li>Puede integrar datos de m\u00e1s de 150 aplicaciones en una sola plataforma.<\/li>\n<li>Tras la integraci\u00f3n, puede limpiar, <a href=\"https:\/\/dataladder.com\/es\/software-de-estandarizacion-de-datos-herramienta-de-estandarizacion-de-datos-rapida-y-rentable\/\">normalizar<\/a>, <a href=\"https:\/\/dataladder.com\/es\/software-de-validacion-de-datos-como-asegurarse-de-que-los-datos-introducidos-son-validos-y-no-presentan-errores\/\">validar<\/a> y hacer coincidir los datos.<\/li>\n<li>Puede crear registros maestros y fusionar datos.<\/li>\n<li>Por \u00faltimo, puede automatizar la <a href=\"https:\/\/dataladder.com\/es\/software-de-limpieza-de-datos-herramienta-de-limpieza-de-datos-crm-rapida-y-rentable\/\">limpieza de datos<\/a> en una fecha programada.<\/li>\n<\/ol>\n<p style=\"text-align: center;\">Necesita datos de confianza para alcanzar antes sus objetivos de an\u00e1lisis de big data, migraci\u00f3n, experiencia personalizada del cliente y funcionamiento eficiente del negocio.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>En un mundo fascinado por las oportunidades ilimitadas de la IA, el ML y el an\u00e1lisis predictivo, la calidad de los datos se ha convertido en un reto importante. Las empresas est\u00e1n al l\u00edmite: necesitan datos precisos para crear experiencias personalizadas, pero no tienen la capacidad de lidiar con datos malos. Las empresas deben hacer [&hellip;]<\/p>\n","protected":false},"author":9,"featured_media":58250,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"_lmt_disableupdate":"","_lmt_disable":"","_links_to":"","_links_to_target":""},"categories":[1271],"tags":[543,807,808,689,591],"acf":[],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v19.9 - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>Datos dispares, sucios y duplicados: c\u00f3mo entender las 3D de los datos err\u00f3neos. - Data Ladder<\/title>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/dataladder.com\/es\/datos-dispares-sucios-y-duplicados-como-entender-las-3d-de-los-datos-erroneos\/\" \/>\n<meta property=\"og:locale\" content=\"es_ES\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Datos dispares, sucios y duplicados: c\u00f3mo entender las 3D de los datos err\u00f3neos. - Data Ladder\" \/>\n<meta property=\"og:description\" content=\"En un mundo fascinado por las oportunidades ilimitadas de la IA, el ML y el an\u00e1lisis predictivo, la calidad de los datos se ha convertido en un reto importante. Las empresas est\u00e1n al l\u00edmite: necesitan datos precisos para crear experiencias personalizadas, pero no tienen la capacidad de lidiar con datos malos. Las empresas deben hacer [&hellip;]\" \/>\n<meta property=\"og:url\" content=\"https:\/\/dataladder.com\/es\/datos-dispares-sucios-y-duplicados-como-entender-las-3d-de-los-datos-erroneos\/\" \/>\n<meta property=\"og:site_name\" content=\"Data Ladder\" \/>\n<meta property=\"article:publisher\" content=\"https:\/\/web.facebook.com\/DataLadderSoftware\" \/>\n<meta property=\"article:published_time\" content=\"2020-05-13T04:00:00+00:00\" \/>\n<meta property=\"article:modified_time\" content=\"2022-03-14T17:19:44+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/dataladder.com\/wp-content\/uploads\/2021\/09\/duplicated-data-scaled-1.jpg\" \/>\n\t<meta property=\"og:image:width\" content=\"2560\" \/>\n\t<meta property=\"og:image:height\" content=\"2276\" \/>\n\t<meta property=\"og:image:type\" content=\"image\/jpeg\" \/>\n<meta name=\"author\" content=\"lbarrera\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"Escrito por\" \/>\n\t<meta name=\"twitter:data1\" content=\"lbarrera\" \/>\n\t<meta name=\"twitter:label2\" content=\"Tiempo de lectura\" \/>\n\t<meta name=\"twitter:data2\" content=\"8 minutos\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"Article\",\"@id\":\"https:\/\/dataladder.com\/es\/datos-dispares-sucios-y-duplicados-como-entender-las-3d-de-los-datos-erroneos\/#article\",\"isPartOf\":{\"@id\":\"https:\/\/dataladder.com\/es\/datos-dispares-sucios-y-duplicados-como-entender-las-3d-de-los-datos-erroneos\/\"},\"author\":{\"name\":\"lbarrera\",\"@id\":\"https:\/\/dataladder.com\/es\/#\/schema\/person\/6cc3d6b3c83c611546541b5eb2d1e21b\"},\"headline\":\"Datos dispares, sucios y duplicados: c\u00f3mo entender las 3D de los datos err\u00f3neos.\",\"datePublished\":\"2020-05-13T04:00:00+00:00\",\"dateModified\":\"2022-03-14T17:19:44+00:00\",\"mainEntityOfPage\":{\"@id\":\"https:\/\/dataladder.com\/es\/datos-dispares-sucios-y-duplicados-como-entender-las-3d-de-los-datos-erroneos\/\"},\"wordCount\":1798,\"publisher\":{\"@id\":\"https:\/\/dataladder.com\/es\/#organization\"},\"keywords\":[\"calidad de los datos\",\"datos dispares\",\"datos duplicados\",\"Datos sucios\",\"transformaci\u00f3n de datos\"],\"articleSection\":[\"Gesti\u00f3n de la calidad de los datos\"],\"inLanguage\":\"es\"},{\"@type\":\"WebPage\",\"@id\":\"https:\/\/dataladder.com\/es\/datos-dispares-sucios-y-duplicados-como-entender-las-3d-de-los-datos-erroneos\/\",\"url\":\"https:\/\/dataladder.com\/es\/datos-dispares-sucios-y-duplicados-como-entender-las-3d-de-los-datos-erroneos\/\",\"name\":\"Datos dispares, sucios y duplicados: c\u00f3mo entender las 3D de los datos err\u00f3neos. - Data Ladder\",\"isPartOf\":{\"@id\":\"https:\/\/dataladder.com\/es\/#website\"},\"datePublished\":\"2020-05-13T04:00:00+00:00\",\"dateModified\":\"2022-03-14T17:19:44+00:00\",\"breadcrumb\":{\"@id\":\"https:\/\/dataladder.com\/es\/datos-dispares-sucios-y-duplicados-como-entender-las-3d-de-los-datos-erroneos\/#breadcrumb\"},\"inLanguage\":\"es\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/dataladder.com\/es\/datos-dispares-sucios-y-duplicados-como-entender-las-3d-de-los-datos-erroneos\/\"]}]},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/dataladder.com\/es\/datos-dispares-sucios-y-duplicados-como-entender-las-3d-de-los-datos-erroneos\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Home\",\"item\":\"https:\/\/dataladder.com\/es\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Datos dispares, sucios y duplicados: c\u00f3mo entender las 3D de los datos err\u00f3neos.\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/dataladder.com\/es\/#website\",\"url\":\"https:\/\/dataladder.com\/es\/\",\"name\":\"Data Ladder\",\"description\":\"Enterprise Data Profiling, Cleansing, and Matching\",\"publisher\":{\"@id\":\"https:\/\/dataladder.com\/es\/#organization\"},\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/dataladder.com\/es\/?s={search_term_string}\"},\"query-input\":\"required name=search_term_string\"}],\"inLanguage\":\"es\"},{\"@type\":\"Organization\",\"@id\":\"https:\/\/dataladder.com\/es\/#organization\",\"name\":\"Data Ladder\",\"url\":\"https:\/\/dataladder.com\/es\/\",\"logo\":{\"@type\":\"ImageObject\",\"inLanguage\":\"es\",\"@id\":\"https:\/\/dataladder.com\/es\/#\/schema\/logo\/image\/\",\"url\":\"https:\/\/dataladder.com\/wp-content\/uploads\/2018\/06\/DL-Logo-Ball-30.png\",\"contentUrl\":\"https:\/\/dataladder.com\/wp-content\/uploads\/2018\/06\/DL-Logo-Ball-30.png\",\"width\":413,\"height\":408,\"caption\":\"Data Ladder\"},\"image\":{\"@id\":\"https:\/\/dataladder.com\/es\/#\/schema\/logo\/image\/\"},\"sameAs\":[\"https:\/\/www.linkedin.com\/company\/dataladder-llc\/\",\"https:\/\/web.facebook.com\/DataLadderSoftware\"]},{\"@type\":\"Person\",\"@id\":\"https:\/\/dataladder.com\/es\/#\/schema\/person\/6cc3d6b3c83c611546541b5eb2d1e21b\",\"name\":\"lbarrera\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"es\",\"@id\":\"https:\/\/dataladder.com\/es\/#\/schema\/person\/image\/\",\"url\":\"https:\/\/secure.gravatar.com\/avatar\/5198cb4dd374e7d879a15a9cf20299b3?s=96&d=mm&r=g\",\"contentUrl\":\"https:\/\/secure.gravatar.com\/avatar\/5198cb4dd374e7d879a15a9cf20299b3?s=96&d=mm&r=g\",\"caption\":\"lbarrera\"},\"url\":\"https:\/\/dataladder.com\/es\/author\/lbarrera\/\"}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Datos dispares, sucios y duplicados: c\u00f3mo entender las 3D de los datos err\u00f3neos. - Data Ladder","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/dataladder.com\/es\/datos-dispares-sucios-y-duplicados-como-entender-las-3d-de-los-datos-erroneos\/","og_locale":"es_ES","og_type":"article","og_title":"Datos dispares, sucios y duplicados: c\u00f3mo entender las 3D de los datos err\u00f3neos. - Data Ladder","og_description":"En un mundo fascinado por las oportunidades ilimitadas de la IA, el ML y el an\u00e1lisis predictivo, la calidad de los datos se ha convertido en un reto importante. Las empresas est\u00e1n al l\u00edmite: necesitan datos precisos para crear experiencias personalizadas, pero no tienen la capacidad de lidiar con datos malos. Las empresas deben hacer [&hellip;]","og_url":"https:\/\/dataladder.com\/es\/datos-dispares-sucios-y-duplicados-como-entender-las-3d-de-los-datos-erroneos\/","og_site_name":"Data Ladder","article_publisher":"https:\/\/web.facebook.com\/DataLadderSoftware","article_published_time":"2020-05-13T04:00:00+00:00","article_modified_time":"2022-03-14T17:19:44+00:00","og_image":[{"width":2560,"height":2276,"url":"https:\/\/dataladder.com\/wp-content\/uploads\/2021\/09\/duplicated-data-scaled-1.jpg","type":"image\/jpeg"}],"author":"lbarrera","twitter_card":"summary_large_image","twitter_misc":{"Escrito por":"lbarrera","Tiempo de lectura":"8 minutos"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"Article","@id":"https:\/\/dataladder.com\/es\/datos-dispares-sucios-y-duplicados-como-entender-las-3d-de-los-datos-erroneos\/#article","isPartOf":{"@id":"https:\/\/dataladder.com\/es\/datos-dispares-sucios-y-duplicados-como-entender-las-3d-de-los-datos-erroneos\/"},"author":{"name":"lbarrera","@id":"https:\/\/dataladder.com\/es\/#\/schema\/person\/6cc3d6b3c83c611546541b5eb2d1e21b"},"headline":"Datos dispares, sucios y duplicados: c\u00f3mo entender las 3D de los datos err\u00f3neos.","datePublished":"2020-05-13T04:00:00+00:00","dateModified":"2022-03-14T17:19:44+00:00","mainEntityOfPage":{"@id":"https:\/\/dataladder.com\/es\/datos-dispares-sucios-y-duplicados-como-entender-las-3d-de-los-datos-erroneos\/"},"wordCount":1798,"publisher":{"@id":"https:\/\/dataladder.com\/es\/#organization"},"keywords":["calidad de los datos","datos dispares","datos duplicados","Datos sucios","transformaci\u00f3n de datos"],"articleSection":["Gesti\u00f3n de la calidad de los datos"],"inLanguage":"es"},{"@type":"WebPage","@id":"https:\/\/dataladder.com\/es\/datos-dispares-sucios-y-duplicados-como-entender-las-3d-de-los-datos-erroneos\/","url":"https:\/\/dataladder.com\/es\/datos-dispares-sucios-y-duplicados-como-entender-las-3d-de-los-datos-erroneos\/","name":"Datos dispares, sucios y duplicados: c\u00f3mo entender las 3D de los datos err\u00f3neos. - Data Ladder","isPartOf":{"@id":"https:\/\/dataladder.com\/es\/#website"},"datePublished":"2020-05-13T04:00:00+00:00","dateModified":"2022-03-14T17:19:44+00:00","breadcrumb":{"@id":"https:\/\/dataladder.com\/es\/datos-dispares-sucios-y-duplicados-como-entender-las-3d-de-los-datos-erroneos\/#breadcrumb"},"inLanguage":"es","potentialAction":[{"@type":"ReadAction","target":["https:\/\/dataladder.com\/es\/datos-dispares-sucios-y-duplicados-como-entender-las-3d-de-los-datos-erroneos\/"]}]},{"@type":"BreadcrumbList","@id":"https:\/\/dataladder.com\/es\/datos-dispares-sucios-y-duplicados-como-entender-las-3d-de-los-datos-erroneos\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Home","item":"https:\/\/dataladder.com\/es\/"},{"@type":"ListItem","position":2,"name":"Datos dispares, sucios y duplicados: c\u00f3mo entender las 3D de los datos err\u00f3neos."}]},{"@type":"WebSite","@id":"https:\/\/dataladder.com\/es\/#website","url":"https:\/\/dataladder.com\/es\/","name":"Data Ladder","description":"Enterprise Data Profiling, Cleansing, and Matching","publisher":{"@id":"https:\/\/dataladder.com\/es\/#organization"},"potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/dataladder.com\/es\/?s={search_term_string}"},"query-input":"required name=search_term_string"}],"inLanguage":"es"},{"@type":"Organization","@id":"https:\/\/dataladder.com\/es\/#organization","name":"Data Ladder","url":"https:\/\/dataladder.com\/es\/","logo":{"@type":"ImageObject","inLanguage":"es","@id":"https:\/\/dataladder.com\/es\/#\/schema\/logo\/image\/","url":"https:\/\/dataladder.com\/wp-content\/uploads\/2018\/06\/DL-Logo-Ball-30.png","contentUrl":"https:\/\/dataladder.com\/wp-content\/uploads\/2018\/06\/DL-Logo-Ball-30.png","width":413,"height":408,"caption":"Data Ladder"},"image":{"@id":"https:\/\/dataladder.com\/es\/#\/schema\/logo\/image\/"},"sameAs":["https:\/\/www.linkedin.com\/company\/dataladder-llc\/","https:\/\/web.facebook.com\/DataLadderSoftware"]},{"@type":"Person","@id":"https:\/\/dataladder.com\/es\/#\/schema\/person\/6cc3d6b3c83c611546541b5eb2d1e21b","name":"lbarrera","image":{"@type":"ImageObject","inLanguage":"es","@id":"https:\/\/dataladder.com\/es\/#\/schema\/person\/image\/","url":"https:\/\/secure.gravatar.com\/avatar\/5198cb4dd374e7d879a15a9cf20299b3?s=96&d=mm&r=g","contentUrl":"https:\/\/secure.gravatar.com\/avatar\/5198cb4dd374e7d879a15a9cf20299b3?s=96&d=mm&r=g","caption":"lbarrera"},"url":"https:\/\/dataladder.com\/es\/author\/lbarrera\/"}]}},"modified_by":null,"_links":{"self":[{"href":"https:\/\/dataladder.com\/es\/wp-json\/wp\/v2\/posts\/63091"}],"collection":[{"href":"https:\/\/dataladder.com\/es\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/dataladder.com\/es\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/dataladder.com\/es\/wp-json\/wp\/v2\/users\/9"}],"replies":[{"embeddable":true,"href":"https:\/\/dataladder.com\/es\/wp-json\/wp\/v2\/comments?post=63091"}],"version-history":[{"count":1,"href":"https:\/\/dataladder.com\/es\/wp-json\/wp\/v2\/posts\/63091\/revisions"}],"predecessor-version":[{"id":66421,"href":"https:\/\/dataladder.com\/es\/wp-json\/wp\/v2\/posts\/63091\/revisions\/66421"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/dataladder.com\/es\/wp-json\/wp\/v2\/media\/58250"}],"wp:attachment":[{"href":"https:\/\/dataladder.com\/es\/wp-json\/wp\/v2\/media?parent=63091"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/dataladder.com\/es\/wp-json\/wp\/v2\/categories?post=63091"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/dataladder.com\/es\/wp-json\/wp\/v2\/tags?post=63091"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}