{"id":63172,"date":"2019-05-03T00:00:00","date_gmt":"2019-05-03T04:00:00","guid":{"rendered":"https:\/\/dataladder.com\/limpieza-de-datos-en-el-almacen-de-datos-el-enfoque-automatizado-y-sin-codigo-para-mantener-su-fuente-unica-de-verdad\/"},"modified":"2022-03-17T11:36:54","modified_gmt":"2022-03-17T11:36:54","slug":"limpieza-de-datos-en-el-almacen-de-datos-el-enfoque-automatizado-y-sin-codigo-para-mantener-su-fuente-unica-de-verdad","status":"publish","type":"post","link":"https:\/\/dataladder.com\/es\/limpieza-de-datos-en-el-almacen-de-datos-el-enfoque-automatizado-y-sin-codigo-para-mantener-su-fuente-unica-de-verdad\/","title":{"rendered":"Limpieza de datos en el almac\u00e9n de datos: El enfoque automatizado y sin c\u00f3digo para mantener su fuente \u00fanica de verdad"},"content":{"rendered":"<p><span style=\"font-weight: 400;\">Los datos est\u00e1n en todas partes, y se espera que el volumen total <\/span><a href=\"https:\/\/www.seagate.com\/files\/www-content\/our-story\/trends\/files\/Seagate-WP-DataAge2025-March-2017.pdf\"><br \/>\n<span style=\"font-weight: 400;\">de datos supera los 44 billones de GB en 2020.<\/span><br \/>\n<\/a><span style=\"font-weight: 400;\">pero rara vez es \u00fatil. S\u00f3lo <\/span><a href=\"https:\/\/www.capgemini.com\/consulting\/wp-content\/uploads\/sites\/30\/2017\/07\/big_data_pov_03-02-15.pdf\"><span style=\"font-weight: 400;\">27%<\/span><\/a><span style=\"font-weight: 400;\"> de las organizaciones con iniciativas de an\u00e1lisis de datos en marcha informan de alg\u00fan \u00e9xito significativo, mientras que un mero 8% describe sus esfuerzos como \u00abmuy exitosos\u00bb. Estas cifras son bajas no porque las empresas no tengan los datos necesarios, sino porque no tienen datos de calidad con los que trabajar, lo que significa que los datos que tienen son, a todos los efectos, in\u00fatiles.<\/span><\/p>\n<p><span style=\"font-weight: 400;\">La disponibilidad no es suficiente; hay que hacer que los datos sean \u00fatiles.<\/span><\/p>\n<p><span style=\"font-weight: 400;\">A la hora de construir su almac\u00e9n de datos, asegurarse de que tiene datos limpios es fundamental, o se arriesga a enfrentarse a la <\/span><span style=\"font-weight: 400;\">\u00ab<\/span><a href=\"https:\/\/searchsoftwarequality.techtarget.com\/definition\/garbage-in-garbage-out\"><br \/>\n<span style=\"font-weight: 400;\">basura que entra, basura que sale<\/span><br \/>\n<\/a><span style=\"font-weight: 400;\">\u00ab<\/span><span style=\"font-weight: 400;\"> fen\u00f3meno. Pero, \u00bfqu\u00e9 implica exactamente la limpieza de datos y si realmente la necesita en el dise\u00f1o de su almac\u00e9n de datos espec\u00edfico?<\/span><\/p>\n<p><span style=\"font-weight: 400;\">Si est\u00e1 integrando datos de una sola fuente, puede encontrar que los registros de origen contienen informaci\u00f3n que falta, errores ortogr\u00e1ficos de cuando se introdujeron los datos originalmente, datos no v\u00e1lidos, etc. Estos problemas son omnipresentes en las bases de datos y a menudo se trasladan a los informes anal\u00edticos, a menos que se apliquen t\u00e9cnicas de limpieza y <a href=\"https:\/\/dataladder.com\/es\/software-de-depuracion-de-datos-herramienta-de-depuracion-de-datos-clasificada-como-n-1\/\">depuraci\u00f3n de datos<\/a> de antemano. El problema se agrava cuando se trata de fuentes de datos dispares para construir repositorios de datos centralizados como un almac\u00e9n de datos, un sistema de informaci\u00f3n global o un sistema federado de bases de datos operativas. <\/span><\/p>\n<p><span style=\"font-weight: 400;\">Cuando se trata de una sola fuente, hay que lidiar con las inexactitudes de los datos. Con fuentes dispares, tambi\u00e9n tendr\u00e1 que lidiar con las diferencias en la forma en que se almacenan y estructuran los datos, as\u00ed como con los problemas de redundancia de datos entre las m\u00faltiples representaciones de datos en cada fuente.<\/span><\/p>\n<p><span style=\"font-weight: 400;\">Veamos un ejemplo. Digamos que tiene una entidad llamada \u00abJohn Smith\u00bb con el campo Ciudad rellenado como \u00abLondres\u00bb en una base de datos. Otra base de datos podr\u00eda tener una columna adicional para \u00abPa\u00eds\u00bb, y cuando las dos bases de datos se fusionen, no tendr\u00e1 ninguna forma f\u00e1cil de rellenar el campo Ciudad para el antiguo registro \u00abJuan P\u00e9rez\u00bb. Despu\u00e9s de todo, hay cerca de <\/span><br \/>\n<span style=\"font-weight: 400;\">12 Londres diferentes en el mundo<\/span><span style=\"font-weight: 400;\">. <\/span><\/p>\n<p><span style=\"font-weight: 400;\">Este es un ejemplo; podr\u00eda haber infinidad de problemas, como nombres concatenados en una base de datos y columnas separadas para FirstName y LastName en otra, o columnas separadas para HouseNumber y StreetName, mientras que otra base de datos tiene una \u00fanica columna Address. <\/span><\/p>\n<p><span style=\"font-weight: 400;\">Una forma de corregir la calidad de los datos es escudri\u00f1ar y corregir manualmente los errores, pero eso se vuelve r\u00e1pidamente inviable cuando se trata de grandes datos. La otra v\u00eda es utilizar un software de calidad de datos construido espec\u00edficamente para permitir la <\/span><span style=\"font-weight: 400;\">limpieza de datos m\u00e1s r\u00e1pida y precisa<\/span><span style=\"font-weight: 400;\"> para su almac\u00e9n de datos.<\/span><\/p>\n<h2><span style=\"font-weight: 400;\">Limpieza de datos en el almac\u00e9n de datos<\/span><\/h2>\n<p><span style=\"font-weight: 400;\">Su almac\u00e9n de datos debe disponer de datos coherentes, precisos y deduplicados para alimentar las aplicaciones de an\u00e1lisis posteriores y otros sistemas de la empresa. En un escenario t\u00edpico, necesitar\u00e1 un \u00e1rea de preparaci\u00f3n separada en la que importar\u00e1 los datos desde la fuente y luego los transformar\u00e1 y los manipular\u00e1 <a href=\"https:\/\/dataladder.com\/es\/software-de-estandarizacion-de-datos-herramienta-de-estandarizacion-de-datos-rapida-y-rentable\/\">para estandarizarlos<\/a> y limpiarlos. Los <a href=\"https:\/\/dataladder.com\/es\/software-de-limpieza-de-datos-herramienta-de-limpieza-de-datos-crm-rapida-y-rentable\/\">programas<\/a> modernos <a href=\"https:\/\/dataladder.com\/es\/software-de-limpieza-de-datos-herramienta-de-limpieza-de-datos-crm-rapida-y-rentable\/\">de limpieza de datos<\/a> admiten el procesamiento en memoria, en el que los datos de origen se importan a la memoria temporal en lugar de a una base de datos f\u00edsica. Puedes probar tus configuraciones de limpieza y deduplicaci\u00f3n en la memoria temporal y luego exportarlas una vez que est\u00e9s satisfecho con los resultados.<\/span><\/p>\n<p><span style=\"font-weight: 400;\">Cuando decida un enfoque de limpieza de datos para su almac\u00e9n de datos, aseg\u00farese de que el m\u00e9todo elegido pueda:<\/span><\/p>\n<ul>\n<li style=\"font-weight: 400;\"><span style=\"font-weight: 400;\">Gestionar las incoherencias y los errores tanto en las integraciones de una sola fuente como en la integraci\u00f3n de datos de m\u00faltiples fuentes<\/span><\/li>\n<li style=\"font-weight: 400;\"><span style=\"font-weight: 400;\">Minimizar la codificaci\u00f3n manual y el esfuerzo de revisi\u00f3n de datos para validar la calidad<\/span><span style=\"font-weight: 400;\">y<\/span><\/li>\n<li style=\"font-weight: 400;\"><span style=\"font-weight: 400;\">Utilizarse para fuentes distintas de las definidas inicialmente, de modo que el enfoque siga siendo v\u00e1lido cuando se necesite a\u00f1adir m\u00e1s fuentes en el almac\u00e9n de datos m\u00e1s adelante<\/span><\/li>\n<li style=\"font-weight: 400;\"><span style=\"font-weight: 400;\">Trabajar con transformaciones de datos basadas en esquemas que se basan en metadatos<\/span><\/li>\n<li style=\"font-weight: 400;\"><a href=\"https:\/\/dataladder.com\/es\/software-de-vinculacion-de-registros\/\"><span style=\"font-weight: 400;\">Identificar los registros vinculados <\/span><\/a><span style=\"font-weight: 400;\">a trav\u00e9s de las fuentes con fines de deduplicaci\u00f3n y enriquecimiento<\/span><\/li>\n<li style=\"font-weight: 400;\"><span style=\"font-weight: 400;\">Proporcionar funciones de orquestaci\u00f3n del flujo de trabajo para apoyar y crear una base s\u00f3lida para las reglas de calidad de datos aplicadas a escala para limpiar los datos de la empresa.<\/span><\/li>\n<\/ul>\n<h2><span style=\"font-weight: 400;\">Limpieza de datos en la integraci\u00f3n de una sola fuente<\/span><\/h2>\n<p><span style=\"font-weight: 400;\">Como se ha comentado anteriormente, vamos a segmentar los problemas de limpieza de datos en el almac\u00e9n de datos en dos grandes categor\u00edas de integraci\u00f3n de datos debido a los desaf\u00edos \u00fanicos de limpieza de datos que presenta cada una:<\/span><\/p>\n<ul>\n<li style=\"font-weight: 400;\"><span style=\"font-weight: 400;\">Integraci\u00f3n de datos de una sola fuente<\/span><\/li>\n<li style=\"font-weight: 400;\"><span style=\"font-weight: 400;\">Integraci\u00f3n de m\u00faltiples fuentes de datos<\/span><\/li>\n<\/ul>\n<p><span style=\"font-weight: 400;\">Para ambas categor\u00edas, discutiremos m\u00e1s a fondo los problemas de limpieza de datos a nivel de esquema e instancia. Los problemas relacionados con el esquema se refieren a aquellos en los que los datos pueden limpiarse trabajando en la mejora del dise\u00f1o del esquema, mientras que los problemas relacionados con la instancia se refieren a errores a un nivel inferior, en el contenido de los campos de la tabla.<\/span><\/p>\n<p><span style=\"font-weight: 400;\">Uno de los principales factores para garantizar una mayor calidad de los datos es la disponibilidad de restricciones en sus esquemas de datos. Si ha establecido restricciones en el sistema para controlar los datos permitidos, habr\u00e1 reducido considerablemente el esfuerzo de limpieza de datos. Cuantas menos restricciones tenga su esquema, mayor ser\u00e1 el esfuerzo de limpieza de datos. Una forma muy eficaz de hacerlo es integrando el software de calidad de datos en sus sistemas y aplicaciones y definiendo previamente las reglas de negocio en funci\u00f3n de las restricciones que desee aplicar. <\/span><\/p>\n<p><span style=\"font-weight: 400;\">La integraci\u00f3n basada en la API de Data Ladder garantiza que todos los datos introducidos se cotejen con sus reglas de negocio en tiempo real, independientemente de si los datos se introducen en su CRM o se cargan antes en una base de datos SQL.<\/span><\/p>\n<p><span style=\"font-weight: 400;\">He aqu\u00ed algunos ejemplos que le ayudar\u00e1n a comprender los problemas de calidad de datos relacionados con los esquemas:<\/span><\/p>\n<p><b>Datos:<\/b><\/p>\n<p><span style=\"font-weight: 400;\">Fecha de nacimiento = 20.15.90<\/span><\/p>\n<p><b>El problema:<\/b><\/p>\n<p><span style=\"font-weight: 400;\">Valores no permitidos<\/span><\/p>\n<p><b>Raz\u00f3n:<\/b><\/p>\n<p><span style=\"font-weight: 400;\">Los valores introducidos para la fecha de nacimiento est\u00e1n fuera del rango permitido porque no puede haber un 15<\/span><span style=\"font-weight: 400;\"><span style=\"font-weight: 400;\"> mes.<\/span><\/span><\/p>\n<p><span style=\"font-weight: 400;\">Otros ejemplos podr\u00edan ser los problemas de integridad referencial, en los que un campo se refiere a un ID de departamento espec\u00edfico pero ese ID de departamento no se ha definido en el sistema. O problemas de singularidad cuando el n\u00famero de la seguridad social de dos empleados figura como el mismo.<\/span><\/p>\n<p><span style=\"font-weight: 400;\">Por otra parte, los problemas relacionados con las instancias pueden deberse a errores ortogr\u00e1ficos (statename = Coloradoo), a abreviaturas utilizadas por error durante la introducci\u00f3n de datos (profession = DB prog) y a referencias incorrectas (employee = [name= \u00abJohn\u00bb, deptID= \u00ab22\u00bb], cuando el deptID real de ese empleado era el 12).<\/span><\/p>\n<p><span style=\"font-weight: 400;\">Como puede ver, si no se solucionan estos problemas, las consultas que utilicen estos datos devolver\u00e1n informaci\u00f3n incorrecta, lo que puede llevar a que las decisiones empresariales se basen en datos err\u00f3neos.<\/span><\/p>\n<h2><span style=\"font-weight: 400;\">Limpieza de datos en la integraci\u00f3n de m\u00faltiples fuentes<\/span><\/h2>\n<p><span style=\"font-weight: 400;\">Naturalmente, los problemas de calidad de los datos se multiplican cuando se integran en el almac\u00e9n de datos datos procedentes de m\u00faltiples fuentes. Adem\u00e1s de los problemas generales como las faltas de ortograf\u00eda y las referencias incorrectas en la introducci\u00f3n de datos, debe <\/span><a href=\"https:\/\/dataladder.com\/es\/software-de-resolucion-de-entidades-la-resolucion-de-entidades-mas-rapida-y-precisa-del-sector\/\"><span style=\"font-weight: 400;\">conciliar los datos en m\u00faltiples representaciones<\/span><\/a><span style=\"font-weight: 400;\"> y construir registros \u00abmaestros\u00bb para que su visi\u00f3n de la \u00abFuente \u00danica de la Verdad\u00bb se haga realidad. Tambi\u00e9n hay que resolver los problemas de redundancia de datos, cuando los datos se solapan entre los sistemas.<\/span><\/p>\n<p><span style=\"font-weight: 400;\">En lo que respecta al dise\u00f1o de esquemas, principalmente tendr\u00e1 que lidiar con los conflictos estructurales y de nomenclatura en diferentes sistemas de origen. Los conflictos estructurales pueden incluir diferentes tipos de datos, restricciones de integridad, estructura de los componentes, etc. En cuanto a las cuestiones relacionadas con las instancias, es probable que las m\u00faltiples fuentes hagan que el mismo atributo se represente de forma diferente en los distintos sistemas. Por ejemplo: MaritalStatus podr\u00eda ser \u00abMarried\u00bb o \u00abSingle\u00bb en un sistema, mientras que otro podr\u00eda tener un registro para RelationshipStatus con atributos totalmente diferentes &#8211; pero mostrando el estado civil tambi\u00e9n.<\/span><\/p>\n<p><a href=\"https:\/\/dataladder.com\/es\/software-de-deduplicacion-de-datos-utilice-reglas-integradas-y-personalizadas-para-la-deduplicacion-de-crm\/\"><span style=\"font-weight: 400;\">Duplicaci\u00f3n de datos<\/span><\/a><span style=\"font-weight: 400;\"> es otra cuesti\u00f3n muy importante, sobre todo cuando se tienen varios registros en varios sistemas que apuntan a la misma entidad. Las empresas tienen millones de registros relacionados con clientes, proveedores y empleados, a menudo en diferentes bases de datos. Estas bases de datos tienen muchos registros duplicados, lo que hace que disminuya la eficacia operativa y que falte informaci\u00f3n. Los registros m\u00faltiples significan que los detalles del mismo cliente\/entidad est\u00e1n repartidos en varios registros. Eliminar los duplicados y fusionar los registros <\/span><br \/>\n<span style=\"font-weight: 400;\">aumenta la eficiencia de la base de datos<\/span><br \/>\n<span style=\"font-weight: 400;\"> al tiempo que crea una \u00fanica fuente de verdad.<\/span><\/p>\n<p><b>Tabla de clientes (sistema fuente ABC):<\/b><\/p>\n<table>\n<tbody>\n<tr>\n<td><b>CID<\/b><\/td>\n<td><b>Nombre<\/b><\/td>\n<td><b>Calle<\/b><\/td>\n<td><b>Ciudad<\/b><\/td>\n<td><b>Sexo<\/b><\/td>\n<\/tr>\n<tr>\n<td><span style=\"font-weight: 400;\">11<\/span><\/td>\n<td><span style=\"font-weight: 400;\">Kristen Smith<\/span><\/td>\n<td><span style=\"font-weight: 400;\">2 Hurley Pl<\/span><\/td>\n<td><span style=\"font-weight: 400;\">South Fork, MN 48503<\/span><\/td>\n<td><span style=\"font-weight: 400;\">0<\/span><\/td>\n<\/tr>\n<tr>\n<td><span style=\"font-weight: 400;\">24<\/span><\/td>\n<td><span style=\"font-weight: 400;\">Christian Smith<\/span><\/td>\n<td><span style=\"font-weight: 400;\">Calle Hurley 2<\/span><\/td>\n<td><span style=\"font-weight: 400;\">S Fork MN<\/span><\/td>\n<td><span style=\"font-weight: 400;\">1<\/span><\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<p><b>Tabla de clientes (sistema de origen XYZ):<\/b><\/p>\n<table>\n<tbody>\n<tr>\n<td><b>Cno<\/b><\/td>\n<td><b>Apellido<\/b><\/td>\n<td><b>Nombre<\/b><\/td>\n<td><b>G\u00e9nero<\/b><\/td>\n<td><b>Direcci\u00f3n<\/b><\/td>\n<td><b>Tel\u00e9fono\/Fax<\/b><\/td>\n<\/tr>\n<tr>\n<td><span style=\"font-weight: 400;\">11<\/span><\/td>\n<td><span style=\"font-weight: 400;\">Smith<\/span><\/td>\n<td><span style=\"font-weight: 400;\">Christoph<\/span><\/td>\n<td><span style=\"font-weight: 400;\">M<\/span><\/td>\n<td><span style=\"font-weight: 400;\">23 Harley St, Chicago IL, 60633-2394<\/span><\/td>\n<td><span style=\"font-weight: 400;\">333-222-6542 \/ 333-222-6599<\/span><\/td>\n<\/tr>\n<tr>\n<td><span style=\"font-weight: 400;\">493<\/span><\/td>\n<td><span style=\"font-weight: 400;\">Smith<\/span><\/td>\n<td><span style=\"font-weight: 400;\">Kris L.<\/span><\/td>\n<td><span style=\"font-weight: 400;\">F<\/span><\/td>\n<td><span style=\"font-weight: 400;\">2 Hurley Place, South Fork MN, 48503-5998<\/span><\/td>\n<td><span style=\"font-weight: 400;\">444-555-6666<\/span><\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<p><b>Tabla de clientes (integrada tras la limpieza de datos para el almac\u00e9n de datos de destino):<\/b><\/p>\n<table>\n<tbody>\n<tr>\n<td><b>No<\/b><\/td>\n<td><b>LName<\/b><\/td>\n<td><b>FName<\/b><\/td>\n<td><b>G\u00e9nero<\/b><\/td>\n<td><b>Calle<\/b><\/td>\n<td><b>Ciudad<\/b><\/td>\n<td><b>Estado<\/b><\/td>\n<td><b>ZIP<\/b><\/td>\n<td><b>Tel\u00e9fono<\/b><\/td>\n<td><b>Fax<\/b><\/td>\n<td><b>CID<\/b><\/td>\n<td><b>Cno<\/b><\/td>\n<\/tr>\n<tr>\n<td><span style=\"font-weight: 400;\">1<\/span><\/td>\n<td><span style=\"font-weight: 400;\">Smith<\/span><\/td>\n<td><span style=\"font-weight: 400;\">Kristen L.<\/span><\/td>\n<td><span style=\"font-weight: 400;\">F<\/span><\/td>\n<td><span style=\"font-weight: 400;\">2 Hurley Place<\/span><\/td>\n<td><span style=\"font-weight: 400;\">Horquilla Sur<\/span><\/td>\n<td><span style=\"font-weight: 400;\">MN<\/span><\/td>\n<td><span style=\"font-weight: 400;\">48503-5998<\/span><\/td>\n<td><span style=\"font-weight: 400;\">444-555-6666<\/span><\/td>\n<td><\/td>\n<td><span style=\"font-weight: 400;\">11<\/span><\/td>\n<td><span style=\"font-weight: 400;\">493<\/span><\/td>\n<\/tr>\n<tr>\n<td><span style=\"font-weight: 400;\">2<\/span><\/td>\n<td><span style=\"font-weight: 400;\">Smith<\/span><\/td>\n<td><span style=\"font-weight: 400;\">Christian<\/span><\/td>\n<td><span style=\"font-weight: 400;\">M<\/span><\/td>\n<td><span style=\"font-weight: 400;\">2 Hurley Place<\/span><\/td>\n<td><span style=\"font-weight: 400;\">Horquilla Sur<\/span><\/td>\n<td><span style=\"font-weight: 400;\">MN<\/span><\/td>\n<td><span style=\"font-weight: 400;\">48503-5998<\/span><\/td>\n<td><\/td>\n<td><\/td>\n<td><span style=\"font-weight: 400;\">24<\/span><\/td>\n<td><\/td>\n<\/tr>\n<tr>\n<td><span style=\"font-weight: 400;\">3<\/span><\/td>\n<td><span style=\"font-weight: 400;\">Smith<\/span><\/td>\n<td><span style=\"font-weight: 400;\">Christoph<\/span><\/td>\n<td><span style=\"font-weight: 400;\">M<\/span><\/td>\n<td><span style=\"font-weight: 400;\">23 Harley Street<\/span><\/td>\n<td><span style=\"font-weight: 400;\">Chicago<\/span><\/td>\n<td><span style=\"font-weight: 400;\">IL<\/span><\/td>\n<td><span style=\"font-weight: 400;\">60633-2394<\/span><\/td>\n<td><span style=\"font-weight: 400;\">333-222-6542<\/span><\/td>\n<td><span style=\"font-weight: 400;\">333-222-6599<\/span><\/td>\n<td><\/td>\n<td><span style=\"font-weight: 400;\">11<\/span><\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<p><span style=\"font-weight: 400;\">La integraci\u00f3n de datos en su almac\u00e9n de datos gira en torno a dos procesos importantes:<\/span><\/p>\n<ul>\n<li style=\"font-weight: 400;\"><span style=\"font-weight: 400;\">Reconocer si la misma entidad existe en ambas fuentes<\/span><\/li>\n<li style=\"font-weight: 400;\"><span style=\"font-weight: 400;\">Combinaci\u00f3n de datos de entidades para obtener una vista consolidada de una tabla de entidades<\/span><\/li>\n<\/ul>\n<p><span style=\"font-weight: 400;\">Para obtener una vista limpia y completa, hay que fusionar los datos relacionados y purgar los duplicados redundantes, como se muestra en el ejemplo anterior. El proceso se conoce com\u00fanmente como &#8216;<\/span><a href=\"https:\/\/dataladder.com\/es\/guia-rapida-para-la-depuracion-de-datos\/\"><br \/>\n<span style=\"font-weight: 400;\">fusionar purgar<\/span><br \/>\n<\/a><span style=\"font-weight: 400;\">Proceso que consiste en combinar datos de dos o m\u00e1s fuentes, identificando y\/o combinando los duplicados, y eliminando (purgando) los registros no deseados. <\/span><\/p>\n<p><span style=\"font-weight: 400;\">Para utilizar su almac\u00e9n de datos en todo su potencial, la purga de fusiones es fundamental. Los datos pueden ser analizados para encontrar ideas, aumentar la eficiencia y descubrir problemas cuando se dise\u00f1a el almac\u00e9n de datos para que sea la \u00ab\u00fanica fuente de verdad\u00bb en toda la empresa. La purga de fusi\u00f3n permite elegir c\u00f3mo se deben fusionar y purgar los datos. Elija las reglas de supervivencia de datos que mejor se adapten a su prop\u00f3sito y nuestra <a href=\"https:\/\/dataladder.com\/es\/software-de-purga-de-fusiones-utilizar-reglas-de-supervivencia-incorporadas-y-personalizadas\/\">herramienta de purga de fusi\u00f3n<\/a> revisar\u00e1 millones de registros, combin\u00e1ndolos en registros dorados completos. Sus datos originales se conservan en su forma original, y se crea un nuevo conjunto de datos que contiene toda la informaci\u00f3n.<\/span><\/p>\n<h2><span style=\"font-weight: 400;\">Construya capacidades anal\u00edticas fiables y precisas en su almac\u00e9n de datos<\/span><\/h2>\n<p><span style=\"font-weight: 400;\">El software de calidad de datos de Data Ladder ha sido calificado como la plataforma m\u00e1s r\u00e1pida y precisa para la <a href=\"https:\/\/dataladder.com\/es\/software-de-vinculacion-de-registros\/\">vinculaci\u00f3n de registros<\/a> en m\u00faltiples estudios independientes. Aproveche nuestras potentes funciones de cotejo propias para detectar y purgar duplicados, o fusionar y sobrevivir a los datos para construir un &#8216;<\/span><span style=\"font-weight: 400;\">una \u00fanica fuente de verdad<\/span><span style=\"font-weight: 400;\">&#8216; utilizando t\u00e9cnicas de <a href=\"https:\/\/dataladder.com\/es\/comparacion-difusa-101-limpieza-y-vinculacion-de-datos-desordenados\/\">concordancia difusa<\/a>, an\u00e1lisis sint\u00e1ctico inteligente y reconocimiento de patrones de primera clase. <\/span><\/p>\n<h3 style=\"text-align: center;\"><span style=\"font-weight: 400;\">\u00abMi parte favorita de DataMatch es lo f\u00e1cil y flexible que es su uso. Puedo utilizar datos de pr\u00e1cticamente cualquier fuente de datos, incluyendo conexiones ODBC, archivos CSV y archivos JSON. Hace un gran trabajo con la limpieza de datos haciendo que el proceso de cotejo sea a\u00fan m\u00e1s potente.\u00bb<\/span><\/h3>\n<p style=\"text-align: center;\"><a href=\"https:\/\/www.g2crowd.com\/products\/datamatch-enterprise\/reviews\"><span style=\"font-weight: 400;\">Nick Corder, arquitecto de plataformas<\/span><\/a><\/p>\n<p><span style=\"font-weight: 400;\">La velocidad, la precisi\u00f3n y el bajo coste inigualables de <a href=\"https:\/\/dataladder.com\/es\/productos\/datamatch-enterprise-calificado-como-el-producto-numero-uno-para-la-gestion-de-la-calidad-de-los-datos\/\">DataMatch<\/a> Enterprise hacen que cotejar y vincular registros de todos sus repositorios de datos sea un juego de ni\u00f1os, gracias a la gran variedad de integraciones que ofrece DataMatch Enterprise desde el principio. <\/span><\/p>\n<p><span style=\"font-weight: 400;\">Mejore su estrategia de limpieza en el almac\u00e9n de datos aprovechando nuestra integraci\u00f3n nativa con las numerosas fuentes de datos y las funciones avanzadas de vinculaci\u00f3n de registros para encontrar coincidencias de datos en todos los repositorios admitidos, independientemente de si sus datos viven en plataformas de medios sociales y sistemas heredados o en bases de datos tradicionales y archivos planos e incluso en lagos de Big Data. Data Ladder se integra con pr\u00e1cticamente todos los sistemas modernos para ayudarle a sacar el m\u00e1ximo partido a su almac\u00e9n de datos.<\/span><\/p>\n<p style=\"text-align: center;\"><span style=\"font-size: 20px;\"><a href=\"https:\/\/calendly.com\/dme-solution-specialist\/datamatch-enterprise-demo\" target=\"_blank\" rel=\"noopener\"><br \/>\n<span style=\"font-weight: 400;\">P\u00f3ngase en contacto<\/span><br \/>\n<\/a><span style=\"font-weight: 400;\"> con nuestros arquitectos de soluciones para elaborar un plan para depurar, limpiar y, finalmente, <a href=\"https:\/\/dataladder.com\/es\/software-de-validacion-de-datos-como-asegurarse-de-que-los-datos-introducidos-son-validos-y-no-presentan-errores\/\">validar los datos<\/a> mediante t\u00e9cnicas de automatizaci\u00f3n avanzadas mientras construye su almac\u00e9n de datos y se asegura de que los usuarios de su empresa obtengan an\u00e1lisis precisos.<\/span><\/span><\/p>\n<p style=\"text-align: center;\">\n","protected":false},"excerpt":{"rendered":"<p>Los datos est\u00e1n en todas partes, y se espera que el volumen total de datos supera los 44 billones de GB en 2020. pero rara vez es \u00fatil. S\u00f3lo 27% de las organizaciones con iniciativas de an\u00e1lisis de datos en marcha informan de alg\u00fan \u00e9xito significativo, mientras que un mero 8% describe sus esfuerzos como [&hellip;]<\/p>\n","protected":false},"author":9,"featured_media":58178,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"_lmt_disableupdate":"","_lmt_disable":"","_links_to":"","_links_to_target":""},"categories":[1271,1324],"tags":[995,543,475,774],"acf":[],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v19.9 - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>Limpieza de datos en el almac\u00e9n de datos: El enfoque automatizado y sin c\u00f3digo para mantener su fuente \u00fanica de verdad - Data Ladder<\/title>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/dataladder.com\/es\/limpieza-de-datos-en-el-almacen-de-datos-el-enfoque-automatizado-y-sin-codigo-para-mantener-su-fuente-unica-de-verdad\/\" \/>\n<meta property=\"og:locale\" content=\"es_ES\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Limpieza de datos en el almac\u00e9n de datos: El enfoque automatizado y sin c\u00f3digo para mantener su fuente \u00fanica de verdad - Data Ladder\" \/>\n<meta property=\"og:description\" content=\"Los datos est\u00e1n en todas partes, y se espera que el volumen total de datos supera los 44 billones de GB en 2020. pero rara vez es \u00fatil. S\u00f3lo 27% de las organizaciones con iniciativas de an\u00e1lisis de datos en marcha informan de alg\u00fan \u00e9xito significativo, mientras que un mero 8% describe sus esfuerzos como [&hellip;]\" \/>\n<meta property=\"og:url\" content=\"https:\/\/dataladder.com\/es\/limpieza-de-datos-en-el-almacen-de-datos-el-enfoque-automatizado-y-sin-codigo-para-mantener-su-fuente-unica-de-verdad\/\" \/>\n<meta property=\"og:site_name\" content=\"Data Ladder\" \/>\n<meta property=\"article:publisher\" content=\"https:\/\/web.facebook.com\/DataLadderSoftware\" \/>\n<meta property=\"article:published_time\" content=\"2019-05-03T04:00:00+00:00\" \/>\n<meta property=\"article:modified_time\" content=\"2022-03-17T11:36:54+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/dataladder.com\/wp-content\/uploads\/2021\/09\/blog_dpdc_1_dataqualitymanagementcircle_230370.png\" \/>\n\t<meta property=\"og:image:width\" content=\"870\" \/>\n\t<meta property=\"og:image:height\" content=\"497\" \/>\n\t<meta property=\"og:image:type\" content=\"image\/png\" \/>\n<meta name=\"author\" content=\"lbarrera\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"Escrito por\" \/>\n\t<meta name=\"twitter:data1\" content=\"lbarrera\" \/>\n\t<meta name=\"twitter:label2\" content=\"Tiempo de lectura\" \/>\n\t<meta name=\"twitter:data2\" content=\"10 minutos\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"Article\",\"@id\":\"https:\/\/dataladder.com\/es\/limpieza-de-datos-en-el-almacen-de-datos-el-enfoque-automatizado-y-sin-codigo-para-mantener-su-fuente-unica-de-verdad\/#article\",\"isPartOf\":{\"@id\":\"https:\/\/dataladder.com\/es\/limpieza-de-datos-en-el-almacen-de-datos-el-enfoque-automatizado-y-sin-codigo-para-mantener-su-fuente-unica-de-verdad\/\"},\"author\":{\"name\":\"lbarrera\",\"@id\":\"https:\/\/dataladder.com\/es\/#\/schema\/person\/6cc3d6b3c83c611546541b5eb2d1e21b\"},\"headline\":\"Limpieza de datos en el almac\u00e9n de datos: El enfoque automatizado y sin c\u00f3digo para mantener su fuente \u00fanica de verdad\",\"datePublished\":\"2019-05-03T04:00:00+00:00\",\"dateModified\":\"2022-03-17T11:36:54+00:00\",\"mainEntityOfPage\":{\"@id\":\"https:\/\/dataladder.com\/es\/limpieza-de-datos-en-el-almacen-de-datos-el-enfoque-automatizado-y-sin-codigo-para-mantener-su-fuente-unica-de-verdad\/\"},\"wordCount\":2315,\"publisher\":{\"@id\":\"https:\/\/dataladder.com\/es\/#organization\"},\"keywords\":[\"almac\u00e9n de datos\",\"calidad de los datos\",\"Limpieza de datos\",\"limpieza de datos\"],\"articleSection\":[\"Gesti\u00f3n de la calidad de los datos\",\"Limpieza y estandarizaci\u00f3n de datos\"],\"inLanguage\":\"es\"},{\"@type\":\"WebPage\",\"@id\":\"https:\/\/dataladder.com\/es\/limpieza-de-datos-en-el-almacen-de-datos-el-enfoque-automatizado-y-sin-codigo-para-mantener-su-fuente-unica-de-verdad\/\",\"url\":\"https:\/\/dataladder.com\/es\/limpieza-de-datos-en-el-almacen-de-datos-el-enfoque-automatizado-y-sin-codigo-para-mantener-su-fuente-unica-de-verdad\/\",\"name\":\"Limpieza de datos en el almac\u00e9n de datos: El enfoque automatizado y sin c\u00f3digo para mantener su fuente \u00fanica de verdad - Data Ladder\",\"isPartOf\":{\"@id\":\"https:\/\/dataladder.com\/es\/#website\"},\"datePublished\":\"2019-05-03T04:00:00+00:00\",\"dateModified\":\"2022-03-17T11:36:54+00:00\",\"breadcrumb\":{\"@id\":\"https:\/\/dataladder.com\/es\/limpieza-de-datos-en-el-almacen-de-datos-el-enfoque-automatizado-y-sin-codigo-para-mantener-su-fuente-unica-de-verdad\/#breadcrumb\"},\"inLanguage\":\"es\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/dataladder.com\/es\/limpieza-de-datos-en-el-almacen-de-datos-el-enfoque-automatizado-y-sin-codigo-para-mantener-su-fuente-unica-de-verdad\/\"]}]},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/dataladder.com\/es\/limpieza-de-datos-en-el-almacen-de-datos-el-enfoque-automatizado-y-sin-codigo-para-mantener-su-fuente-unica-de-verdad\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Home\",\"item\":\"https:\/\/dataladder.com\/es\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Limpieza de datos en el almac\u00e9n de datos: El enfoque automatizado y sin c\u00f3digo para mantener su fuente \u00fanica de verdad\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/dataladder.com\/es\/#website\",\"url\":\"https:\/\/dataladder.com\/es\/\",\"name\":\"Data Ladder\",\"description\":\"Enterprise Data Profiling, Cleansing, and Matching\",\"publisher\":{\"@id\":\"https:\/\/dataladder.com\/es\/#organization\"},\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/dataladder.com\/es\/?s={search_term_string}\"},\"query-input\":\"required name=search_term_string\"}],\"inLanguage\":\"es\"},{\"@type\":\"Organization\",\"@id\":\"https:\/\/dataladder.com\/es\/#organization\",\"name\":\"Data Ladder\",\"url\":\"https:\/\/dataladder.com\/es\/\",\"logo\":{\"@type\":\"ImageObject\",\"inLanguage\":\"es\",\"@id\":\"https:\/\/dataladder.com\/es\/#\/schema\/logo\/image\/\",\"url\":\"https:\/\/dataladder.com\/wp-content\/uploads\/2018\/06\/DL-Logo-Ball-30.png\",\"contentUrl\":\"https:\/\/dataladder.com\/wp-content\/uploads\/2018\/06\/DL-Logo-Ball-30.png\",\"width\":413,\"height\":408,\"caption\":\"Data Ladder\"},\"image\":{\"@id\":\"https:\/\/dataladder.com\/es\/#\/schema\/logo\/image\/\"},\"sameAs\":[\"https:\/\/www.linkedin.com\/company\/dataladder-llc\/\",\"https:\/\/web.facebook.com\/DataLadderSoftware\"]},{\"@type\":\"Person\",\"@id\":\"https:\/\/dataladder.com\/es\/#\/schema\/person\/6cc3d6b3c83c611546541b5eb2d1e21b\",\"name\":\"lbarrera\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"es\",\"@id\":\"https:\/\/dataladder.com\/es\/#\/schema\/person\/image\/\",\"url\":\"https:\/\/secure.gravatar.com\/avatar\/5198cb4dd374e7d879a15a9cf20299b3?s=96&d=mm&r=g\",\"contentUrl\":\"https:\/\/secure.gravatar.com\/avatar\/5198cb4dd374e7d879a15a9cf20299b3?s=96&d=mm&r=g\",\"caption\":\"lbarrera\"},\"url\":\"https:\/\/dataladder.com\/es\/author\/lbarrera\/\"}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Limpieza de datos en el almac\u00e9n de datos: El enfoque automatizado y sin c\u00f3digo para mantener su fuente \u00fanica de verdad - Data Ladder","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/dataladder.com\/es\/limpieza-de-datos-en-el-almacen-de-datos-el-enfoque-automatizado-y-sin-codigo-para-mantener-su-fuente-unica-de-verdad\/","og_locale":"es_ES","og_type":"article","og_title":"Limpieza de datos en el almac\u00e9n de datos: El enfoque automatizado y sin c\u00f3digo para mantener su fuente \u00fanica de verdad - Data Ladder","og_description":"Los datos est\u00e1n en todas partes, y se espera que el volumen total de datos supera los 44 billones de GB en 2020. pero rara vez es \u00fatil. S\u00f3lo 27% de las organizaciones con iniciativas de an\u00e1lisis de datos en marcha informan de alg\u00fan \u00e9xito significativo, mientras que un mero 8% describe sus esfuerzos como [&hellip;]","og_url":"https:\/\/dataladder.com\/es\/limpieza-de-datos-en-el-almacen-de-datos-el-enfoque-automatizado-y-sin-codigo-para-mantener-su-fuente-unica-de-verdad\/","og_site_name":"Data Ladder","article_publisher":"https:\/\/web.facebook.com\/DataLadderSoftware","article_published_time":"2019-05-03T04:00:00+00:00","article_modified_time":"2022-03-17T11:36:54+00:00","og_image":[{"width":870,"height":497,"url":"https:\/\/dataladder.com\/wp-content\/uploads\/2021\/09\/blog_dpdc_1_dataqualitymanagementcircle_230370.png","type":"image\/png"}],"author":"lbarrera","twitter_card":"summary_large_image","twitter_misc":{"Escrito por":"lbarrera","Tiempo de lectura":"10 minutos"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"Article","@id":"https:\/\/dataladder.com\/es\/limpieza-de-datos-en-el-almacen-de-datos-el-enfoque-automatizado-y-sin-codigo-para-mantener-su-fuente-unica-de-verdad\/#article","isPartOf":{"@id":"https:\/\/dataladder.com\/es\/limpieza-de-datos-en-el-almacen-de-datos-el-enfoque-automatizado-y-sin-codigo-para-mantener-su-fuente-unica-de-verdad\/"},"author":{"name":"lbarrera","@id":"https:\/\/dataladder.com\/es\/#\/schema\/person\/6cc3d6b3c83c611546541b5eb2d1e21b"},"headline":"Limpieza de datos en el almac\u00e9n de datos: El enfoque automatizado y sin c\u00f3digo para mantener su fuente \u00fanica de verdad","datePublished":"2019-05-03T04:00:00+00:00","dateModified":"2022-03-17T11:36:54+00:00","mainEntityOfPage":{"@id":"https:\/\/dataladder.com\/es\/limpieza-de-datos-en-el-almacen-de-datos-el-enfoque-automatizado-y-sin-codigo-para-mantener-su-fuente-unica-de-verdad\/"},"wordCount":2315,"publisher":{"@id":"https:\/\/dataladder.com\/es\/#organization"},"keywords":["almac\u00e9n de datos","calidad de los datos","Limpieza de datos","limpieza de datos"],"articleSection":["Gesti\u00f3n de la calidad de los datos","Limpieza y estandarizaci\u00f3n de datos"],"inLanguage":"es"},{"@type":"WebPage","@id":"https:\/\/dataladder.com\/es\/limpieza-de-datos-en-el-almacen-de-datos-el-enfoque-automatizado-y-sin-codigo-para-mantener-su-fuente-unica-de-verdad\/","url":"https:\/\/dataladder.com\/es\/limpieza-de-datos-en-el-almacen-de-datos-el-enfoque-automatizado-y-sin-codigo-para-mantener-su-fuente-unica-de-verdad\/","name":"Limpieza de datos en el almac\u00e9n de datos: El enfoque automatizado y sin c\u00f3digo para mantener su fuente \u00fanica de verdad - Data Ladder","isPartOf":{"@id":"https:\/\/dataladder.com\/es\/#website"},"datePublished":"2019-05-03T04:00:00+00:00","dateModified":"2022-03-17T11:36:54+00:00","breadcrumb":{"@id":"https:\/\/dataladder.com\/es\/limpieza-de-datos-en-el-almacen-de-datos-el-enfoque-automatizado-y-sin-codigo-para-mantener-su-fuente-unica-de-verdad\/#breadcrumb"},"inLanguage":"es","potentialAction":[{"@type":"ReadAction","target":["https:\/\/dataladder.com\/es\/limpieza-de-datos-en-el-almacen-de-datos-el-enfoque-automatizado-y-sin-codigo-para-mantener-su-fuente-unica-de-verdad\/"]}]},{"@type":"BreadcrumbList","@id":"https:\/\/dataladder.com\/es\/limpieza-de-datos-en-el-almacen-de-datos-el-enfoque-automatizado-y-sin-codigo-para-mantener-su-fuente-unica-de-verdad\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Home","item":"https:\/\/dataladder.com\/es\/"},{"@type":"ListItem","position":2,"name":"Limpieza de datos en el almac\u00e9n de datos: El enfoque automatizado y sin c\u00f3digo para mantener su fuente \u00fanica de verdad"}]},{"@type":"WebSite","@id":"https:\/\/dataladder.com\/es\/#website","url":"https:\/\/dataladder.com\/es\/","name":"Data Ladder","description":"Enterprise Data Profiling, Cleansing, and Matching","publisher":{"@id":"https:\/\/dataladder.com\/es\/#organization"},"potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/dataladder.com\/es\/?s={search_term_string}"},"query-input":"required name=search_term_string"}],"inLanguage":"es"},{"@type":"Organization","@id":"https:\/\/dataladder.com\/es\/#organization","name":"Data Ladder","url":"https:\/\/dataladder.com\/es\/","logo":{"@type":"ImageObject","inLanguage":"es","@id":"https:\/\/dataladder.com\/es\/#\/schema\/logo\/image\/","url":"https:\/\/dataladder.com\/wp-content\/uploads\/2018\/06\/DL-Logo-Ball-30.png","contentUrl":"https:\/\/dataladder.com\/wp-content\/uploads\/2018\/06\/DL-Logo-Ball-30.png","width":413,"height":408,"caption":"Data Ladder"},"image":{"@id":"https:\/\/dataladder.com\/es\/#\/schema\/logo\/image\/"},"sameAs":["https:\/\/www.linkedin.com\/company\/dataladder-llc\/","https:\/\/web.facebook.com\/DataLadderSoftware"]},{"@type":"Person","@id":"https:\/\/dataladder.com\/es\/#\/schema\/person\/6cc3d6b3c83c611546541b5eb2d1e21b","name":"lbarrera","image":{"@type":"ImageObject","inLanguage":"es","@id":"https:\/\/dataladder.com\/es\/#\/schema\/person\/image\/","url":"https:\/\/secure.gravatar.com\/avatar\/5198cb4dd374e7d879a15a9cf20299b3?s=96&d=mm&r=g","contentUrl":"https:\/\/secure.gravatar.com\/avatar\/5198cb4dd374e7d879a15a9cf20299b3?s=96&d=mm&r=g","caption":"lbarrera"},"url":"https:\/\/dataladder.com\/es\/author\/lbarrera\/"}]}},"modified_by":null,"_links":{"self":[{"href":"https:\/\/dataladder.com\/es\/wp-json\/wp\/v2\/posts\/63172"}],"collection":[{"href":"https:\/\/dataladder.com\/es\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/dataladder.com\/es\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/dataladder.com\/es\/wp-json\/wp\/v2\/users\/9"}],"replies":[{"embeddable":true,"href":"https:\/\/dataladder.com\/es\/wp-json\/wp\/v2\/comments?post=63172"}],"version-history":[{"count":1,"href":"https:\/\/dataladder.com\/es\/wp-json\/wp\/v2\/posts\/63172\/revisions"}],"predecessor-version":[{"id":66455,"href":"https:\/\/dataladder.com\/es\/wp-json\/wp\/v2\/posts\/63172\/revisions\/66455"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/dataladder.com\/es\/wp-json\/wp\/v2\/media\/58178"}],"wp:attachment":[{"href":"https:\/\/dataladder.com\/es\/wp-json\/wp\/v2\/media?parent=63172"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/dataladder.com\/es\/wp-json\/wp\/v2\/categories?post=63172"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/dataladder.com\/es\/wp-json\/wp\/v2\/tags?post=63172"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}