Blog

Qué es la exactitud de los datos, por qué es importante y cómo pueden las empresas asegurarse de tener datos exactos.

Los datos inexactos tienen implicaciones en el mundo real en todos los sectores. En el ámbito de la aplicación de la ley, los datos inexactos podrían significar el fichaje de la persona equivocada por un delito. En la sanidad, podría significar cometer un error fatal en la atención al paciente. En el caso del comercio minorista, podría significar cometer costosos errores en la expansión del negocio. En las finanzas, podría significar la violación de las normas y listas de sanciones.

La precisión de los datos ya no es «sólo» un componente de la calidad de los datos. Es, literalmente, la característica más importante que hace que los datos sean utilizables y tengan sentido.

En esta guía detallada, voy a cubrir todo lo que necesitas saber sobre:

  • ¿Qué es la precisión de los datos?
  • Cuáles son las causas de la inexactitud de los datos
  • El alto coste de la inexactitud de los datos
  • Por qué es esencial mantener la precisión de los datos
  • ¿Por qué las empresas tienen problemas con la calidad y la precisión de los datos?
  • Qué medidas puede tomar para mejorar la precisión de los datos
  • Algunos ejemplos y estudios de casos importantes

Vamos a profundizar.

¿Qué es la precisión de los datos?

La exactitud de los datos se refiere a los registros sin errores que pueden utilizarse como fuente de información fiable.

En la gestión de datos, la precisión de los mismos es el primer y más importante componente/estándar del marco de calidad de los datos. Una obra muy citada, Data Quality: The Accuracy Dimension , de Jack Olson, explica que la forma y el contenido son dos de las características más importantes de la precisión de los datos.

He aquí un ejemplo:

En la base de datos de EE.UU., las fechas siguen el formato MM/DD/AAAA, mientras que en la base de datos de la UE y otros países del mundo, es DD/MM/AAAA. Si el 09/10/2020 se convirtiera en contenido, ¿cuál de los dos crees que sería el correcto?

¿Es el10 de septiembre oel 9 de octubre? Este es el clásico problema del significado frente a la forma que amenaza la precisión de los datos. Y esto ocurre generalmente debido a la falta de normalización de los datos y de las normas.

Es imprescindible que los datos almacenados en un almacén de datos sean precisos y adecuados para su uso. Afecta a la inteligencia empresarial, la previsión, el presupuesto y otras actividades críticas de una organización. Si los datos son irrelevantes, incorrectos, incompletos e inexactos, pueden perturbar los procesos y obstaculizar la eficiencia operativa.

¿Cuáles son las causas de la inexactitud de los datos?

Las causas de la inexactitud de los datos son muchas. Algunas de las causas más comunes son:

Malas prácticas de introducción de datos: La inexactitud de los datos es el resultado de las malas prácticas de introducción de datos. Una organización que no cuenta con una gobernanza de datos verá cómo los datos se introducen en múltiples formatos, estilos y variedades. Por ejemplo, el nombre de un cliente puede ser escrito de tres maneras diferentes por tres representantes distintos. Y lo que es peor, los datos adquiridos a través de las redes sociales son muy propensos a cometer errores, erratas y errores de copia/pega.

No regular la accesibilidad de los datos: El CRM es un buen ejemplo de este punto. Los CRM, a los que acceden simultáneamente los responsables de ventas, marketing, atención al cliente y cuentas, pueden convertirse en un hervidero de datos duplicados, incoherentes e inexactos. Por ejemplo, un representante de marketing puede querer verificar el nombre de la empresa del cliente antes de publicar un estudio de caso, sólo para ver una ortografía incorrecta o una forma corta del nombre en el campo Nombre de la empresa, que tal vez fue escrito o modificado por un representante de ventas. El representante de marketing tendrá que pasar por varias rondas de verificación para corregir este error. Y lo que es peor, el cliente puede acabar señalando el error si el estudio de caso se publicó sin verificación.

La calidad de los datos no suele abordarse: Los equipos están demasiado ocupados con la venta, el marketing y la promoción como para pensar en la información incorrecta del conjunto de datos. La dirección está demasiado ocupada pensando en las inversiones en la nube, los sistemas de big data, el software de lujo y las tecnologías para preocuparse por los datos. Los equipos de TI están demasiado ocupados ayudando al liderazgo en la «transformación» como para preocuparse por datos dispares, duplicados e inexactos. La calidad o exactitud de los datos no es un asunto de discusión en la sala de juntas. Sólo sale a la luz cuando algo va drásticamente mal, como un informe defectuoso o una campaña de marketing ineficaz.

Todas estas causas provocan pérdidas millonarias.

El alto coste de los datos inexactos

Algunos datos estadísticos para comprender la cuestión.

High Cost of Inaccurate Data

  • Se calcula que los datos erróneos cuestan a las empresas un 15% de sus ingresos. (Gartner)
  • El impacto financiero medio de la mala calidad de los datos en las organizaciones es de 9,7 millones de dólares al año. (Gartner)
  • Sólo en Estados Unidos, las empresas pierden 3,1 billones de dólares al año debido a la mala calidad de los datos. (IBM)
  • Múltiples informes de investigación han demostrado que los datos erróneos cuestan a las empresas una media del 30% o más de sus ingresos.
  • Casi un tercio de los analistas dedican más del 40% de su tiempo a examinar y validar sus datos analíticos. (Forrester)
  • Los trabajadores del conocimiento pierden el 50% de su tiempo en fábricas de datos ocultos, buscando datos, encontrando y corrigiendo errores, y buscando fuentes de confirmación para datos en los que no confían. (HBR)
    • El 28% de los que han tenido problemas para entregar el correo electrónico dicen que el servicio al cliente se ha visto afectado por los malos datos. (E-Consultancy)
  • Entre el 20 y el 30 por ciento de los gastos de explotación se deben a datos erróneos. (Trabajos Pragmáticos)

Estas estadísticas demuestran que los datos inexactos y deficientes son un problema persistente en la mayoría de las organizaciones y que tienen un enorme impacto en el retorno de la inversión, la reputación de la empresa y la confianza de los clientes.

Por qué es esencial mantener la exactitud de los datos

Ideas. Analítica. Inteligencia.

Los tres objetivos principales que las empresas quieren alcanzar con los datos. Esto no se consigue con más datos. Se consigue con datos precisos, completos, oportunos y fiables.

Es a través de estos objetivos que una empresa toma decisiones clave como:

  • Expansión a un nuevo mercado
  • Lanzamiento de un nuevo servicio
  • Comprender la posición en el mercado
  • Entender a los competidores
  • Entender a los clientes y personalizar los servicios de atención al cliente
  • Permitir que los procesos de la empresa sean eficientes

… y mucho más. Dependiendo del sector, la precisión de los datos puede ser decisiva para las empresas. No se pueden ignorar las implicaciones en el mundo real de los datos inexactos.

¿Por qué las empresas tienen problemas con la calidad y la precisión de los datos?

Se están invirtiendo millones en soluciones de gestión de datos. Sin embargo, un estudio de HBR en el que participaron 75 ejecutivos revela que solo el 3% consideró que tenía datos precisos dentro del rango aceptable de 97 o más registros correctos de cada 100.

Las empresas tienen problemas para mantener la precisión de los datos porque se centran únicamente en recopilar más datos, en lugar de hacer que los datos actuales sean utilizables.

Según nuestra experiencia con más de 4.500 clientes, hay tres obstáculos esenciales que impiden a las empresas mantener registros precisos.

Mala cultura de los datos: Las empresas aún no han adoptado realmente una cultura basada en los datos. Se invierte mucho en tecnologías, pero se invierte poco o nada en formación para la concienciación sobre los datos. Los empleados son en su mayoría ajenos a conceptos como la calidad o la exactitud de los datos. Durante mucho tiempo, estas prácticas se han limitado al departamento de TI. Cuando se trata de los datos de los clientes, los empleados de la empresa realizan cambios a su antojo sin respetar ninguna norma definida o protocolo de calidad de datos. Estas lagunas hacen que las empresas no puedan lograr la exactitud de los datos, lo que compromete la integridad de los mismos.

Acumulación de datos en lugar de ser impulsado por los datos: El acaparamiento de datos no tiene fin. Las empresas están gastando millones en tecnologías de big data que recogen más datos cada día que pasa. Pero no existe ningún sistema para dar sentido a esos datos. No hay recursos disponibles para limpiar, ordenar y gestionar los datos a tiempo. No hay automatización y, definitivamente, no hay procesos establecidos para resolver los problemas de calidad de los datos, lo que lleva al tercer obstáculo.

Una obstinada dependencia de métodos y tecnologías anticuados: En la mayoría de las organizaciones actuales, los datos se siguen preparando manualmente mediante Excel, SQL o herramientas ETL. Todos ellos son incapaces de manejar las complejidades de los datos modernos, especialmente los datos de los clientes obtenidos a través de las redes sociales, los proveedores de terceros o los formularios web. Repletos de errores, inexactitudes y rarezas, estos datos no pueden tratarse ni prepararse manualmente, ya que una empresa tardaría meses en limpiar y cotejar miles de filas de datos.

No reconocer la necesidad urgente de garantizar la calidad de los datos obstaculiza su progreso y afecta a su retorno de la inversión, lo que nos lleva a nuestro siguiente punto importante.

Cómo calcular el retorno de la inversión en la exactitud de los datos

El retorno de la inversión determina todas, si no la mayoría, de las decisiones empresariales. Al igual que cualquier otro proceso, haremos todo lo posible para justificar el gasto en calidad de datos midiendo su ROI y la mayoría de los ejecutivos utilizarán un enfoque tradicional para ello:

¿Cuánto ganaremos en dólares si gastamos dólares en arreglar nuestros datos?

Bueno, aquí hay una respuesta no tradicional.

Aumentas tu ROI cuando:

  • Su empresa *NO* comete errores por culpa de unos datos erróneos.
  • No hay que gastar cada dólar en arreglar cada disco.
  • Sus equipos tienen acceso a una fuente de datos limpia y centralizada con la que trabajar.
  • El beneficio de arreglar los datos supera el coste de encubrir los errores y la ineficacia causados por los datos erróneos.
  • Usted toma decisiones seguras basadas en informes de inteligencia y conocimientos derivados de datos precisos.

El hecho es que el retorno de la inversión de cualquier iniciativa de calidad de datos es difícil de alcanzar. Pero el coste de unos datos deficientes es bastante evidente. Las empresas pierden millones de dólares al año por culpa de los duplicados, los datos obsoletos, los datos incompletos, los datos desajustados y los datos inaccesibles y dispares.

He aquí un ejemplo:

Una empresa de formación online por suscripción necesita cotejar un millón de registros obtenidos de tres fuentes: formularios de clientes potenciales, CRM y servicio de atención al cliente.

Utilizando las herramientas tradicionales de ETL, la empresa realiza la coincidencia pero acaba con un 3,5% de falsos negativos y un 6,8% de falsos positivos. Sólo esta cifra ha costado a la empresa cientos de dólares en ventas, horas de trabajo (en la revisión manual de cada falso negativo y positivo). Si la empresa hubiera emprendido en serio una iniciativa de calidad de datos, habría evitado que se desperdiciara el 11% del total de sus registros.

11% de un millón = 11.0000

Suponiendo que cada cliente pague 100 dólares

Son 11.0000 x 100 = 11000000

Once millones de euros en ingresos desperdiciados. Eso es un gran golpe para la rentabilidad de cualquier empresa.

¿Está dispuesto a hacer lo necesario para mejorar la precisión de los datos?

Esto es lo que puedes empezar.

¿Qué medidas inmediatas puede tomar para mejorar la precisión de los datos?


Puede estar tentado de contratar a un analista de datos. O quizás cambiar su CRM. O tal vez encargar a sus equipos informáticos (de nuevo) que den con una solución.

Para.

Nada de esto va a funcionar.

Entonces, ¿qué será?

Algunas medidas inmediatas que recomiendo serían:

  • Realice una auditoría de calidad de datos. Descubra los cinco principales problemas que afectan a la calidad de sus datos. Algunos de los problemas más comunes que encontrará serán los duplicados, la información incompleta y los datos almacenados en múltiples silos, con más de la mitad de ellos obsoletos u olvidados desde hace tiempo.
  • Medir el impacto estimado. Digamos que tiene mil nuevos clientes potenciales este mes. ¿Cuántas de esas pistas son realmente utilizables? Si sólo son dos, o trescientos, estás perdiendo ingresos.
  • Medir la mano de obra necesaria para arreglar estos datos. ¿Cuánto tiempo dedican sus representantes a verificar y corregir la información? ¿Lo hacen manualmente? ¿Cuántas llamadas telefónicas se realizan y cuál es la duración media de cada una? Evaluar el coste de la fijación manual de estos datos. Si su equipo tarda un mes en verificar, limpiar, desduplicar y corregir un conjunto de datos de 1.000 filas, debe buscar una solución más rápida y automatizada.
  • Opte por una solución automatizada: Al auditar sus datos, puede darse cuenta de que necesita una solución de cotejo de datos que le ayude a eliminar los duplicados y, tal vez, a consolidar varios conjuntos de datos de múltiples fuentes en un registro consolidado y de oro. La mayoría de las organizaciones utilizan la solución DataMatch Enterprise de Data Ladder para el cotejo de datos y la deduplicación de los mismos. Además, también consiguen perfilar, limpiar, normalizar y preparar sus datos.
  • Contrate a un analista de datos para que gestione la preparación de los datos : Puede que pienses en contratar a un analista de datos y dejar que se encargue de la limpieza, pero eso no es el uso correcto de sus habilidades. Su analista de datos debe contar con las herramientas y los recursos adecuados para ayudarle a obtener datos precisos. Deben ser los pensadores y los estrategas, mientras que la solución que les equipa es el hacedor. Su analista no debe pasar el 80% de su tiempo haciendo labores de limpieza (los expertos afirman que la limpieza de datos es un trabajo de limpieza de datos y eso no es divertido). Deje que las soluciones hagan la limpieza y que sus analistas piensen.
  • Concéntrese sólo en conjuntos de datos específicos para arreglar en lugar de una fuente de datos completa: Es imposible realizar una operación general en toda la fuente de datos o base de datos. No sólo será inútil, sino que también será una pérdida de esfuerzo. En su lugar, concéntrese en optimizar los datos que necesita para las tareas inmediatas, como la limpieza de los datos de los últimos seis meses para preparar un informe semestral, o los datos del último trimestre para preparar una campaña promocional. Si te centras en arreglar primero los datos importantes, poco a poco irás clasificando otros datos y podrás decidir qué quieres conservar y qué quieres descartar.

Con estos pasos inmediatos, puede preparar a sus equipos para gestionar operaciones empresariales esenciales, como una próxima iniciativa de migración, una importante campaña promocional o un informe de inteligencia empresarial. El objetivo fundamental para disponer de datos precisos es garantizar la integridad de los mismos. Sus datos pueden hacer o deshacer su negocio. ¿Te importa lo suficiente como para arreglarlo?

Estudio de caso de los hermanos Cleveland

Cleveland Brothers Equipment Company Inc. opera como distribuidor de equipos y apoya a una serie de industrias que incluyen la construcción, la agricultura, la generación de energía, el paisajismo y más. Esto significa que la empresa trata con múltiples conjuntos de datos de clientes procedentes de múltiples fuentes, con múltiples intereses y necesidades.

La empresa necesitaba una solución de gestión de la calidad de los datos que le permitiera desduplicar los datos, cruzar información de contacto como nombres, números de teléfono, direcciones de facturación y nombres de empresas. También necesitaban que la solución les ayudara a limpiar y normalizar los datos.

DataMatch Enterprise fue la herramienta elegida por la empresa que les ayudó a realizar varias operaciones clave a la vez y, como la herramienta es fácil de usar y no requiere conocimientos adicionales de programación, incluso los recursos empresariales de la empresa pudieron preparar los datos con facilidad.

Estudio de caso de los hermanos Cleveland

Descargue el estudio de caso y vea cómo el principal distribuidor de equipos ahorra tiempo en la gestión de múltiples listas de clientes.


Descargar

Para concluir: No se comprometa con la exactitud de los datos. Su empresa necesita datos en los que pueda confiar

La calidad de los datos es el objetivo. La precisión de los datos es el resultado. Con los recursos humanos y tecnológicos adecuados, su empresa estará en mejor posición para entrar en el futuro con confianza.

Cómo funcionan las mejores soluciones de concordancia difusa de su clase: Combinando algoritmos establecidos y propios


Descargar

Inicie su prueba gratuita hoy mismo

¡Vaya! No hemos podido localizar tu formulario.

In this blog, you will find:

Try data matching today

No credit card required

"*" señala los campos obligatorios

Hidden
Hidden
Hidden
Hidden
Hidden
Hidden
Hidden
Hidden
Hidden
Este campo es un campo de validación y debe quedar sin cambios.

Want to know more?

Check out DME resources

Merging Data from Multiple Sources – Challenges and Solutions

¡Vaya! No hemos podido localizar tu formulario.