Blog

Guía rápida para la depuración de datos

Tras haber proporcionado soluciones de purga de fusiones a clientes durante más de una década, consideramos que las operaciones de purga de fusiones son una función esencial en operaciones empresariales como el marketing de correo directo, la resolución de entidades y la obtención de versiones de fuente única de verdad. Sin embargo, para muchas organizaciones, el proceso de depuración de fusiones sigue limitándose a las funciones y técnicas de Excel, que apenas sirven para satisfacer las necesidades de datos cada vez más complejas.

Esta guía dirigida a los usuarios de TI y de la empresa desmitifica el proceso de purga de fusiones y le ayuda a comprender por qué sus equipos no pueden seguir confiando en las fusiones y purgas mediante Excel. Los puntos clave de esta guía serán:

    • ¿Qué es la purga de fusión?
    • ¿Cómo se hace tradicionalmente la purga de fusiones?
    • Creación de una estrategia de purga de fusiones bien pensada
    • Procesos empresariales que pueden mejorarse con la purga de fusiones
    • Creación de un registro dorado a través de la supervivencia de los datos
    • Mejores prácticas de purga de datos

Vamos a sumergirnos.

¿Qué es una función o proceso de purga de fusión?

Como sugiere el término, la purga de fusiones se refiere al proceso de combinar múltiples fuentes de datos mientras se eliminan simultáneamente los duplicados y los registros erróneos de la fuente de datos.

Por ejemplo, observe la siguiente imagen:

Observe que tiene tres registros duplicados con múltiples problemas de calidad de datos de un individuo. Cuando se aplica una función de purga de fusión de datos a este registro, se transformará y devolverá una versión limpia y singular como la imagen que se muestra a continuación:

A este registro se le añadió una nueva columna [Industry], que estaba almacenada en otra fuente de datos. Después de fusionar y purgar los duplicados de dos fuentes de datos, el resultado es una vista consolidada del registro de la entidad.

El resultado de una función de purga de fusión es la creación de registros que contendrán nombres únicos, direcciones e información adicional que servirá para el propósito comercial de los datos. En este caso concreto, los datos anteriores, una vez optimizados, sirven de registro fiable para que los responsables de marketing los utilicen en las campañas de correo.

¿Cómo se hace históricamente la purga de fusiones?

En la mayoría de las empresas actuales, los equipos siguen utilizando Excel para gestionar sus registros. Los usuarios de la empresa cortan, pegan y concatenan manualmente múltiples columnas de datos procedentes de fuentes dispares para crear registros precisos. Se pierden días y semanas en fusionar y depurar cientos de miles de registros. Esto no tiene en cuenta los errores humanos que se producen en el momento de la fusión/purgado o de los sucesos perjudiciales, como los fallos de software.

Además de la ineficacia operativa, el factor clave que hace que el uso de Excel sea contraproducente es la creciente complejidad de los datos. Las empresas de hoy en día manejan algo más que datos básicos de contacto. Una entidad puede tener registros adicionales como:

Y así sucesivamente.

Es prácticamente imposible gestionar todos estos matices de datos mediante la aplicación manual de funciones y fórmulas de Excel. De ahí que sea necesario salirse del carro de Excel y ver otras opciones que permitan una complicada fusión y depuración de datos, manteniendo la eficiencia operativa al máximo.

Creación de una estrategia de purga de fusiones bien pensada

Fusionar y depurar una base de datos puede ser una tarea que requiera mucho tiempo y sea propensa a errores, por lo que es esencial tener una estrategia bien pensada antes de implementarla.

Aquí tienes una guía rápida paso a paso:

  1. Integración de datos de múltiples fuentes: Fusionar diferentes bases de datos con varias fuentes (SQL server, MySQL, Excel, ODBC, etc.) y combinarlas en una estructura común es el primer paso del proceso de fusión. Necesitará una herramienta de purga de fusión como DataMatch Enterprise para importar, combinar y exportar a los formatos de base de datos más comunes. Además, también se pueden mapear automáticamente campos similares de diferentes fuentes de datos.
  1. Identificación de duplicados: La mayor amenaza para la exactitud de los datos son los datos duplicados. Hay que estar muy atento para mantener los duplicados -ya sean individuos, hogares o empresas- fuera de la base de datos, especialmente cuando se combinan varias listas para un envío. Los duplicados se identifican mediante el uso de coincidencia difusa, identificación de acrónimos (por ejemplo, International Business Machines a IBM) limpieza y estandarizar los datos antes de la comparación y aplicar las bibliotecas para la estandarización, especialmente para los nombres de pila como (Jon, Jonathan, Johny, etc.) Si está utilizando una herramienta de purga de fusión automatizada, no tiene que preocuparse de aplicar ninguno de estos mecanismos manualmente.
  1. Cotejo de datos para combinar y depurar: Excel hace mal el cotejo de datos. Aunque puede eliminar las coincidencias exactas definitivas, no puede identificar los registros probabilísticos, como el uso de apodos para una persona. Las herramientas de la función de fusión tienen capacidades avanzadas de cotejo de datos que permiten la coincidencia de registros incluso si el nombre y los apellidos varían. Por ejemplo, John Smit puede ser la misma persona que Johnny S. En los casos en los que la ortografía y las abreviaturas son instantáneas, tendrá que preparar los datos primero antes de someterlos a un proceso de cotejo.
  1. Saber qué registros conservar: Una vez que haya marcado los registros como duplicados, limpiado y estandarizado sus datos, puede decidir qué registros conservar y cuáles «purgar». Este proceso, también conocido como supervivencia de datos, le permite crear registros limpios y definitivos de sus datos.
  1. Siga optimizando su lista: La actividad de purga de la fusión no es una actividad de una sola vez. A medida que adquiera datos de múltiples fuentes y siga ampliando el panorama de los clientes, tendrá que seguir fusionando y depurando sus registros. Sin embargo, una vez que tenga el registro principal, todo lo que tiene que hacer es compararlo con el registro 2, 3, 4, etc. para seguir enriqueciendo sus datos.

Un software de depuración de fusiones será fundamental para ayudarle a ejecutar esta estrategia; sin embargo, según nuestra experiencia, el mejor resultado es aquel en el que usted define previamente los registros que necesita y simplemente utiliza la herramienta para realizar la correspondencia, la eliminación de datos y la limpieza. Cuanto más definidos estén sus objetivos de fusión/purga, más eficiente será el uso de la herramienta para alcanzar estos objetivos de forma rápida y eficaz.

Cómo el proceso de purga de fusiones optimiza el marketing y la venta directa

La fusión/depuración es una de las funciones de procesamiento de datos más importantes que repercute de forma extrema en los objetivos, las tareas y las metas de marketing de una empresa. Es obvio que con el aumento de la complejidad de los datos, querrá optimizar sus listas y registros para maximizar los objetivos de marketing, servicio y personalización de los clientes.

A lo largo de los años, hemos trabajado con varios clientes de la lista Fortune 500 para procesar sus datos y ayudarles a sacar el máximo provecho de un objetivo de fusión/purga. Las empresas que utilizan una herramienta de purga de fusiones pueden optimizar sus listas de marketing y venta directa de múltiples maneras, como se indica a continuación:

1. Segmentar sus listas hasta la T

Una actividad de fusión/depuración no consiste únicamente en combinar y deduplicar registros. Se trata principalmente de optimizar las listas. Le gustaría tener la capacidad de probar diferentes segmentos, fusionar y purgar diferentes listas y registros e identificar cuáles de sus listas son la actividad que contribuye a los ROIs esperados y a los objetivos de marketing.

Por ejemplo, querrá segmentar su lista de marketing por correo electrónico en categorías de productos o servicios. Digamos que tiene una lista activa de suscriptores interesados en los productos tecnológicos de su sitio de comercio electrónico, luego otra lista interesada en productos para padres y así sucesivamente. Las herramientas de purga de fusión le permiten segregar, crear nuevos registros, guardar los antiguos y probarlos sin limitaciones.

2. Crear sus propias reglas de combinación y definiciones de coincidencia

Las reglas de combinación hacen referencia a las instrucciones que indican si se desea cotejar los duplicados a nivel individual (es decir, la misma persona en la misma dirección), a nivel de hogar (personas con el mismo apellido y la misma dirección) o a nivel de dirección (todas las personas de esa dirección, independientemente del apellido). Además, también puede crear sus propias reglas si quiere hacer coincidir en diferentes niveles, relevantes para su objetivo empresarial. Por ejemplo, algunos usuarios empresariales quieren cotejar su lista a nivel de comunidad, de organización (todos los nombres de la organización) o incluso a nivel de ingresos.

Al asignar diferentes reglas y definiciones de fusión, estás tomando decisiones informadas en lugar de lanzar un dardo en la oscuridad. Además, estas reglas también le ayudarán a comprender las lagunas de sus datos y le permitirán obtener una cifra real (por ejemplo, descubrir que su lista puede tener sólo 4.000 nombres tras la depuración, frente a su previsión de 7.000 nombres).

3. Cotejar las listas con la normativa sobre el cumplimiento de los datos

La seguridad de los datos es una de las principales razones por las que las empresas necesitan herramientas de fusión y depuración de datos. Hay múltiples ejemplos de grandes nombres que han sido multados por el gobierno por no cotejar sus listas con las listas de sanciones de Estados Unidos y otras bases de datos autorizadas.

Además, también puedes estar limitado por las leyes del GDPR, por lo que si tienes una lista de suscriptores que no quieren recibir correos o que se almacenen sus cookies, no puedes violar eso y enviarles correos. Para las pequeñas y medianas empresas, el cumplimiento de los datos es de vital importancia.

4. Verifique y valide sus datos de dirección con una base de datos autorizada

Los datos de las direcciones son uno de los componentes más difíciles de una fuente de datos. Es imprescindible verificar su lista de direcciones con una base de datos autorizada (como el USPS, por ejemplo) para garantizar la autenticidad de sus datos. Además, no es raro que una entidad tenga varias direcciones, la mayoría de las cuales podrían ser falsas, no verificadas y no válidas. Tiene sentido entonces validarlos y verificarlos durante el proceso de fusión y purga para poder deshacerse de los obsoletos y obtener el correcto para su uso.

Hemos cubierto cómo puede obtener la lista de correo perfecta en detalle también que puede comprobar.

5. Reducir los costes de comercialización y aumentar la eficiencia

El objetivo final de cualquier actividad de procesamiento de datos es reducir los costes, aumentar el rendimiento de la inversión y maximizar la eficiencia operativa. El marketing es el departamento de una organización que incurre en la mayor parte de los costes, en términos de campañas de correo, campañas de medios sociales, campañas de boletines, campañas de correo postal y muchos otros. Puede reducir significativamente los costes de estas campañas dirigiéndose a listas seleccionadas y eliminando los duplicados.

Por ejemplo, enviar tres correos a un usuario en tres direcciones diferentes, o enviar uno tres correos a tres usuarios en la misma dirección es un desperdicio y también un gran golpe a sus costes operativos. Sólo los correos devueltos le costarán millones de dólares, por no hablar de los clientes enfadados a los que no les gusta recibir varios boletines o correos promocionales de una empresa.

La fusión y depuración de datos es algo más que una rápida eliminación de datos. Para sacar el máximo partido a sus datos, debe utilizar todas las herramientas disponibles y planificar con antelación. Cuanto más planifiques y conectes tus listas con tus objetivos, más provecho sacarás de tu próxima fusión/purga.

Supervivencia de los datos y creación del Golden Record

El proceso de purga de la fusión le permite identificar y eliminar los duplicados, dejándole con registros limpios. Pero, ¿cómo saber qué registro debe guardarse y cuál debe trasladarse?

Por ejemplo, ¿cómo saber cuál es la dirección correcta de una entidad que hay que conservar si tiene tres direcciones diferentes? La respuesta a esto es «inteligente», el establecimiento de reglas. En este caso concreto, puede establecer una Regla más reciente. Cualquier dirección que sea la más reciente registrada de la entidad se actualizará utilizando la regla más reciente.

Esta parte de la fusión de datos es fácil.

Lo más difícil es cómo replicar esta información en varias bases de datos que pueden estar compuestas por direcciones antiguas. ¿Cómo se aseguraría de que la dirección de su entidad está actualizada en el CRM, el ERP y otras fuentes de datos de su organización?

Mientras que antes esto significaba otra ronda de fusión/purga, con la disponibilidad de las opciones de Supervivencia de Datos en la mayoría de las herramientas de fusión/purga, se ha vuelto fácil.

Sólo tienes que seleccionar las columnas que quieres guardar, junto con las fuentes en las que quieres guardar los datos y la plataforma te permitirá sobrescribir estos datos en tus nuevos registros. La supervivencia de los datos mediante una plataforma como DataMatch Enterprise no sólo es más fácil, sino que también ahorra tiempo y accesibilidad.

Esta capacidad de obtener una visión precisa, completa y más reciente de su registro de clientes suele denominarse Registro Dorado y es la meta más preciada de los objetivos de gestión de datos de una organización. Y ahora es mucho más fácil hacer que esto sea posible.

Cómo fusionar datos de purga para crear registros dorados

Para saber más, vea cómo hemos ayudado a las empresas a combinar datos de múltiples fuentes para crear el registro perfecto.


Descargar

Mejores prácticas de purga de datos

Independientemente de su negocio, industria o tamaño de la empresa, una iniciativa de fusión/purga sirve como base de sus objetivos basados en datos. Así, mientras que históricamente el ejercicio de fusión/depuración sólo se limitaba a combinar y eliminar, hoy ha evolucionado hasta convertirse en un potente mecanismo que permite a los usuarios profundizar en sus conjuntos de datos.

Aunque el proceso se ha automatizado en gran medida con el uso de herramientas avanzadas de purga de fusiones, los usuarios seguirán necesitando mantener las mejores prácticas. Recomendamos a nuestros clientes que:

  • Centrarse siempre en la calidad de sus datos: Los datos deficientes son un reto. No puede dar sentido a sus datos si están plagados de errores tipográficos, credenciales falsas, direcciones no válidas y contenido desordenado. Antes de pensar en realizar una fusión y depuración, siempre hay que limpiar y normalizar los datos. Facilita el proceso de deduplicación. Si vas a desduplicar primero, sin limpiar los datos, acabarás frustrado y decepcionado con los resultados.
  • Tenga siempre un plan realista: Ya hemos mencionado el plan varias veces, pero no podemos dejar de reiterar este punto: es necesario tener un plan de fusión/purga. Si la simple fusión de datos no es lo que busca y entiende las posibilidades ilimitadas de utilizar una herramienta para llegar a la n-ésima de la segmentación de la lista, entonces necesita establecer un plan que evalúe el tipo de registros que quiere fusionar y purgar.
  • Optimice su modelo: Por lo general, después de la primera ronda de fusión/purga, tendrá una mejor idea de su modelo de datos. Por ejemplo, puede saber qué nombres se abrevian o se convierten en apodos. Conocerá los criterios de concordancia, si quiere aflojar o apretar la concordancia (por ejemplo, concordancia individual frente a concordancia de la misma dirección). Una vez que tenga un conocimiento preliminar de este modelo, podrá utilizar esta información para hacer indicaciones sobre el rendimiento de la campaña, los KPI y reducir el tiempo dedicado a la siguiente actividad de fusión/purga.
  • Mantenga un registro de sus listas: Purgar una lista no significa eliminarla por completo. El software y las herramientas de fusión/depuración de datos le permiten guardar sus registros y mantener una base de datos de todos los cambios que ha realizado en su lista. Por ejemplo, en un registro, su cliente puede tener la dirección A y ahora puede haberse mudado después de casarse. Sus registros para la misma persona mostrarán la dirección B. ¿Significa eso que se elimina la dirección A? No. En su lugar, actualizará sus registros fusionando la dirección B en, por ejemplo, una nueva columna que indique la dirección actual. También puede purgar la dirección A y crear un nuevo registro con la dirección B, manteniendo el antiguo registro guardado. Esta inteligencia creciente puede ser decisiva para ayudarle a comprender el comportamiento demográfico.
  • Intentar mantener una única fuente de verdad: La información dispar sobre los datos de sus usuarios les hará perder tiempo y esfuerzo a usted y a su equipo. El mejor uso de una función de fusión/purga es crear una única fuente de verdad o crear una única vista de cliente que contenga todo lo que se sabe sobre el cliente y es necesario mantenerla siempre actualizada. Recibirá información sobre su usuario desde múltiples silos de datos, por lo que tendrá que asegurarse de que los antiguos y los nuevos estén bien alineados.

Esta fuente única de verdad puede obtenerse mediante el cotejo y la fusión de datos entre múltiples conjuntos de datos, dentro de los conjuntos de datos y entre los conjuntos de datos. Es decir, puedes hacer coincidir el registro A [customer name] del conjunto de datos 1 [Billing data] para fusionarse con el registro A [customer name] del conjunto de datos 2 [Sales data] o Registro A [customer name] con el registro B [customer surname] del conjunto de datos 1 y así sucesivamente.

Utilización de una herramienta de purga de fusión de autoservicio

Una de las soluciones más eficaces y comunes para crear el Golden Record son las herramientas de purga de fusión que pueden ayudarle a sobrescribir los registros antiguos con información nueva utilizando una función de supervivencia de datos.

Un software de purga de fusión de autoservicio permite a los usuarios de la empresa y a los profesionales corporativos fusionar/purgar sus datos fácilmente sin necesidad de una curva de aprendizaje pronunciada o de lenguajes de programación.

La herramienta está diseñada para ayudar a los usuarios empresariales:

  • Preparar los datos evaluando los datos para detectar errores y la coherencia de la información
  • Limpiar y normalizar los datos de acuerdo con las reglas de negocio definidas>
  • Cotejar varias listas mediante una combinación de algoritmos propios y establecidos
  • Elimine los duplicados con una precisión del 95 al 100%.
  • Crear registros de oro y obtener una única fuente de verdad

y mucho más.

Estas herramientas se están convirtiendo en la solución estrella a un viejo problema de dependencia de complejos procesos informáticos para fusionar/purgar datos. En una época en la que la automatización es la clave del éxito empresarial, las empresas no pueden permitirse esta dependencia y retraso en la optimización de los datos.

Conclusión – Utilice una solución de purga de fusión para crear la fuente de verdad perfecta

Sus datos son un activo valioso y, como todo activo, hay que cuidarlo. Las empresas de hoy en día están muy centradas en adquirir más datos y aumentar su «colección», pero si los datos están inactivos y ocupan un costoso espacio de almacenamiento o de CRM, es necesario purgarlos. Puede simplificar un proceso complejo utilizando un software de purga de fusión que le permita fusionar sus fuentes de datos y crear registros valiosos.

Cómo funcionan las mejores soluciones de concordancia difusa de su clase: Combinando algoritmos establecidos y propios


Descargar

Inicie su prueba gratuita hoy mismo

¡Vaya! No hemos podido localizar tu formulario.

In this blog, you will find:

Try data matching today

No credit card required

"*" señala los campos obligatorios

Hidden
Hidden
Hidden
Hidden
Hidden
Hidden
Hidden
Este campo es un campo de validación y debe quedar sin cambios.

Want to know more?

Check out DME resources

Merging Data from Multiple Sources – Challenges and Solutions

¡Vaya! No hemos podido localizar tu formulario.