Blog

Utilización de la concordancia de datos para resolver los problemas de resolución de identidades

Written by lbarrera
Published on febrero 2, 2021

Last Updated on marzo 8, 2022

Los consumidores interactúan con una marca a través de cientos de puntos de contacto entre dispositivos, plataformas y canales. Durante el viaje del comprador, los consumidores utilizan 3-4 dispositivos conectados a Internet. Y para 2021, se espera que la cifra aumente a 13 dispositivos. Este aumento exponencial del uso de los dispositivos indica también un aumento repentino de los datos. Esta afluencia de datos está exigiendo a las organizaciones que dispongan de estrategias de limpieza de datos adecuadas para que sus datos organizativos se mantengan siempre actualizados, precisos y coherentes.

Las empresas recopilan estos datos de varios puntos de contacto con el consumidor y los utilizan para diseñar experiencias mejores y personalizadas para ellos. Y si los datos se recopilan mediante múltiples sistemas dispares -lo que ocurre normalmente hoy en día-, resulta crucial realizar la resolución de identidades o entidades.

Resolución de identidades: proceso de relacionar múltiples registros sobre la base de «identificadores únicos», de manera que todos los registros coincidentes representen a un único usuario/entidad.

El proceso de resolución de identidades produce una visión única, precisa y de 360 grados de cada entidad, incluyendo todos sus registros de comportamiento, transacciones y compromisos conectados entre sí. De este modo, podrá comprender todo el alcance del usuario en su conjunto, en lugar de intentar dar sentido a información dispar.

¿Por qué necesita su organización la resolución de identidades?

Las organizaciones suelen malinterpretar la importancia real de la resolución de entidades para su empresa. No se trata sólo de dirigirse a un cliente potencial o a un cliente con su nombre de pila correcto en un correo electrónico. Se trata más bien de dar un paso más consciente para conocer mejor a sus clientes potenciales y diseñar experiencias personalizadas para ellos. Se trata de identificar patrones y comportamientos asociados a un mismo usuario a través de varios sistemas de compromiso, y utilizarlo para maximizar el impacto de la marca y la conversión de clientes potenciales.

Como se menciona en el estudio de Forrester: ¿Está su programa de identidad construido sobre un castillo de naipes? aquí están las 5 principales razones para implementar la resolución de entidades a sus bases de datos:

Perfiles más completos de sus clientes potenciales, prospectos y clientes, que le permiten diseñar experiencias mejores y personalizadas según sus patrones de comportamiento y preferencias.
Mejores controles de datos y seguridad sobre sus datos organizativos, que le permiten seguir las normas y directrices de cumplimiento de datos, como GDPR, CCPA e HIPAA, etc.
Oportunidades para realizar ventas adicionales y cruzadas de sus productos y servicios a los clientes existentes, y dar forma a la trayectoria del cliente ofreciendo recomendaciones pertinentes.
Medición más precisa y eficaz del marketing, como los clientes potenciales cualificados, las tasas de conversión de clientes potenciales, el retorno de la inversión en marketing y el compromiso de los clientes, etc.
Mejora de los análisis de datos que ofrecen una visión precisa, completa y coherente de la imagen, la percepción y la experiencia de la marca.

¿Cómo se realiza la resolución de identidades?

Un proceso de resolución de identidad relaciona tres tipos de información sobre un individuo:

Información terrestre: implica la información de contacto personal de un usuario, como el nombre, la dirección de casa y del trabajo, el número de teléfono, etc.
Información de los dispositivos: implica datos de IP u otra información que identifique de forma exclusiva los dispositivos que están asociados a un usuario.
Información digital: incluye direcciones de correo electrónico, perfiles en redes sociales, visitas a sitios web, clics en CTA, descargas de recursos, etc.

El proceso de resolución de la identidad tiene los siguientes cinco pasos:

Paso 1: Identificar las variables que representan una entidad:

Consiste en identificar las diferentes plataformas, canales y dispositivos que utiliza una entidad durante su viaje de compra.

Paso 2: Trazar todas las interacciones de los usuarios

En este paso, la información recopilada en el paso 1 se relaciona para construir varias interacciones o puntos de contacto que un usuario tuvo con su marca.

Paso 3: Construir el recorrido del comprador mediante la concordancia de datos

Ahora que ha identificado todos los puntos de contacto de un usuario, es el momento de relacionar las diferentes interacciones para comprender el recorrido completo del comprador. Este paso requiere que se realice la correspondencia de registros de datos de todas estas interacciones para poder evaluar cuáles de ellas pertenecen a la misma entidad.

En pocos casos, este cotejo de datos es bastante sencillo, ya que siempre hay alguna información que es única para cada registro, como el correo electrónico o la dirección IP. Pero en los casos en los que no existen identificadores únicos, es necesario implementar complejos algoritmos de cotejo de datos para realizar cotejos fonéticos, numéricos o difusos.

Paso 4: Validación de los resultados coincidentes

En este paso, hay que verificar que las interacciones que se etiquetan como pertenecientes al mismo individuo parecen adecuadas, y decidir por las interacciones que quedan sin emparejar.

Paso 5: Crear el disco de oro

Sobre la base de los resultados cotejados y validados, ahora puede crear un registro dorado maestro que sirva como única fuente de verdad que muestre el recorrido completo de sus clientes potenciales, prospectos y clientes. Esto se convierte en el motor de todos sus esfuerzos de marketing y ventas, ya que proporciona una visión precisa, correcta y coherente de los datos.

Desafíos a superar en la resolución de las entidades

El proceso de resolución de la identidad es bastante sencillo. Pero hay múltiples retos que se encuentran al realizar estos pasos. A continuación se enumeran los retos más importantes:

Identificadores únicos ausentes, incompletos o incoherentes

Como se explica en el proceso anterior, todas las interacciones del usuario se relacionan entre sí para construir el recorrido completo del comprador. Esto se lleva a cabo a partir de los campos de datos que identifican de forma exclusiva a la entidad, como la dirección de correo electrónico, la información IP del dispositivo, etc. Pero es bastante difícil tener identificadores únicos completos y coherentes en todos los conjuntos de datos procedentes de varios sistemas de compromiso. A continuación se exponen algunas situaciones que deben resolverse antes de que pueda producirse un cotejo de datos preciso:

Losidentificadores únicos existen pero están incompletos: esto sucede cuando varios sistemas no logran captar los campos de datos de identificación única para algunas interacciones de los usuarios debido a cualquier razón.
Existen identificadores únicos, pero son incoherentes: esto sucede cuando se integran datos de varios sistemas para completar el recorrido del comprador. En este caso, tiene identificadores únicos en cada conjunto de datos, pero no son los mismos. Puede que una aplicación utilice la dirección de correo electrónico para identificar a un usuario, mientras que la otra aplicación utiliza la dirección IP.
Losidentificadores únicos no existen en absoluto: en este caso, hay que combinar diferentes campos para identificar de forma única una interacción. Por ejemplo, el campo nombre junto con el teléfono de contacto o la dirección postal, pueden dar unicidad a un registro de interacción con el usuario.

Datos poco limpios y no estandarizados

La mala calidad de los datos es otro problema común asociado a la resolución de entidades. Para que sus registros sean comparables y puedan resolverse para formar entidades, necesita datos limpios y estandarizados. Para ello, debe asegurarse de que sus registros de datos contienen información precisa, completa, coherente, única, válida y actualizada. Si sus registros de datos no están a la altura de estas seis dimensiones críticas de la calidad de los datos, espere que sus entidades resueltas tengan niveles de precisión muy bajos.

Complejidad computacional

Cuando consideramos la resolución de entidades, significa comparar los registros de datos para evaluar qué registros pertenecen al mismo individuo. En este proceso, cada registro de datos debe compararse con todos los demás registros del mismo conjunto de datos. Y como la mayoría de las organizaciones utilizan múltiples aplicaciones de datos que rastrean las interacciones de los usuarios, un solo registro también se compara con todos los registros presentes en múltiples conjuntos de datos.

Se espera que la complejidad computacional de estas comparaciones crezca de forma cuadrática a medida que aumenta el tamaño de la base de datos. Esto indica que su proceso de resolución de identidades debe llevarse a cabo mediante un sistema de datos que pueda soportar una potencia computacional tan compleja.

Ajuste de los algoritmos de comparación de registros para maximizar la precisión

Dado que los algoritmos de comparación de datos deben ajustarse para lograr la máxima precisión en un conjunto de datos determinado, es un reto abrumador garantizar el menor número de falsos positivos y negativos con sus variables ajustadas.

Uno de los principales problemas de la resolución de entidades es la cantidad de esfuerzo que supone revisar manualmente cada registro clasificado incorrectamente o dejado sin emparejar. Los métodos tradicionales de cotejo de datos que se basan únicamente en algoritmos deterministas hacen poco para aliviar a las empresas de este dilema. Además, no permiten un fácil ajuste fino, lo que dificulta que el usuario obtenga realmente resultados optimizados.

Utilización de un motor de limpieza y cotejo de datos de autoservicio para la resolución de identidades

Repasamos todo el proceso de resolución de identidades, así como los retos que se suelen encontrar durante su aplicación. Se pueden utilizar múltiples soluciones y sistemas para superar estos retos, pero la decisión inteligente es adaptar una herramienta automatizada de autoservicio que realice varios pasos de perfilado de datos, limpieza, correspondencia, deduplicación y fusión de datos, todo junto en una única plataforma.

El cotejo de datos forma parte del marco de gestión de la calidad de los datos de DataMatch Enterprise, que permite a los usuarios cotejar, fusionar y deduplicar registros de múltiples fuentes de datos. Lo que hace que el ISD sea único es su capacidad de permitir la conexión simultánea de múltiples fuentes de datos para su cotejo en todas ellas.

Construido sobre algoritmos inteligentes de aprendizaje automático, DataMatch Enterprise de Data Ladder devuelve una tasa de precisión de coincidencia del 95 – 100%, ya que utiliza varios algoritmos a la vez para evaluar los patrones de datos para posibles coincidencias. El software también permite ajustar las coincidencias, dando al usuario oportunidades ilimitadas para refinar los datos.

Cómo funcionan las mejores soluciones de concordancia difusa de su clase: Combinando algoritmos establecidos y propios

Descargar

Resolución de identidad para las instituciones del gobierno y del sector público

Lea este artículo técnico para ver cómo hemos ayudado a las instituciones gubernamentales y públicas a gestionar los retos de resolución de identidades con nuestra sólida solución.

Descargar

lbarrera

Clean up your data in minutes

Trusted by 700+ data teams worldwide

Try data matching today

No credit card required

"*" señala los campos obligatorios

Want to know more?

Check out DME resources

¡Vaya! No hemos podido localizar tu formulario.

POR CARACTERÍSTICA

POR CASO DE USO

POR INDUSTRIA

NUESTROS PRODUCTOS

SOBRE NOSOTROS

CLIENTES

COMPARAR