Hacer frente a los problemas de calidad en los datos relacionados con el cliente

Al profundizar en datos de sus clientes para construir campañas de marketing o para buscar ideas sobre su base de clientes, que inevitablemente le enfrenta con la mala calidad de los datos, a veces llamado datos sucios

Conteúdo

. Su base de datos del cliente se construye a partir de datos se alimenta de una gran variedad de fuentes, incluyendo los sistemas internos de la empresa, así como los proveedores de datos de terceros. Los datos de estos sistemas varía en calidad, frescura y consistencia.

Los nombres y direcciones pueden ser formateados de manera diferente en diferentes sistemas. Y cambian con el tiempo, por lo que mantenerlos actualizados es tan importante.

Pero ese tipo de variación en los datos no es único a la información de contacto del cliente. Su base de datos está lleno de potenciales minas de calidad de datos. Al pensar críticamente acerca de los datos que está analizando, puede evitar la interpretación inexacta o engañosa de datos de sus clientes.

Saque la basura (de datos)


El enfoque ideal es analizar cuidadosamente los datos antes de que incluso se ha cargado a su base de datos. De esa manera usted puede corregir algunos problemas antes de que puedan estropear su análisis. En algunos casos, puede que tenga que rechazar de hecho los datos de su base de datos si no cumple con ciertos estándares de calidad.

Es necesario analizar cuidadosamente todos los elementos de datos individuales. Compruebe que está en el formato correcto, sin duda. Pero también comprobar que cada valor realmente tiene sentido. Estos formatos y valores razonables son diferentes para cada elemento de datos.

Por ejemplo, no es claramente un problema si usted tiene un montón de clientes cuya edad se muestra como 99. Eso es probablemente una indicación de que la edad del cliente no estaba disponible, y el 99 era un valor por defecto en el sistema de origen. Este tipo de cosas sucede con frecuencia con los datos de la caja registradora relacionados con las compras de alcohol. Los cajeros se ven obligados a introducir una fecha de nacimiento para completar la transacción, pero a menudo ni siquiera se hacen la pregunta. Simplemente clave en un valor predeterminado.

La edad es algo que es posible que desee utilizar para tomar las medias o hacer otros cálculos. El hecho de que este valor por defecto parece superficialmente como una edad real significa que puede arruinar esos cálculos. En este caso, es una idea mucho mejor para sustituir el valor por defecto con un valor perdido o nulo valor. Prácticamente todos los motores de bases de datos permiten este tipo de valor.


La mayoría de los motores de informes y algunas técnicas de modelización estadística son muy adeptos a hacer frente a estos valores nulos. Algunas técnicas estadísticas, sin embargo, requieren que se reemplace esos valores perdidos con algún valor medio o excluir los registros por completo. En cualquier caso, sabiendo que el valor que falta es mejor que por error suponiendo que el valor es significativa.

Tenga cuidado con los datos obsoletos

La edad del cliente es un buen ejemplo de otro tema que pueda encontrar. El tiempo pasa, como dice el refrán. Si ha cargado un registro de cliente hace 5 años que mostró el cliente como de 35 años de edad, que la información ya no es exacto. Su primer impulso podría ser la de resolver el problema mediante la construcción de un proceso para actualizar las edades de los clientes cada año. Eso funciona en teoría, pero en la práctica puede ser bastante complicado. Cada vez que actualice la edad, usted tiene que mirar en que los datos vienen y cuándo.

Un mejor enfoque consiste en almacenar los datos de una manera tal que el problema desaparece. Usted puede convertir fácilmente la edad de un año de nacimiento cuando inicialmente se carga el registro. A continuación, crear otro elemento de datos que contiene esencialmente el valor año actual año de natalidad menos. Voil # 225- - ningún mantenimiento necesario. El motor de base de datos siempre sabe qué año es, por lo que este valor de edad nunca tendrá que ser actualizado.

Al pensar críticamente acerca de sus datos antes de que se carga en su base de datos, puede evitar muchos problemas de calidad de datos. Pero no se dé por satisfecha. Sistemas de origen cambian con el tiempo, y estos cambios provocan cambios posteriores en los datos de forma se pasa a la base de datos de clientes. Es una buena idea para auditar de manera proactiva sus datos de vez en cuando para comprobar si hay datos sospechosos.




» » » » Hacer frente a los problemas de calidad en los datos relacionados con el cliente