Krypton Solid

La última tecnología en raciones de 5 minutos

Elimina datos inconsistentes expulsando a sus malvadas hermanas gemelas

Cada uno de mis clientes sufre terriblemente a manos de las malvadas hermanas gemelas de los datos: definiciones inconsistentes y duplicados. Y una vez que los gemelos malvados se aferran a una organización, es difícil deshacerse de ellos. Como una anaconda de dos cabezas, las hermanas rodean una organización y se aprietan lenta e implacablemente hasta que se apagan las luces.

La mayoría de mis clientes reconocen el valor de los datos, o más bien, el dolor de los datos inconsistentes y de baja calidad. Los ejecutivos corporativos aprenden por las malas que sin BI y datos analíticos confiables, están ejecutando el negocio a ciegas. No pueden medir el interés del cliente en un nuevo producto para modificar diseños o campañas de marketing; no pueden identificar problemas de fabricación o de la cadena de suministro para evitar sobrecostos y retrasos; no pueden pronosticar con precisión las ventas para optimizar los procesos de gestión de inventario y distribución.

Los ejecutivos de negocios también descubren que los datos incorrectos los dejan con los pies en el suelo. No pueden responder con agilidad a las condiciones comerciales cambiantes porque no se dan cuenta de que las condiciones están cambiando. El mercado los toma continuamente por sorpresa y sus estrategias comerciales cuidadosamente planificadas se vuelven obsoletas de la noche a la mañana. Como resultado, permanecen indefensos mientras los veloces competidores pasan a toda velocidad, atrayendo a los clientes que tanto les costó ganar.

El problema es que demasiadas organizaciones no han descubierto cómo acorralar a las hermanas gemelas. A menudo, los ejecutivos culpan al departamento de TI, pensando erróneamente que la gestión de la calidad de los datos es un problema técnico. (¡No lo es!) Luego me llaman a mí, oa otro consultor, para exorcizar a los gemelos malvados para que puedan dirigir sus empresas con una visión 20/20 y la velocidad de los velocistas.

Diferentes vistas de lo que son los datos.

La primera hermana tiene un efecto generalizado, porque genera datos inconsistentes en todas partes. En todas las organizaciones, escucho el mismo refrán: «Obtenemos diferentes respuestas a las mismas preguntas porque la gente define los términos de manera diferente». Irónicamente, los términos más utilizados tienden a ser los que están peor definidos. Una vez escuché a un colega decir: «La pregunta más peligrosa que puede hacerle a un cliente es: ‘¿Cuál es su definición de cliente? ‘»Los ejecutivos de diferentes departamentos a menudo se vuelven bastante molestos al debatir el tema. Para marketing, un cliente es alguien que responde a una campaña; para ventas, es alguien que ha firmado una orden de compra; en finanzas, es alguien que ha pagado una factura. Cada uno tiene razón, pero colectivamente todos están equivocados.

La solución a la inconsistencia de los datos es obvia: un diccionario de datos corporativos que detalla en un inglés sencillo las definiciones de términos y métricas de uso común. Pero crear uno es difícil. Obtener consenso sobre las definiciones está plagado de política: la gente lucha con uñas y dientes para asegurarse de que sus definiciones prevalezcan en el catecismo corporativo.

Para superar la política, el CEO debe nombrar un comité multifuncional de expertos en la materia para priorizar los términos y proponer definiciones para cada uno. Luego, el equipo ejecutivo debe revisar y perfeccionar las definiciones del comité y establecer estándares corporativos. A menudo, esto requiere mucha discusión adicional y lucha libre hasta que los ejecutivos lleguen a un consenso, o más probablemente, a una tregua.

Por lo general, están de acuerdo en no estar de acuerdo. Crean una definición corporativa para cada término y luego agregan los datos departamentales para que se ajusten a las definiciones estándar, al tiempo que mantienen distintas definiciones locales. De esa forma, la organización obtiene una definición singular y cada departamento conserva su visión del mundo. El enfoque funciona siempre que todos usen y se adhieran al diccionario de datos.

Los datos duplican los defectos de propagación

La segunda hermana es más perniciosa que la primera. Ella trabaja subrepticiamente detrás de escena para socavar los valores de los datos. Esta hermana esparce generosamente defectos en las tablas y campos de la base de datos utilizando una variedad de medios: errores de programación y entrada de datos, contratiempos de migración del sistema, reescrituras de sistemas heredados defectuosos y simplemente obsolescencia de datos simples.

Por ejemplo, en una base de datos de clientes, el 5% de los registros se deteriora en calidad cada mes debido a muerte, matrimonio, divorcio y cambio de dirección. Peor aún, un porcentaje aún mayor de registros de clientes genera duplicados inconsistentes, en gran parte porque la mayoría de las organizaciones albergan datos de clientes en múltiples bases de datos que soportan diferentes aplicaciones que capturan diferentes atributos de un cliente en diferentes momentos por diferentes razones. Luego se enfrentan al desconcertante problema de tratar de averiguar si «Joe Daley, 51, de 1 Prescott Lane» es lo mismo que «J. Daley, 53, de 10 Presque Lane» y «Joseph Dailey, 49, de 1 Prescot Ln . «

Mantener los datos armonizados entre aplicaciones y sistemas es difícil. Idealmente, las empresas almacenan datos maestros en una sola aplicación y sistema; de esa manera, nunca se replica ni se desincroniza consigo mismo. Pero la mayoría de las organizaciones generan sistemas y aplicaciones como flores silvestres después de una lluvia primaveral. La única forma confiable de armonizar los registros de los clientes y otros datos transaccionales en dichos entornos es aplicar procesos de gestión de datos maestros (MDM).

Un programa MDM está diseñado para evitar la duplicación de datos inconsistentes. Normalmente, se utiliza un sistema central para almacenar «registros dorados» de datos. El centro de MDM recopila nuevos datos de los sistemas de transacciones y los ejecuta a través de un algoritmo de coincidencia para determinar si ya existen los registros correspondientes. Si es así, el concentrador los actualiza en consecuencia y se asegura de que los datos sean consistentes; si no lo hacen, crea nuevos registros. Luego, pone los cambios a disposición de todas las aplicaciones suscritas en modo por lotes o en tiempo real.

Enjaular a las malvadas hermanas gemelas de datos no es fácil. Pero deben ser confrontados, detenidos, esposados ​​y enviados río arriba para resolver los problemas de calidad de los datos y sentar una base sólida para la generación de informes y análisis. Su negocio depende de ello: sin datos limpios, coherentes y armonizados, las empresas no pueden competir eficazmente en la economía actual.

Sobre el Autor:
Wayne Eckerson es consultor principal en Grupo Eckerson, una empresa de consultoría que ayuda a los líderes empresariales a utilizar datos y tecnología para impulsar mejores conocimientos y acciones. Su equipo proporciona información y asesoramiento sobre inteligencia empresarial, análisis, gestión del rendimiento, gobernanza de datos, almacenamiento de datos y big data. Envíele un correo electrónico a [email protected].

Envíanos un email a [email protected]y síguenos en Twitter: @BizAnalyticsTT.

Deja un comentario

También te puede interesar...

Renunciar a TI | Krypton Solid

Uno de los problemas menores resaltados en la discusión de la semana pasada sobre software de contabilidad disponible para las personas que deseen considerar la conversión a Linux es la existencia de un grupo de

Murdoch 2.0: Noticias de MySpace | Krypton Solid

Las noticias llegaron la semana pasadapor Terry Heaton) que MySpace está ingresando al juego de agregación de noticias en línea. MySpace es, por supuesto, propiedad de News Corporation de Rupert Murdoch, y Murdoch es un

Ganadores y perdedores del acuerdo de Nokia Symbian

Después de una fase de expansión que condujo a la introducción de iPhone, Android, LiMo y JavaFX Mobile, el panorama de la plataforma móvil se está reduciendo nuevamente. Nokia anunciado hoy tiene la intención de

Definición de puntero

¿Qué es un apostador? Un «puntero» es la jerga británica para un especulador o comerciante que espera obtener una ganancia rápida en los mercados financieros, que se usa principalmente en el Reino Unido. Los apostantes

MS / DOJ: Historia y posibles resultados

¿CUÁL ES LA HISTORIA DETRÁS DEL CASO? Microsoft ha tenido un historial de enfrentamientos con el gobierno. Se remontan a 1990, cuando la Comisión Federal de Comercio inició una investigación «no pública» sobre la asociación

Torvalds: GPLv3 es «solo otra licencia»

La gestión de derechos digitales y la Licencia Pública General hacen que se cambien mucho «aire caliente», pero no son «un gran problema», según el creador de Linux, Linus Torvalds. DRM es una tecnología utilizada

Cómics de la semana # 215

Cómics de la semana # 215 Cada semana presentamos un conjunto de cómics creados exclusivamente para WDD. El contenido gira en torno al diseño web, los blogs y las situaciones divertidas que encontramos en nuestra

NHS: los retrasos de TI no nos frenarán

«¿Qué significa una pequeña ‘reprogramación’ cuando tienes una década? El NHS ha reconocido que partes de su masivo proyecto de modernización de TI están retrasados, pero insiste en que el lento progreso en algunos proyectos

El secreto de los «nuevos» centros de inicio

Aunque puede parecerse a Google Fiber estimuló una nueva escena de startups en Kansas City y otras áreas metropolitanas más pequeñas en los Estados Unidos, la realidad es que los centros de startups no aparecen

S’pore recibe una incubadora SaaS | Krypton Solid

SINGAPUR – La primera incubadora de SaaS (software como servicio) del país abrió sus puertas a los desarrolladores con la esperanza de dar una oportunidad a las nuevas empresas de SaaS. Llamado AxSaaS Incubation Center