Krypton Solid

La última tecnología en raciones de 5 minutos

¿Misión imposible? El proceso de gobernanza de datos adquiere ‘big data’

«Big data» ofrece de manera atractiva la promesa de ventajas competitivas para las empresas que pueden utilizarlo para descubrir secretos sobre los clientes, el uso del sitio web y otros elementos clave de sus operaciones comerciales. Pero debe prevalecer cierta precaución: sin un proceso de gobernanza de datos adecuado, el entusiasmo por encabezar proyectos de big data puede desencadenar un lío de problemas, incluidos datos engañosos y costos inesperados.

Sin embargo, el papel de la gobernanza de datos para mantener en orden las casas de big data apenas está comenzando a emerger de las sombras. Los macrodatos, que por lo general involucran grandes cantidades de información no estructurada, es un fenómeno muy reciente que se ha abierto camino en muchas organizaciones bajo el radar del departamento de TI. Como resultado, la gobernanza de los entornos de big data se encuentra en una etapa incipiente y existen pocas prescripciones generalizadas sobre cómo hacerlo de manera eficaz, según los analistas de gestión de datos.

«El big data es un área tan nueva que nadie ha desarrollado políticas y procedimientos de gobernanza», dijo Boris Evelson, analista de Forrester Research Inc. en Cambridge, Massachusetts. «Hay más preguntas que respuestas».

Un problema fundamental es que los grupos de big data están más orientados a la exploración y el descubrimiento de datos que a los informes y análisis convencionales de inteligencia empresarial, añadió Evelson. Eso, dijo, crea un círculo vicioso: «Los datos no se pueden gobernar hasta que se modelan, pero no se pueden modelar hasta que se exploran [by data analysts]. «

Los programas de gobernanza de datos proporcionan un marco para establecer políticas de uso de datos e implementar controles diseñados para garantizar que la información siga siendo precisa, coherente y accesible. Claramente, un desafío importante en el proceso de gobernar big data es categorizar, modelar y mapear los datos a medida que se capturan y almacenan, particularmente debido a la naturaleza no estructurada de gran parte de la información.

«Para obtener información empresarial significativa a partir de big data, es necesario hacer todo tipo de cosas, como el análisis semántico de los datos, que luego se convierte en modelos conceptuales u ontologías», dijo Malcolm Chisholm, presidente de la consultora de gestión de datos AskGet Inc. en Holmdel, Nueva Jersey «Y todo eso implica un montón de cosas de gobernanza».

Buscando pistas sobre big data
La dificultad es que todo lo relacionado con el proceso de gobernanza de datos para big data es tan nuevo. «Hay una gran inmadurez cuando se habla de big data, y la mayoría de los administradores de datos realmente no tienen ni idea de esto», dijo Chisholm.

Los macrodatos, que también pueden incluir grandes cantidades de datos de transacciones estructurados, tienen características idiosincrásicas. Se define comúnmente de acuerdo con las tres V: volumen, variedad y velocidad. Forrester agrega variabilidad a su definición, mientras que la consultora rival Gartner Inc. añade complejidad.

Además, los datos a menudo provienen de fuentes externas y su precisión no siempre se puede validar fácilmente; Además, el significado y el contexto de los datos de texto no son necesariamente evidentes por sí mismos. Y en muchos casos, se almacena en sistemas de archivos Hadoop o bases de datos NoSQL en lugar de almacenes de datos convencionales. Para muchas organizaciones, los macrodatos implican una curva de aprendizaje colectiva para todos los interesados: administradores de TI, programadores, arquitectos de datos, modeladores de datos y profesionales del gobierno de datos.

Haciendo demasiado peligro
Una de las mayores dificultades para hacer frente a la avalancha de big data y tratar de gobernar es perder de vista las prioridades comerciales, dijo Rick Sherman, fundador de Athena IT Solutions, una consultora en Stow, Mass.

Por ejemplo, gran parte de los datos no estructurados que capturan las organizaciones proviene de las redes sociales y, por lo general, solo una pequeña parte de esa información tiene un valor significativo, según Sherman. «Tratar de administrar o controlar todo en datos no estructurados sería un gran error», dijo, advirtiendo que las empresas podrían terminar perdiendo tiempo y recursos en datos sin importancia.

Danette McGilvray, presidenta de Granite Falls Consulting Inc. en Newark, California, también dijo que los macrodatos pueden ser un gran sumidero de tiempo para los equipos de gestión y gobierno de datos si no se manejan de manera inteligente y sensata. «La única forma en que podemos averiguar si vale la pena administrar los datos es si sabemos cuáles son las necesidades comerciales», dijo McGilvray. «Cuando se trata de big data, todavía necesitamos que nos lo recuerden».

Gwen Thomas, fundadora y presidenta de The Data Governance Institute LLC, una empresa de consultoría y capacitación en Orlando, Florida, recomienda que los juicios sobre la calidad de los datos entrantes deben ser una de las principales prioridades para los gerentes de gobierno de datos que buscan dominar Big Data. Los controles proactivos de la calidad de los datos pueden ahorrar mucho tiempo y dolor en el futuro, dijo.

La alineación adecuada evita datos inconexos
Thomas agregó que con frecuencia se subestima la importancia de mapear los nuevos datos con los datos de referencia que las organizaciones usan para categorizar la información. Alinear los macrodatos con los datos de referencia existentes es «un gran detalle», dijo. «De hecho, si esto no se hace correctamente, la información que resulta del procesamiento de big data puede ser engañosa, inexacta o incompleta».

Para ayudar a garantizar que los datos se mapeen correctamente, la tarea debe asignarse a un arquitecto de datos senior en lugar de dejarla en manos de un modelador de datos con menos experiencia o alguien fuera de TI, aconsejó Thomas.

Chisholm dijo que los gerentes de gobernanza de datos también deberían tener como prioridad tener conversaciones productivas sobre los modelos de datos aplicables con los programadores y usuarios comerciales que a menudo inician instalaciones de big data. Sin embargo, tales discusiones deben comenzar con una apreciación firme de las tecnologías Hadoop y NoSQL y en qué se diferencian de las bases de datos relacionales, y una comprensión de la necesidad de un enfoque unificado para administrar y gobernar big data.

Lo que las empresas deben evitar, dijo Chisholm, es dejar que los programadores y usuarios sigan su propio camino y aporten perspectivas basadas en silos al proceso de configuración de sistemas de big data y realizar el trabajo de mapeo y modelado de datos requerido. Eso podría cargarlos con grandes facturas de reparación, instalaciones inadecuadas que no producen los beneficios comerciales esperados e inversiones desperdiciadas en sistemas innecesarios.

Roger du Mars es un escritor independiente con sede en Redmond, Washington. Ha escrito para publicaciones como Tiempo, EE.UU. Hoy en día y El Boston Globe, y anteriormente fue el jefe de la oficina de Seúl, Corea del Sur, Asiaweek y el Poste de la mañana del sur de China.

Deja un comentario

También te puede interesar...

Definición del beneficiario principal

¿Qué es un beneficiario principal? Un beneficiario principal es una persona u organización que es la primera en la fila para recibir beneficios en un testamento, fideicomiso, cuenta de pensión, póliza de seguro de vida

¿Qué es SAP Afaria? – Definición de Krypton Solid

Afaria es una gestión de movilidad empresarial (EMM) plataforma de software. Afaria, que ahora está disponible en versiones locales y en la nube, fue desarrollado originalmente en 1997 por una compañía llamada XcelleNet que luego

Reunión informativa matutina: Inversión china

«The Morning Briefing» es el resumen diario de SmartPlanet de las lecturas obligatorias en la web. Esta mañana leímos sobre inversiones en China. 1.) Jugando duro con inversores chinos. ¿Debería Estados Unidos bloquear la inversión

¿Puedo obtener un préstamo contra mi pensión?

Si tiene un activo, probablemente pueda obtener un préstamo contra él. Tu cheque de pago, tu declaración de impuestos, tu casa, 401 (k) y, sí, incluso tu pensión, si eres una de las pocas personas

Obtenga Win10 ISO de TechBench

He estado leyendo sobre esto durante algún tiempo en TenForums.com, pero finalmente decidí visitar el sitio de MS TechBench durante el fin de semana. Para aquellos que no quieren usar la herramienta de creación de

¿Qué es la fabricación repetitiva?

La fabricación repetitiva (REM) es la producción de bienes en rápida sucesión. Los productos que se crean mediante la fabricación repetitiva siguen las mismas secuencias de producción. La fabricación repetitiva a menudo va de la

Principales sitios deportivos de agosto de 2008

Audiencia del sitio Agosto de 2007 Audiencia de agosto de 2008 Crecimiento, categoría% Deportes33,40542,25226% Yahoo! Deportes8,82018,727112% ESPN10,31411,93616% FOX Sports en MSN6,8247,71413% SI sitios digitales3,9136,49066% CBS Sports5,0925,70812% NFL Internet Network4,6305,6305,6305,63066% 486- 1% AOL Sports 3.9053.9932% Fantasy