Krypton Solid

La última tecnología en raciones de 5 minutos

Las mejores prácticas del catálogo de datos se basan en el trabajo en equipo, la gobernanza y las herramientas

Hace varios años, Uber descubrió que el descubrimiento de datos «era el mayor problema que enfrentaban nuestros usuarios» en las aplicaciones de análisis, según Atul Gupte, gerente de producto de las plataformas de análisis y ciencia de datos de la empresa de viajes compartidos. Una encuesta interna mostró que los científicos de datos y otros usuarios desperdician un promedio de tres horas por semana tratando de encontrar datos relevantes, dijo Gupte: «Eso es vergonzoso».

Las dificultades llevaron a Uber a crear Databook, un sistema de metadatos que funciona como un catálogo de datos. Enumera los conjuntos de datos disponibles y una variedad de información sobre ellos para ayudar a los usuarios a localizar y comprender los datos, dijo Gupte durante una sesión en la Conferencia Strata Data 2019 en Nueva York, donde la gestión de metadatos y las mejores prácticas del catálogo de datos fueron temas de gran discusión.

El equipo de plataformas de datos de la división Crop Science de Bayer AG dio un paso similar después de que los analistas de datos se quejaron de que buscar datos era demasiado complicado. Construyó un sistema llamado Haystack que incluye un catálogo de datos y un glosario empresarial con definiciones de datos. Más de 940.000 objetos de datos ahora se enumeran en el catálogo, dijo Naghman Waheed, líder de plataformas de datos de la unidad, en otra sesión de Strata.

Pero la catalogación de datos puede ser complicada en sí misma. La analista de Forrester Research, Michele Goetz, escribió en una publicación de blog de abril de 2019 que las organizaciones pueden necesitar dos o tres catálogos de datos para almacenar diferentes metadatos para diferentes usuarios. Y en un informe de septiembre de 2019, los analistas de Gartner Guido De Simoni y Ehtisham Zaidi recomendaron el uso de algoritmos de aprendizaje automático para automatizar el proceso de catalogación.

Este manual analiza más de cerca las mejores prácticas, desafíos y tendencias del catálogo de datos. En primer lugar, detallamos el asesoramiento sobre la creación y gestión de catálogos de datos. A continuación, el consultor Andy Hayler explica cómo el aprendizaje automático puede ayudar a los catálogos de datos. Terminamos explorando el concepto de un mercado de datos empresarial basado en software de catálogo de datos.

Deja un comentario

También te puede interesar...

Novedades de Netflix: 28 de junio de 2019

Historias de la ciudad – PBS Bienvenido a su resumen del viernes de las noticias de Netflix, y aunque hay bastantes artículos originales de Netflix salpicados en el rango de esta semana, todos nuestros aspectos

Nokia presenta nuevos servicios móviles

SINGAPUR – Nokia ha introducido dos nuevos servicios destinados a permitir a los usuarios móviles escribir blogs sin problemas, así como explorar y navegar rutas mientras viajan. El fabricante de teléfonos finlandés anunció el lunes

Guardar OpenOffice | Krypton Solid

Recibí una llamada a principios de esta semana del hijo de un amigo cercano. Había recibido un documento de Word que necesitaba abrir con urgencia, y MS Office se negó, quejándose de que estaba dañado

Overwatch viene en Nintendo Switch

El colorido tirador de héroes de Blizzard Supervisión se vuelve más portátil muy pronto. Hoy, durante la presentación de Nintendo Direct, Nintendo reveló que el shooter en equipo se lanzará en Switch el 15 de

3 formas de abordar la explosión de la nube

La explosión de la nube utiliza la gran escala de la nube pública, la disponibilidad bajo demanda y los precios de pago por uso. Permite… organizaciones para trasladar las cargas de trabajo a la nube

Cómo reactivar tu cuenta de Facebook Krypton Solid

¿No pudiste acceder a tu perfil de Facebook durante unos días? ¿Recibió un correo electrónico del equipo de redes sociales número uno del mundo informándole que su cuenta ha sido desactivada? Desafortunadamente puede suceder. Facebook

Red Hat Software vende software gratuito

Red Hat Software Inc. se ganan la vida vendiendo software, software que la gente puede descargar de forma gratuita. Red Hat, con sede en Research Triangle Park, Carolina del Norte, es uno de los varios

¿Qué es Microsoft Dynamic Access Control (DAC)?

El control de acceso dinámico de Microsoft (DAC) es una herramienta de gobierno de datos en Windows Server 2012 que permite a los administradores controlar la configuración de acceso. DAC utiliza políticas centralizadas para permitir

Cómo excluir el contestador Vodafone

En los últimos días has leído mi guía sobre cómo cambiarte a Vodafone y, más que nunca, has decidido qué hacer, has sustituido tu antiguo operador por el «gestor rojo» activando una de las ofertas

Twiki fork, ¿una oportunidad de adquisición?

Una de las primeras historias que escribí aquí fue sobre tenedor del proyecto Mambo CMS. Tres años después, eso es todo Fundación Mambo y el tenedor, llamado Joomla, sobrevive. Está pasando de nuevo, esta vez

Novedades para diseñadores, octubre de 2016

Novedades para diseñadores, octubre de 2016 En la edición de este mes de novedades para diseñadores, hemos incluido herramientas de color, conjuntos de iconos, herramientas de automatización, herramientas de diseño, imprimibles, complementos de Sketch y