Krypton Solid

La última tecnología en raciones de 5 minutos

¿Cuáles son las características principales del software de catálogo de datos?

Los empleados que confían en las herramientas de análisis y BI de autoservicio para tomar decisiones comerciales basadas en datos necesitan acceso a una gran cantidad de datos, pero normalmente no se les permite simplemente extraer datos sin procesar de un lago de datos u otro repositorio; los datos que utilizan deben estar gobernados y seleccionados para garantizar que sean precisos y apropiados para los usos previstos. Ahí es donde entra el software de catálogo de datos.

Un catálogo de datos es un tipo de sistema de gestión de metadatos diseñado para ser lo suficientemente fácil de usar para el usuario empresarial medio. Los catálogos de datos permiten a las organizaciones crear portales en los que los usuarios finales, incluidos los científicos y analistas de datos, pueden encontrar datos que han sido seleccionados para ellos por administradores de datos u otros profesionales de datos.

Los catálogos pueden contener datos de sistemas de big data y almacenes de datos tradicionales, bases de datos y sistemas de BI. Lo clasifican en términos que los usuarios comerciales pueden comprender y proporcionar contexto en torno a los datos para que puedan usarse correctamente en aplicaciones de análisis. También incluyen información sobre políticas de gobierno de datos y mecanismos automatizados de aplicación de políticas para ayudar a los administradores de datos y gerentes de gobierno a asegurarse de que no se acceda a los datos de un catálogo de forma incorrecta o se utilice de forma incorrecta.

Las herramientas de catalogación tienen una gran demanda a medida que las empresas luchan cada vez más por inventariar todos los datos que crean y recopilan, así como para cumplir con las nuevas reglas de privacidad y protección de datos que han hecho que la gobernanza efectiva del uso de datos sea aún más importante. En particular, eso incluye los mandatos de GDPR de la Unión Europea y la Ley de Privacidad del Consumidor de California.

La firma de analistas Gartner recomienda el uso de software de catálogo de datos para mantener y curar inventarios de activos de datos disponibles y para mapear las cadenas de suministro de información tanto para los usuarios de análisis como para los propios administradores de datos. Estas herramientas son ahora un componente esencial de las estrategias de gestión de datos corporativos, según Gartner.

Cómo funciona el software de catálogo de datos

Sharon Graves, evangelista de datos empresariales y herramientas de BI del gigante de alojamiento web GoDaddy, implementó el software de catálogo de datos de Alation Inc. en 2015 para reducir el tiempo que los usuarios de análisis dedican a buscar los datos correctos en los sistemas de la empresa y asegurarse de que los datos a los que acceden tienen ha sido examinado por administradores de datos.

«Hay un problema en el que tenemos usuarios que no saben nada sobre qué fuente de datos usar o dónde encontrar los datos. Necesitábamos señalar a los usuarios una herramienta», dijo. «Queríamos que nuestros analistas pasaran su tiempo haciendo análisis, y queríamos ayudar a los usuarios finales a realizar gráficos y tablas cruzadas simples».

Lista de verificación de las características del software del catálogo de datos
Diez características de catálogo de datos que debe buscar de un proveedor de software

El catálogo de datos extrae metadatos de varios sistemas (Hadoop, Amazon Redshift, Apache Hive, Tableau Server, Teradata y otras fuentes) y lo reúne todo en un portal donde los usuarios pueden buscar datos relevantes. El catálogo clasifica los datos en función de una serie de factores, incluido si un administrador de datos los ha respaldado para su uso en ciertas aplicaciones y por su popularidad entre los usuarios, una función que los expertos en datos pueden manipular para que aparezcan primero los datos correctos. Dijo Graves. Los equipos de datos también pueden crear conjuntos de datos unificados o empaquetados que se encargan de las uniones de datos para los usuarios en el catálogo, agregó.

Características y proveedores del catálogo de datos

Las capacidades tradicionales de gestión de metadatos son el núcleo del software de catálogo de datos. Además del inventario de datos indexados, estas características incluyen glosarios comerciales, que contienen definiciones de términos comerciales que se pueden asignar a activos de datos específicos, y documentación de linaje de datos que ayuda a los usuarios finales a comprender los datos y respalda el análisis de la causa raíz y el análisis de impacto: dos funciones clave para los administradores de datos como parte del gobierno de datos y las iniciativas de calidad de datos.

Las herramientas modernas de catálogo de datos combinan esas capacidades básicas con características avanzadas, como extracción de temas autogenerada, generación de taxonomía, descubrimiento semántico, gráficos de conocimiento y catalogación automatizada y mapeo de patrones impulsado por aprendizaje automático, según Gartner. En un informe de septiembre de 2019, los analistas de Gartner Guido De Simoni y Ehtisham Zaidi dijeron que los llamados catálogos de datos aumentados se han convertido en «una empresa imprescindible» para los equipos de análisis y gestión de datos que se enfrentan a conjuntos de datos cada vez más distribuidos y diversos.

Otras características comunes del catálogo de datos incluyen la integración incorporada con plataformas de datos ampliamente utilizadas, funciones de búsqueda para consultar el contenido de un catálogo y herramientas de colaboración que permiten a los usuarios anotar entradas del catálogo y conversar entre sí. En general, los catálogos de datos permiten a las empresas obtener el máximo valor de los datos que se encuentran en los almacenes de datos, lagos de datos y otros repositorios al facilitar su búsqueda y aplicación en aplicaciones de análisis empresarial y ciencia de datos.

Además de Alation, otros proveedores que ofrecen software de catálogo de datos como productos independientes o como parte de sus plataformas de gestión de metadatos y gobierno de datos incluyen Ataccama, Alteryx, AWS, Boomi, Cambridge Semantics, Collibra, Data.world, Erwin, Google. , IBM, Infogix, Informatica, Microsoft, Oracle, Reltio, SAP, Talend y Waterline Data.

Deja un comentario

También te puede interesar...

Clave de código abierto para el futuro SaaS

Para reducir costos y fomentar el uso compartido de aplicaciones Fuente abierta el software será la clave para la adopción sistema operativo como servicio (SaaS) durante los próximos años para mantener bajos los costos y

Cómo adaptar las ofertas a una industria

A medida que la nube madura, algunos socios encuentran ventajoso verticalizar sus ofertas a industrias específicas. Jeff Kaplan La tendencia de verticalización también está siendo impulsada por empresas de la nube como Salesforce y ServiceNow,

Cómo ver la lista de números bloqueados en Android

Ha recibido muchas llamadas no deseadas en los últimos días y, por sugerencia de un amigo, ha estado bloqueando números «insultantes» de su teléfono inteligente. Androide. Pero ahora dudas de haber estado involucrado en el

¿Estás preparado para una transición a Windows 10?

Cualquier migración de sistema operativo presenta una serie de desafíos para TI, y una transición a Windows 10 no es una excepción. La pérdida de datos, la confusión del usuario, las aplicaciones incompatibles y el

Consejos para comenzar una práctica de canal

Las empresas de canal que buscan construir prácticas de computación cognitiva pueden elegir entre múltiples caminos. La IBM Business Partner Leadership Conference, celebrada este mes en Las Vegas, mostró la variedad de opciones de los

Cómo recibir faxes en su computadora

Increíble, pero cierto. Hay más personas en el mundo, por no hablar de las empresas de fax. Y, desafortunadamente, ¡acabas de encontrarte con uno de ellos! ¿Qué vas a hacer ahora? ¿Configurarse como un campeón

Open Source gana terreno en Brasil

El estado brasileño de Paraná se ha convertido en la última organización pública en aprovechar el software de código abierto al trasladar al personal a un paquete de correo electrónico y calendario modificado. Aproximadamente 10,000

Definición bruta de renta

¿Qué es un arrendamiento bruto? Un arrendamiento bruto es un contrato que requiere que el arrendatario pague al dueño de la propiedad una tarifa fija de alquiler a cambio del uso exclusivo de la propiedad.

Microsoft relanzará Games for Windows Marketplace

Microsoft está configurado para reiniciar completamente Games for Windows Marketplace. El servicio se relanzará el próximo mes con un nuevo sitio web, ofertas de pedidos anticipados y más de cien juegos disponibles para comprar en

Mi almuerzo con Ray Ozzie y Scott Guthrie

Jeff Sandquist de Microsoft ha preparado un almuerzo para algunos de nosotros. Scott Guthrie y Ray Ozzie aquí en Mix07. Fue un gran grupo de personas incluidas Richard MacManus (sus pensamientos sobre el almuerzo han

Una introducción a los productos estructurados

Érase una vez, el mundo de la inversión minorista era un lugar tranquilo y bastante agradable, donde un pequeño y distinguido grupo de gestores y gestores de activos diseñaban carteras prudentes para sus clientes adinerados

Previsiones técnicas para 2010 Krypton Solid

¿Es 2010 el año en el que veremos el tan esperado «iTablet» de Apple? ¿Cuáles serán las grandes tendencias que llamarán la atención de los técnicos en 2010? El editor en jefe de Krypton Solid,