Cada trimestre, los editores de SearchDataManagement reconocen una tecnología de gestión de datos para la innovación y el impacto en el mercado. El producto seleccionado este trimestre es Pentaho 6.1 de Pentaho Corp., una subsidiaria de Hitachi Ltd.
Producto: Plataforma de análisis empresarial y de integración de datos Pentaho 6.1
Fecha de lanzamiento: 22 de abril de 2016
La versión 6.1 del software incluye soporte para opciones de inyección de metadatos para crear dinámicamente transformaciones de datos complejas dentro de diversas integraciones.
Que hace
La plataforma Pentaho combina la integración de datos y las capacidades de inteligencia empresarial. La plataforma está destinada a automatizar la carga de datos en entornos modernos y complejos. Eso significa manejar las transformaciones de la canalización de big data de diversos tipos de datos, que van desde repositorios relacionales estructurados hasta los tipos de datos más variados que se encuentran en las tiendas de código abierto NoSQL, Spark y Hadoop, así como redes sociales, registros y flujos de datos de máquinas. En el lado de la inteligencia empresarial, Pentaho admite el almacenamiento en caché de datos en memoria para grandes volúmenes de datos, así como el análisis visual interactivo de datos, incluido el mapeo geográfico, las redes térmicas y el filtrado de lazo.
Por que importa
Los datos de gran volumen y gran variedad en las organizaciones han hecho hincapié en los métodos tradicionales de extracción, transformación y carga (ETL) y almacenamiento de datos, lo que a menudo crea una acumulación de órdenes de trabajo para el departamento de TI. El objetivo de Pentaho es reducir la dependencia de TI, especialmente la necesidad de producción de ETL con secuencias de comandos a mano, y así permitir el análisis de autoservicio para científicos de datos y analistas de negocios que trabajan en líneas de negocios.
Con Pentaho 6.1, la integración de datos se acelera a través de la inyección de metadatos, que deriva planes de transformación mientras inspecciona los datos de origen en busca de nombres de campo, longitudes y otras pistas contextuales, y luego ejecuta los planes automáticamente. El proveedor había ofrecido versiones tempranas y funcionalmente incompletas de la tecnología en versiones anteriores; con la 6.1, lanzó oficialmente las capacidades de inyección. La inserción automática de metadatos se considera un posible ahorro de tiempo en el trabajo de integración a medida que el volumen y la variedad de datos continúan creciendo en las organizaciones.
Que dicen los usuarios
La plataforma Pentaho se puede implementar para la integración de datos sin recurrir indebidamente a consultores, según Matt Good, director gerente de arquitectura de software de Kingland Systems, un proveedor de servicios de desarrollo de software en Clear Lake, Iowa. «Pentaho era liviano y fácil de instalar. Encajaba bien», dijo.
También otorgó altas calificaciones a la introducción formal de la inyección de metadatos en 6.1. «Con la inyección de metadatos, podemos definir de manera flexible cómo cargamos los datos y cómo los tenemos parametrizados. Los clientes pueden usar la aplicación de autoservicio para cargar datos. Pero el orden en el que cargan esos datos no importa, porque [metadata injection] proporciona los detalles de indexación necesarios «, dijo.
Según Good, los casos de uso de Kingland para Pentaho comenzaron con la integración de los datos de los clientes. Dijo que la compañía maneja principalmente datos relacionales como parte de los servicios de cumplimiento y gobierno que brinda a compañías financieras y de otro tipo, pero que él y sus equipos están viendo un uso cada vez mayor de software de código abierto como Hadoop y Spark. El trabajo más reciente que se está desarrollando con la plataforma Pentaho se centra en la calidad de los datos de autoservicio, que es importante para el cumplimiento y los informes de riesgos.
Profundizar
- La inyección automatizada de metadatos reemplaza las técnicas ETL estáticas al acceder a los metadatos de origen en tiempo de ejecución, pasarlos a una plantilla de transformación y automatizar la repetición del proceso.
- Las mejoras en el rendimiento del repositorio aceleran la exploración de tipos de datos JSON.
- La generación mejorada de modelos de datos para implementaciones de tablas virtuales ayuda a crear esquemas sobre la marcha.
Precios
Pentaho no revela precios específicos para sus productos. La compañía ofrece precios por suscripción y por plazo basados en núcleos de servidor, así como nodos de Hadoop cuando se incluye el procesamiento de Hadoop.