Krypton Solid

La última tecnología en raciones de 5 minutos

La nube impulsa los microservicios de datos, también para sistemas locales

No debería ser demasiado sorprendente saber que las arquitecturas en la nube están llegando a los centros de datos. Incluso si están atrapados en las instalaciones de una organización, los arquitectos empresariales de hoy quieren participar en la acción a medida que evolucionan los microservicios de datos.

Las arquitecturas de nube que están trayendo a la tierra vienen en gran parte a través de contenedores que se basan en un enfoque de microservicios similar a SOA de antaño, que significa arquitectura orientada a servicios, no Hijos de la Anarquía, el club de motociclistas fuera de la ley del programa de televisión del mismo nombre. Los microservicios de datos son como SOA, solo que más micro.

Mejorar el soporte de big data para contenedores fue uno de los elementos de la lista de tareas de ingeniería citados por los proveedores de Hadoop Cloudera y Hortonworks cuando anunciaron planes para fusionarse este mes. Eso y un movimiento hacia un uso más amplio del almacenamiento de objetos en la nube representan un gran cambio hacia el big data.

Orquestación de Kubernetes

Si bien los contenedores nacieron como buques apátridas, se está trabajando para hacerlos más con estado, con soporte para la persistencia de datos en las aplicaciones. Si tiene éxito, esto podría simplificar el uso de múltiples marcos y motores de análisis con un propósito: piense en Hive, Presto, Druid, TensorFlow, etc.

Utilizados junto con la cada vez más popular tecnología de orquestación de contenedores de Kubernetes, los microservicios de datos pronto surgirán como un estilo alternativo de procesamiento de datos, ya sea en la nube o fuera de ella.

Es temprano y hay mucho que aprender, como lo demuestran las sesiones de Kubernetes que a menudo estuvieron llenas en la Conferencia Strata Data del mes pasado en Nueva York. Después del aprendizaje viene la construcción, mucho de lo cual es necesario antes de que la nueva arquitectura pueda echar raíces.

Ingrese Cloud Private para datos

Para IBM y sus clientes, encontrar un equilibrio entre las arquitecturas de datos en las instalaciones y en la nube es una búsqueda constante. La adopción vigorosa de la compañía tanto de Hadoop como de Spark se ha notado anteriormente, pero IBM todavía está trabajando para empaquetar cuidadosamente esos y otros pilares de big data para implementaciones en la nube y en las instalaciones.

Cerca del final de la conferencia Strata, hablamos con Rob Thomas, gerente general de IBM Analytics, mientras se preparaba para un panel de discusión sobre la plataforma IBM Cloud Private for Data de la compañía y el papel que puede desempeñar para hacer realidad la inteligencia artificial. El paquete Cloud Private for Data incluye Db2, Db2 Warehouse y Db2 Event Store, y admite varias interfaces para científicos de datos y otros usuarios de análisis predictivo, tanto dentro como fuera de la nube.

«Si creó un modelo en una nube privada, puede implementarlo en una nube pública. O, si lo creó en una nube pública, puede implementarlo en una nube privada», dijo Thomas. Las herramientas de preparación de datos y gobierno son las mismas, ya sea que la implementación sea pública o privada, agregó.

Thomas dijo que la compañía recientemente cumplió con los planes para agregar soporte para MongoDB, EDB Postgres de EnterpriseDB e IBM Data Risk Manager a IBM Cloud Private for Data, y está trabajando para certificar que la plataforma funcione con la tecnología de aplicaciones de contenedores OpenShift de Red Hat.

Gráfico que muestra las diferencias entre microservicios y monolíticos
Monolítico frente a microservicios

Los competidores tradicionales del lado de los datos de IBM también buscan conectar el análisis de datos en las instalaciones con el análisis de datos en la nube. Los esfuerzos de Oracle se centran en su empresa Oracle Cloud at Customer. Y Microsoft hizo una vista previa de una versión de SQL Server 2019 que puede llevar las versiones de Azure de Spark y Hadoop al centro de datos.

IBM tiene importantes alianzas de datos y desarrollo en la nube con Red Hat y Hortonworks, las cuales tocan microservicios de datos. Ambas empresas se combinaron con IBM justo antes de Strata para lanzar una Iniciativa de Arquitectura Híbrida Abierta. El propósito del proyecto es fusionar Kubernetes, contenedores y cargas de trabajo de Hadoop, y hay mucho trabajo por hacer en ese sentido, dijo Thomas.

Rehaciendo lo monolítico

Después de Strata, nos comunicamos con Tom Phelan, cofundador y arquitecto jefe de BlueData Software, fabricante de la plataforma de software BlueData EPIC (Elastic Private Instant Clusters). Dijo que le gustan los objetivos de la Iniciativa de Arquitectura Híbrida Abierta, pero agregó que debe haber más trabajo antes de que pueda avanzar.

«Un gran problema es que, cuando se escribió Hadoop, se escribió como una arquitectura monolítica», dijo Phelan.

Ese es el caso a pesar de que Hadoop se puede dividir en servicios como el nodo de nombre, el administrador de recursos YARN, Hive, los servicios del sistema de archivos distribuido de Hadoop, etc.

Cuando se escribió Hadoop, se escribió como una arquitectura monolítica.

Tom Phelanarquitecto jefe, BlueData

«Ninguno de ellos tiene una arquitectura de microservicio», dijo Phelan. «Esos servicios deben iniciarse en un orden determinado. Tienen que interactuar entre sí de una manera muy particular. Por ejemplo, no hay forma de reiniciar uno de esos servicios y que no afecte a otros servicios que se están ejecutando . «

Por su parte, BlueData lanzó este mes KubeDirector, un proyecto de código abierto para desarrollar clústeres de aplicaciones con estado en Kubernetes.

¿Viene un nuevo esquema?

Tanto si los datos se trasladan a la nube como si no, la influencia de la arquitectura de la nube es muy importante.

«Las empresas obviamente tienen una gran cantidad de datos locales que van a la nube, pero no todos los datos van a la nube», dijo el analista de Forrester Noel Yuhanna. «A veces, cuando llega la factura de la nube, puede ser enorme, tal vez más que en las instalaciones».

Movimientos como la Iniciativa de Arquitectura Híbrida Abierta abordan la necesidad de armonizar las vistas en los dos dominios, según Yuhanna, y sientan las bases para políticas de gestión comunes para ambos.

«Quiere una arquitectura que pueda administrar datos tanto en la nube como en las instalaciones con políticas comunes», agregó.

Cuando SOA caminó por la tierra, provocó una reelaboración, o un reenvasado, de los sistemas heredados. Los nuevos microservicios de datos podrían hacer que los sistemas de big data existentes sean similares a los sistemas heredados. Eso no sería más que un progreso.

Es una buena apuesta que, a medida que el procesamiento de datos híbridos se vuelva más real, los datos se trasladarán de aquí para allá y de regreso. Y, por supuesto, YANA, otra nueva arquitectura más, estará esperando entre bastidores.

Deja un comentario

También te puede interesar...

Roth IRA vs. IRA tradicional: diferencias clave

Roth IRA vs. IRA tradicional: una descripción general Las cuentas individuales de jubilación (IRA, por sus siglas en inglés) son vehículos ventajosos desde el punto de vista fiscal, diseñados para ahorros e inversiones a largo

Reflexiones: Denis Heraud, Sun | Krypton Solid

Denis Heraud, presidente de Sun Microsystems para Asia-Pacífico, nombra tecnologías ecológicas, de código abierto y Web 2.0 como los tres puntos calientes a tener en cuenta P. ¿Cuál fue la noticia más importante de 2006?

El gusano mytob se convierte en phishing

Los expertos en TI advirtieron el miércoles que los creadores del último gusano Mytob habían tomado prestados trucos de phishing para infectar a más usuarios de computadoras. Hasta ahora, el gusano de Mytob se ha

BBC agrega apilamiento de series a iPlayer

Siete días sin muerte para los mejores espectáculos El millones de adictos a la televisión colgando de iPlayer de la BBC ahora tendrá aún más tiempo para ponerse al día con los nuevos programas, gracias

AdDuplex cuenta una interesante historia de 1809

El Informe AdDuplex de marzo de 2019 ya está disponible, y cuenta una historia interesante y posiblemente deprimente sobre Windows 10 1809. La implementación de 1809 ha sido desigual, por decir lo menos. A medida

Definición de mariposa de hierro.

¿Qué es una mariposa de hierro? Una mariposa de hierro es una transacción de opciones que utiliza cuatro contratos diferentes como parte de una estrategia para beneficiarse de los precios de acciones o futuros que

Las 5 Mejores Aplicaciones de Golf del 2023

¡Hola! Aquí tienes una curiosidad relacionada con las mejores aplicaciones de golf del 2023: Sabías que las aplicaciones de golf han revolucionado la forma en que los jugadores practican y mejoran su juego. Ahora, gracias

Definición de impuesto de timbre

¿Qué es un impuesto de timbre? El impuesto de timbre es el impuesto que imponen los gobiernos sobre los documentos legales, generalmente en la transferencia de activos o propiedades. Los gobiernos imponen un impuesto de