Krypton Solid

La última tecnología en raciones de 5 minutos

¿Qué es Google Cloud Dataflow?

Google Cloud Dataflow es un servicio de procesamiento de datos basado en la nube para aplicaciones de transmisión de datos por lotes y en tiempo real. Permite a los desarrolladores configurar canales de procesamiento para integrar, preparar y analizar grandes conjuntos de datos, como los que se encuentran en la analítica web o las aplicaciones de análisis de big data.

El software Cloud Dataflow se expande en proyectos anteriores de procesamiento paralelo de Google, incluido MapReduce, que se originó en la empresa. Cloud Dataflow está diseñado para llevar a toda la canalización de análisis el estilo de ejecución paralela rápida que MapReduce llevó a un solo tipo de ordenamiento computacional para trabajos de procesamiento por lotes. Se basa en parte en MillWheel y FlumeJava, dos marcos de software desarrollados por Google destinados a la ingestión de datos a gran escala y el procesamiento de baja latencia.

Google Cloud Dataflow se superpone con marcos y servicios de software competitivos como Amazon Kinesis, Apache Storm, Apache Spark y Facebook Flux. Se mostró una vista previa de la tecnología en la conferencia de desarrolladores de Google I / O en junio de 2014; Al mismo tiempo, Cloud Dataflow se puso a disposición de forma limitada como parte de un programa beta controlado. La primera versión es compatible con un kit de desarrollo de software de Java (SDK), con soporte para otros idiomas a continuación.

Cloud Dataflow puede tomar datos en modo de publicación y suscripción de los feeds de middleware de Google Cloud Pub / Sub o, en modo por lotes, de cualquier base de datos o sistema de archivos. Maneja de forma agnóstica datos de diferentes tamaños y estructuras utilizando un formato llamado PCollections, que es la abreviatura de «colecciones paralelas». El servicio Google Cloud Dataflow también incluye una biblioteca de transformaciones paralelas, o PTransforms, que permiten la programación de alto nivel de tareas que se repiten con frecuencia mediante plantillas básicas; Además, admite la personalización de las transformaciones de datos por parte de los desarrolladores. El servicio optimiza las tareas de procesamiento, por ejemplo, al reducir varias tareas en pasadas de ejecución únicas. Y admite consultas SQL a través de Google BigQuery, un servicio de análisis basado en la nube.

Esto se actualizó por última vez en Septiembre de 2014

Continuar leyendo sobre Google Cloud Dataflow

Deja un comentario

También te puede interesar...

Ataque abierto al vino Krypton Solid

Bueno, al menos la gente de Microsoft está aceptando el que «Windows Genuine Advantage (WGA)» está diseñado para negar Vino actualizaciones de usuario a través de Windows Update. (Me gusta el nombre orwelliano que se

Definición de cazatalentos

¿Qué es un cazatalentos? Un headhunter es una empresa o persona que presta servicios de contratación laboral en nombre del empleador. Los headhunters son contratados por empresas para encontrar talento y ubicar a personas que

SingTel se dirige a dimitir

SINGAPUR – La compañía telefónica más grande del sudeste asiático, SingTel, ahora está buscando un nuevo jefe después de que el director ejecutivo de su grupo, Lee Hsien Yang, anunciara su renuncia a un líder

Cómo obtener V-Buck Fortnite | Krypton Solid

acabas de empezar a jugar Fortnite, conmovida por el hecho de que su grupo de amigos no hace más que hablar de este videojuego. Los juegos jugados hasta ahora te han resultado gratificantes: este título

Mi primera aplicación para Android Krypton Solid

Me tomó un tiempo encontrar tiempo para explorar realmente Google App Inventor, el software de Google que permite a los no programadores crear fácilmente aplicaciones personales y explorar conceptos de programación utilizando sus dispositivos Android.

Los Mejores Discos Duros Externos de 8TB del 2023

¡Aquí tienes una curiosidad relacionada con los discos duros externos de 8TB en el año 2023! ¿Sabías que un disco duro externo de 8TB podría almacenar más de 1 millón de fotos de alta resolución?

Toshiba lanza la familia SSD empresarial

Toshiba ha ampliado sus productos de almacenamiento empresarial con una nueva gama de SSD de alta especificación. La nueva familia de unidades de disco de 2,5 pulgadas, llamada MK4001GRZB, vendrá en 100 GB, 200 GB

Naver y SoftBank formarán una empresa conjunta

Naver y SoftBank formarán una empresa conjunta que se convertirá en el accionista mayoritario de Z Holdings, que dirige Yahoo Japón, como parte del plan para integrar el negocio de los dos gigantes tecnológicos. El

Kyligence 4.5 agrega Clickhouse a Intelligent Data Cloud

Kyligence expandió las capacidades de su plataforma Intelligent Data Cloud con una nueva actualización revelada el 10 de agosto y programada para disponibilidad general para fin de mes. La actualización Kyligence Cloud 4.5 es la

Definición de índice de carga Cass

¿Qué es el índice Cass Freight? El Cass Freight Index es una medida de los envíos mensuales acumulados de mercancías en los Estados Unidos. Cass sistemas de información, un proveedor de sistemas de pago automatizados,

Cómo conectar Spotify a la televisión

Has decidido suscribirte a Spotify Premium para aprovecharlo durante la fiesta que organizaste en casa pero, en el último momento, te diste cuenta de que no cuentas con ningún sistema de audio nativo compatible con

Cómo imprimir PDF a doble cara

Un amigo te envió por correo electrónico un documento importante en formato PDF e inmediatamente lo guardaste localmente en tu computadora, para que puedas consultarlo sin conexión. Al hacerlo, también tuviste la brillante idea de