Krypton Solid

La última tecnología en raciones de 5 minutos

¿Cómo está mejorando la infraestructura de Hadoop?

Últimamente hemos visto aparecer muchos servicios de Hadoop que agregan software de administración y análisis a la infraestructura de Hadoop. ¿Existe alguna innovación en torno a la arquitectura de los clústeres de almacenamiento, o es el software el único lugar donde veremos cambios o mejoras en el futuro?

Los dos componentes arquitectónicos principales de Hadoop, por así decirlo, son el marco MapReduce y el Sistema de archivos distribuido de Hadoop (HDFS). Se ha trabajado mucho para mejorar HDFS. Hay una distribución que está fuera de MapR, por ejemplo, que reemplaza HDFS con una versión del sistema de archivos que admite la infraestructura de Hadoop y elimina el único punto de falla representado en el NameNode en el marco de Hadoop. Así que ese es un enfoque que se está adoptando.

Otro enfoque que están adoptando algunos proveedores es proponer un sistema de archivos alternativo a HDFS. Entonces, por ejemplo, Symantec tiene una versión de CIFS que, nuevamente, soluciona algunas de las deficiencias en HDFS. Red Hat tiene el sistema de archivos Gluster del que han creado una versión empresarial de Hadoop, por lo que lo han propuesto como una alternativa a HDFS.

En un momento, IBM quiso impulsar GPFS como alternativa, pero se han alejado de eso. Creo que la razón de esto es interesante, porque la comunidad de Hadoop quiere mantener una disponibilidad de código abierto del 100% para el código de Hadoop. Algunas de estas ramificaciones se consideran bifurcaciones del código base. Hay varios puristas que quieren mantener HDFS como el sistema de archivos para la infraestructura de Hadoop, y si hay deficiencias, la comunidad de Hadoop las abordará. Eso está sucediendo mientras hablamos. Durante mucho tiempo se ha sentido que HDFS debería tener capacidad de instantánea, por lo que está en la hoja de ruta. También se está abordando la respuesta al problema de la conmutación por error de NameNode, o la incapacidad de NameNode para conmutar por error a un secundario de alguna manera automatizada. Hay una serie de otros problemas que se abordarán en Hadoop 2.0.

Hasta ese momento, no ha impedido que algunos de los proveedores presenten extensiones propietarias o simplemente reemplazos a gran escala, en algunos casos, para partes del marco de Hadoop.

Sobre el Autor:
John Webster es socio senior de Evaluator Group Inc., donde contribuye a la investigación en curso de la empresa sobre tecnologías de almacenamiento de datos, incluida la gestión de hardware, software y servicios.

Deja un comentario

También te puede interesar...

Cifrado abierto para combatir el spam y el phishing

El Consorcio Oasis Open Standards ha anunciado un plan para promover sus obras de infraestructura de clave pública. La organización ha formado un grupo, la sección de miembros de IDtrust, que buscará promover una mejor

Nace Win FS beta 1

Para aquellos de ustedes que están preocupados por la nueva generación del sistema de archivos de Microsoft, Channel 9 tiene uno video de una hora en Win FS con desarrolladores líderes a través del director

Nube privada como servicio de Blue Box

Cada vez más organizaciones recurren a modelos de nube privada. A medida que se reduce la diferencia de precio entre las nubes públicas y privadas, y las organizaciones reconocen los beneficios económicos y de agilidad

Compara 2 opciones de protección de datos

Los administradores de TI interesados ​​en productos de producción de datos como servicio deben evaluar cuidadosamente qué ofertas satisfarán mejor sus necesidades. La industria de TI, en general, ha cambiado a un modelo de entrega

ubicación privada

La colocación privada se refiere a la oferta y venta de acciones de una empresa a un pequeño grupo de compradores. Los compradores suelen ser inversores sofisticados, como bancos, fondos de pensiones, fondos mutuos, compañías

EA confirma que Anthem se pospone hasta 2019

EA confirmó que Himno, El próximo juego de rol de acción multijugador de mundo abierto de la compañía del desarrollador BioWare se ha pospuesto oficialmente hasta 2019, según un informe del El periodico de Wall

¿Qué es AWS Step Functions?

AWS Step Functions es un servicio en la nube de Amazon Web Services que permite a un desarrollador administrar y visualizar los componentes de aplicaciones distribuidas de múltiples componentes. Las aplicaciones distribuidas y de múltiples

Definición anual

¿Qué es anual? El término «anual» se refiere a un evento que tiene lugar una vez al año. En la industria financiera, los eventos o informes anuales pueden incluir impuestos, juntas de accionistas y registros

Lista de deseos para mi PC para 2003

COMENTARIO – Solo por mi propio valor de entretenimiento en esta temporada navideña, he preparado una lista de deseos para PC para 2003. Debe ser una lista bastante larga. Desafortunadamente, me encontré escribiendo en el

Descarga gratuita: Valerissa Script

Descarga gratuita: Valerissa Script Si desea impresionar a su caja de herramientas de tipografía, ¡aproveche este obsequio hoy! Valerissa Script fue diseñado por StudioAKTYPE y es la fuente perfecta para tarjetas de felicitación, invitaciones de