Los sistemas de almacenamiento de objetos se han promocionado como «la próxima gran novedad» durante casi una década, aunque todavía tienen que desarrollar una justificación suficientemente convincente para desplazar el almacenamiento convencional basado en sistemas de archivos en la mayoría de los entornos. Sin embargo, a medida que el almacenamiento se llena cada vez más de archivos grandes y pequeños, los denominados «datos no estructurados», cada vez es más común organizar todos estos datos en una estructura jerárquica de volúmenes, directorios y subdirectorios compatibles con estructuras complejas de nodos y extensiones de inodo. y más difícil de manejar.
En algunos casos, las empresas informan que almacenan cientos de millones de archivos muy pequeños en un solo directorio que se utiliza para crear una página web. En otros casos, las empresas han grabado digitalmente imágenes médicas o videos de vigilancia como archivos que no solo deben buscarse y recuperarse rápidamente, sino también modificarse con la adición de metadatos altamente granulares para permitir su uso eficiente. En resumen, el sistema de archivos está comenzando a desgastarse en los bordes, a medida que cambian los requisitos de almacenamiento.
El almacenamiento de objetos implica el reemplazo de las estructuras tradicionales del sistema de archivos por un marco orientado a objetos. Básicamente, en lugar de organizar los archivos en un árbol de archivos jerárquico, los objetos de datos y los archivos se organizan en contenedores o «cubos», cada uno con su propia ID o clave única. El acceso se realiza simplemente mediante clave o DNI. La mayoría de los metadatos sobre el objeto o archivo se almacenan con el objeto o archivo, lo que reduce la carga de administración de metadatos que se encuentra en la mayoría de los sistemas de archivos.
¿Qué es exactamente el almacenamiento de objetos? Es una arquitectura de almacenamiento que aborda y maneja unidades de almacenamiento individuales. Luego, asigna a los objetos un identificador único, por lo que los objetos se pueden recuperar sin conocer su ubicación física.
Los sistemas de almacenamiento de objetos básicos son simples de implementar y operar, y bastante minimalistas en términos de funcionalidad. Los usuarios pueden almacenar, recuperar, copiar y eliminar objetos, y especificar qué usuarios tienen qué permisos para realizar qué funciones. Cada vez más, los estándares REST del World Wide Web Consortium se combinan con el almacenamiento de objetos para facilitar la integración con otras aplicaciones y métodos tradicionales de acceso a datos basados en sistemas de archivos. Las API RESTful y las primitivas se utilizan para interactuar con contenedores y objetos, lo que permite el uso de motores de búsqueda externos, en el caso de las tiendas de objetos de nube pública populares, y otras funciones de software de aplicación para interactuar directamente con los objetos, en el caso de algunos. sistemas de edición de video.
Los sistemas de almacenamiento de objetos también permiten a los usuarios definir los metadatos almacenados con el objeto en un grado mucho mayor y mucho más granular de lo que es posible con la mayoría de los sistemas de archivos. Esta es una muy buena noticia para las aplicaciones de archivo, el análisis de big data y en otros casos en los que los volúmenes de datos son grandes y la búsqueda de metadatos detallada puede generar un gran valor.
También se cree que el almacenamiento de objetos hace un mejor uso de la capacidad del disco que un sistema de archivos tradicional, ya que el espacio no está reservado para archivos incompletos y porque los diarios de rutas de directorio y nombres de archivos suelen consumir poco espacio en el disco. De hecho, en las implementaciones más elegantes de los sistemas de almacenamiento de objetos, como Caringo Swarm, solo los objetos se escriben en el disco, mientras que un pequeño diario sin estado se mantiene en la RAM, lo que acelera considerablemente las operaciones.
Con el control sobre la estructura del objeto y los metadatos, se puede hacer un mejor uso de los servicios de protección de datos. La operación de copia de datos se puede aplicar a objetos que realmente requieren múltiples copias independientes basadas en políticas centradas en metadatos. Los archivos que cambian con menos frecuencia pueden delegarse a procesos como la codificación de borrado en lugar de la duplicación.
Algunos proveedores están trabajando para encontrar formas de organizar mejor los datos en cachés y búferes recodificándolos inicialmente como un objeto y luego utilizando metadatos de objetos para ayudar en la administración de caché. Amazon ha implementado el almacenamiento de objetos en su Simple Storage Service y lo respalda con protocolos especializados basados en REST que se han convertido en una parte tan importante del léxico de interconexión de almacenamiento como Fibre Channel, iSCSI o NFS.
Recuerde, si está almacenando datos en servicios en la nube, es probable que ya esté utilizando sistemas de almacenamiento de objetos en la actualidad. Si no es así, es hora de considerar cómo el almacenamiento de objetos puede beneficiarlo.