Krypton Solid

La última tecnología en raciones de 5 minutos

¿Qué es la reducción de datos en el almacenamiento primario (DRIPS)?

La reducción de datos en el almacenamiento primario (DRIPS) es la aplicación de técnicas de optimización de la capacidad para los datos que están en uso activo, en contraste con el almacenamiento que se usa para respaldo, archivo u otros propósitos de almacenamiento secundario.

DRIPS utiliza técnicas de reducción de datos como la deduplicación de datos, el archivo de datos, el aprovisionamiento ligero y la compresión que tradicionalmente se han asociado con el almacenamiento de respaldo en lugar del almacenamiento primario. Los métodos de reducción de datos adicionales que se utilizan para el almacenamiento primario incluyen el almacenamiento en niveles automatizado, clones eficientes y selección de nivel de RAID.

El propósito de la reducción de datos

El propósito de la reducción de datos, ya sea para almacenamiento primario o secundario, es mejorar la eficiencia del almacenamiento, reducir los costos y hacer un mejor uso de los recursos disponibles. La tecnología disminuye la cantidad de discos que se deben comprar y reduce las tarifas de soporte, lo que reduce los costos operativos asociados con la administración del almacenamiento.

Los datos inactivos aumentan a un ritmo varias veces mayor que el de los datos activos. Al eliminar los datos inactivos de los costosos e invaluables medios de almacenamiento primario, la reducción de datos en el almacenamiento primario puede tener un impacto positivo en el almacenamiento, el rendimiento de las aplicaciones y el costo general. Sin embargo, el almacenamiento primario, a diferencia del almacenamiento secundario, tiene que ver con el rendimiento. Por lo tanto, debido a que la reducción de datos a menudo requiere recursos del sistema para funcionar de manera efectiva, es mejor usarla para el almacenamiento primario cuando requiere menos gastos generales para encontrar y eliminar datos duplicados.

Pros y contras de la reducción de datos

Técnicas de reducción de datos

La deduplicación de datos detecta patrones repetidos en los datos, comúnmente basados ​​en tamaños de bloque fijos, para reducir dichos patrones a una sola instancia. Cada referencia a un bloque de datos en particular apunta a una única copia física. La reducción de espacio de la deduplicación de datos para el almacenamiento primario puede ser sustancial. La deduplicación de datos en línea elimina las redundancias de datos antes o mientras los datos se escriben en la copia de seguridad. La deduplicación posterior al procesamiento, también conocida como deduplicación síncrona, copia y elimina los datos redundantes una vez finalizada la copia de seguridad.

El aprovisionamiento ligero elimina la reserva en bloques de almacenamiento no escritos, lo que permite el aprovisionamiento excesivo de recursos de almacenamiento y permite crear más capacidad lógica de la que está físicamente disponible. En realidad, la técnica no reduce los datos, sino que optimiza el almacenamiento. Los proveedores de almacenamiento implementan ampliamente el aprovisionamiento ligero.

La compresión encuentra patrones repetidos de información similar que se pueden reducir y reemplazar con una estructura de datos optimizada. El método funciona con ciclos de procesamiento para comprimir y descomprimir datos según sea necesario. La compresión es una tecnología madura y ampliamente implementada que puede reducir significativamente los requisitos de almacenamiento.

Comparación de la reducción de datos en técnicas de almacenamiento primario

El archivo de datos traslada los datos que se utilizan con menos frecuencia a un almacenamiento más lento y menos costoso. Los datos involucrados pueden mantenerse para cumplimiento o para un posible uso futuro, pero no se requiere un acceso rápido. Para DRIPS, los datos se moverían del almacenamiento principal al medio de respaldo. En el caso de un archivo activo, donde los datos archivados pueden ser devueltos al almacenamiento primario para que los utilicen las aplicaciones y los usuarios en cualquier momento, el rendimiento se convierte en un factor crítico.

El almacenamiento en niveles automatizado mueve activamente los datos entre los tipos de disco: almacenamiento Serial Advanced Technology Attachment (SATA) más económico para los datos a los que se accede con menos frecuencia y unidades de estado sólido o SCSI conectadas en serie (SAS) de alto rendimiento para datos más activos, y niveles de RAID para Satisfacer las necesidades de costes, espacio y rendimiento. Es una función que se encuentra en el software de gestión de almacenamiento.

RAID aumenta la redundancia de datos con fines de protección de datos y, según el nivel de RAID seleccionado para un entorno de almacenamiento en particular, puede tener un efecto positivo o negativo en la cantidad de datos activos en el almacenamiento primario. También influye en los requisitos, la fiabilidad y el rendimiento del disco. La compatibilidad con RAID mixta permite a los usuarios optimizar el rendimiento, la disponibilidad y los costes de las aplicaciones.

Los clones eficientes crean una copia idéntica de un volumen existente y, a menudo, se pueden utilizar como método para clonar volúmenes de sistemas operativos virtualizados. Pueden crear una copia completa de un volumen de origen con la misma cantidad de almacenamiento físico o duplicar volúmenes de aprovisionamiento fino con o sin la misma cantidad de almacenamiento. De manera más eficiente, clone un volumen sin ningún dato haciendo referencia a bloques en una imagen de origen. Aquí, un nuevo clon requiere solo una pequeña cantidad de espacio físico en el disco, y solo cuando los clones se modifican, los cambios de una imagen original requieren almacenamiento. La técnica de usar clones eficientes se ha vuelto más frecuente con la virtualización de servidores.

El mercado de la reducción de datos en el almacenamiento primario está siendo impulsado por un aumento en los costos de almacenamiento, que, a su vez, es impulsado por un aumento en la cantidad de datos que manejan las empresas.

Deja un comentario

También te puede interesar...

OpenStack atrae empresas con Essex

La quinta versión de la plataforma en la nube de código abierto OpenStack se lanzó el jueves, en medio de diferencias entre las principales empresas de tecnología que la respaldan. Con el nombre en clave

Muni Wi-Fi trae temores a los depredadores en línea

El acceso inalámbrico gratuito puede ser una ventaja para quienes necesitan acceso a Internet en cualquier lugar y en cualquier momento, pero es un desastre para los padres que quieren controlar el contenido al que

Singapur pide innovación en salud

SINGAPUR – El gobierno invertirá $ 3 millones ($ 2 millones) para fomentar el desarrollo de aplicaciones de tecnología de infocomm (TIC) que mejoren la rentabilidad y la calidad de los servicios de atención médica

Dow Jones Euro STOXX 50 Definición

¿Qué es el Dow Jones Euro STOXX 50? El Dow Jones Euro STOXX 50 es un índice bursátil que representa a 50 de las empresas más grandes de Europa en función de la capitalización de