Krypton Solid

La última tecnología en raciones de 5 minutos

¿Cómo afectan la compresión y la deduplicación al rendimiento?

La compresión y la deduplicación de datos tienen comienzos humildes como complementos opcionales para empresas con problemas de capacidad, pero en la era moderna, son características imprescindibles para casi todos los sistemas de almacenamiento. Juntos, han ayudado a marcar el comienzo de una era de almacenamiento flash de alto rendimiento que mantiene al menos una apariencia de cordura en los precios. Sin ellos, es poco probable que la revolución relámpago hubiera sido tan generalizada.

Sin embargo, estas tecnologías a veces son controvertidas cuando se trata de determinar su impacto. El impacto de la capacidad tanto de la compresión como de la deduplicación depende en gran medida de los datos subyacentes que se administran. Lo que a veces se pasa por alto es el hecho de que pueden tener un efecto tanto positivo como negativo en el rendimiento del almacenamiento.

En el frente negativo, tanto la compresión como la deduplicación pueden requerir importantes recursos de CPU para hacer su magia. Para la deduplicación, a medida que se introducen bloques de datos en el sistema de almacenamiento, se toman las huellas digitales de cada uno y se verifican con una tabla maestra de huellas digitales llamada tabla de picadillo. Si ya existe una huella digital, eso significa que el bloque de datos ya existe en el sistema de almacenamiento y los datos no se vuelven a escribir. Si la huella dactilar no existe, los datos se escriben como de costumbre.

Este proceso de verificación de huellas dactilares puede imponer una mayor latencia en las operaciones de escritura de almacenamiento, aunque, con los avances en los sistemas de almacenamiento modernos, esto es prácticamente insignificante. El motor de deduplicación en sí requiere ciclos de CPU para procesar la búsqueda, por lo que puede tener algún efecto en otras operaciones de almacenamiento. Dicho esto, las CPU modernas son gigantes multinúcleo que tienen ciclos de sobra. En el pasado, esto pudo haber sido una consideración más que hoy. Los procesadores más antiguos eran mucho menos eficientes que los que se usan ahora.

A partir de ahí, si la deduplicación es positiva o negativa desde una perspectiva de rendimiento se vuelve un poco más confusa y depende de los datos en sí. Si hay mucha duplicación de datos, la deduplicación puede ser un resultado neto positivo, ya que básicamente puede desechar más operaciones de escritura. Las operaciones de escritura tienden a ser la variedad más lenta, por lo que cuanto menos tenga que realizar, menor será el impacto en el rendimiento. Para cargas de trabajo regulares, simplemente tiene que tomar una decisión: ¿el impacto insignificante en el rendimiento se ve superado por los ahorros de capacidad que experimenta?

La compresión es una historia similar. Obtiene resultados de capacidad de almacenamiento reducida a expensas de algunos ciclos de CPU. En este caso, los tipos de datos subyacentes son muy importantes. Si está tratando de almacenar datos que ya están comprimidos, como ciertos formatos de video y fotos, la compresión en realidad no producirá ningún ahorro, por lo que solo estará desperdiciando ciclos de CPU tratando de obtener más ganancias que no se materializarán. Sin embargo, en el caso de datos comprimibles, debe realizar una evaluación similar a la de la deduplicación: ¿Vale la pena el potencial de impacto de la CPU por la ganancia de capacidad?

El mejor método para determinar si la compresión y la deduplicación son adecuadas para usted es probarlas y ver cuál es su impacto en términos de costo y rendimiento.

Deja un comentario

También te puede interesar...

Cómo crear un modelo de regresión lineal en Excel

¿Qué es la regresión lineal? La regresión lineal es un gráfico de datos que representa gráficamente la relación lineal entre una variable independiente y una variable dependiente. Por lo general, se usa para mostrar visualmente

Lo que sabemos sobre Windows 7

Ya que Microsoft aún no está listo para hablar – o incluso comentar sobre cualquier información que sus empleados ya hayan discutido públicamente – sobre Windows 7, pensé en hacer una lista de muchas cosas

Los mejores accionistas de Nike

Nike, Inc. (NKE) es un diseñador, distribuidor y minorista mundial de calzado deportivo, zapatillas, ropa, equipos, servicios y accesorios. La mayoría de los productos Nike son fabricados por contratistas independientes. La compañía vende sus productos

Formación ICIP IoT: gemelos digitales IoT

Un gemelo digital es una representación virtual de un producto o sistema, una copia exacta de un objeto o proceso físico, que se puede utilizar para simular las capacidades del producto o sistema. Los modelos

Razones por las cuales las conexiones Wi-Fi se caen

Una curiosidad sobre las razones por las cuales las conexiones Wi-Fi se caen es que a veces puede deberse a interferencias externas. Por ejemplo, si hay muchos dispositivos electrónicos cerca del enrutador de Wi-Fi, como

Sitio de Apache pirateado a través de claves SSH

El sitio Apache.org sufrió una intrusión durante el fin de semana, lo que provocó la eliminación del sitio. El ataque se produjo a través de un tercero que alojaba los servidores del proveedor utilizados para

El navegador Skyfire lleva videos Flash al iPhone

Skyfire ha lanzado su navegador para iPhone, permitiendo por primera vez videos Flash basados ​​en navegador para usuarios de teléfonos Apple. El navegador se puso en marcha en la App Store el miércoles por $

¿Qué es ICD-10-CM (modificación clínica)?

El ICD-10-CM (Clasificación Internacional de Enfermedades, Décima Revisión, Modificación Clínica) es un sistema utilizado por médicos y otros proveedores de atención médica para clasificar y codificar todos los diagnósticos, síntomas y procedimientos registrados junto con

¿Qué es IFTTT (If This Then That)?

If This Then That (IFTTT, que rima con «regalo») es un servicio en línea que automatiza las tareas basadas en la Web para que cuando ocurran eventos especificados por el usuario, se activen y gestionen

Uso eficaz de MS Search – Windows Enterprise Desktop

Debido a que trabajo como escritor, a menudo me encuentro buscando referencias específicas en mi trabajo anterior. Esto significa que aprecio las herramientas de búsqueda que ofrecen un acceso rápido y fácil al contenido de

Suncor – ServiceNow – Historia del cliente

Para prosperar en un mundo digital, Suncor impulsa el compromiso de los empleados y mejora el desempeño comercial Como empresa líder en energía a nivel mundial, Suncor necesita crear una ventaja competitiva sostenible y mejorar

3 Fondos Mutuos de Energía Alternativa para 2022

La industria de la energía alternativa está creciendo rápidamente a medida que las personas, las empresas y los gobiernos aumentan el uso de energía solar, eólica, geotérmica, hídrica y de otras fuentes. Se espera que

Consolidación e integración ERP

Nota del editor La planificación de recursos empresariales (ERP) es un término que denota software que automatiza una amplia gama de actividades que ayudan a una empresa a administrar sus responsabilidades. Si bien las aplicaciones

Costo social marginal (MSC)

¿Qué significa costo social marginal? El costo social marginal (MSC) es el costo total que paga la empresa por la producción de otra unidad o por acciones posteriores en la economía. El costo total de

Crear sitio web | Krypton Solid

¿Quiere crear un sitio web de aspecto profesional, quizás optimizado para su visualización en dispositivos móviles, que le permita expresarse libremente y/o promocionar su negocio? Si no eres un gran experto en programación web y

Cómo limitar los comentarios en Instagram

aplicaciones Instagram con frecuencia, y dado que le importa mucho su privacidad, le gustaría habilitar opciones para limitar la capacidad de comentar su contenido por parte de personas que no conoce. Lamentablemente, la tecnología no