Un servidor o cualquier sistema de TI configurado como HA es uno que la administración considera importante para el funcionamiento del negocio. En pocas palabras, cuando un servidor HA falla, tiene un efecto negativo en el negocio. Entonces, ¿debería probarlos? Dos expertos opinan.
Kevin Tolly: Si bien la cuestión de cómo verificar la alta disponibilidad (HA) es específica de los servidores en clúster, probablemente sea beneficioso considerar los principios de prueba de HA en general.
Se deben equilibrar dos preocupaciones al decidir sobre la frecuencia de verificación de HA:
- ¿Cuál es el nivel de efecto en el negocio si falla un sistema HA? Si es alto, este es un voto para pruebas frecuentes.
- ¿Qué nivel de efecto tiene una prueba fallida en la base de usuarios en vivo? Si es alto, este es un voto para pruebas poco frecuentes.
Muchas empresas responderán «alto» a ambas preguntas. Las organizaciones de TI quieren evitar un sistema fallido y una prueba fallida, por lo que necesitan encontrar un equilibrio.
Si el presupuesto está disponible, cree un sistema de sombra para reflejar su entorno de servidor HA. Incluya servidores, conmutadores, cortafuegos y cualquier otra infraestructura de alta disponibilidad que exista en producción. La configuración del espejo debe usar los mismos componentes que el entorno en vivo hasta los niveles de versión de software de los sistemas operativos, controladores, etc. Este entorno de prueba permite al equipo de TI tensar con frecuencia aspectos del clúster de alta disponibilidad, incluso hacerlo a diario, sin que ningún fallo afecte al entorno de producción real.
Incluso con una granja de servidores en la sombra para realizar pruebas, las organizaciones de TI deben probar sus servidores de producción en vivo. Recomiendo una estrategia de dos puntas: pruebe periódicamente los servidores de alta disponibilidad y pruébelos después de cualquier cambio o actualización importante de hardware o software del sistema.
Otorgue a los gerentes de negocios el control sobre la ventana de interrupción del usuario que causarán las pruebas del servidor HA en vivo. Cuanto más espere entre pruebas, mayor será la probabilidad de que las medidas de seguridad de HA implementadas no funcionen. Apunte a una prueba en vivo al menos una vez por trimestre. Además, si se introducen nuevos elementos, componentes o versiones de software importantes en el entorno de alta disponibilidad, programe una prueba de la alta disponibilidad para asegurarse de que la «actualización» no haya roto los sistemas de disponibilidad.
Joe Clabby: La única vez que me meto con un clúster de alta disponibilidad es si tiene un problema de rendimiento, lo que requiere algunas pruebas para identificar la causa y solucionar el problema.
Independientemente de la calidad del nivel de servicio que espera de un clúster de alta disponibilidad, las pruebas no deberían ser necesarias con frecuencia, porque:
- Si necesita un tiempo de actividad del 100% en los servidores de alta disponibilidad, el clúster ya debería ser tolerante a fallos, lo que significa que puede realizar pruebas con poca frecuencia.
- Si el requisito de tiempo de actividad es de cuatro nueves (99,99%), aún puede probar el entorno del servidor HA con poca frecuencia porque el requisito de tiempo de actividad permite cierto tiempo de inactividad.
- El tiempo de actividad de cinco nueves (99,999%) indica que la organización de TI espera una excelente disponibilidad. El clúster de servidores está configurado para proporcionar eso; Recomiendo realizar pruebas en raras ocasiones.
Sobre los expertos:
Kevin Tolly es fundador de El grupo Tolly, que proporciona servicios de validación / prueba de terceros. Tolly también es el fundador y director ejecutivo de Tolly Research, que brinda servicios de investigación a proveedores de TI y empresas de usuarios finales.
Joe Clabby es el presidente de Clabby Analytics y tiene más de 32 años de experiencia en la industria de TI, con puestos en marketing, investigación y análisis. Clabby es un experto en servicios de reingeniería de aplicaciones, diseño de sistemas y almacenamiento, infraestructura de centros de datos y gestión de servicios integrados. Ha elaborado informes técnicos detallados sobre diversas tecnologías, proporcionando orientación sobre numerosos temas, como virtualización, aprovisionamiento, computación en la nube y diseño de aplicaciones.