Cuando los nodos fallan en el centro de datos, las aplicaciones deben reiniciarse lo más rápido posible.
Las organizaciones de TI implementan un sistema para conmutar por error de un nodo a otro para permitir una rápida recuperación del servicio. La intervención manual para recuperar una aplicación ralentiza este proceso, especialmente si el nodo falla en medio de la noche o en un día festivo.
La mayoría de las aplicaciones críticas se implementan como demonios o servicios: se inician automáticamente cuando se inicia la computadora. En este caso, la conmutación por error inicia la máquina virtual donde está instalada la aplicación. La virtualización permite esta metodología de conmutación por error para cualquier aplicación que se ejecute dentro de una máquina virtual.
A veces, las aplicaciones necesitan algo más que reiniciar el sistema operativo. Las aplicaciones que no se escribieron como servicios pueden necesitar que un usuario inicie sesión en la máquina virtual y recupere la aplicación. Por lo general, esto solo es un problema en los servidores de Windows. Es bastante fácil de configurar con aplicaciones de inicio de sesión y de inicio de sesión automático, pero algunas aplicaciones también necesitan que el usuario haga clic en botones o abra menús antes de que la aplicación pueda ejecutarse nuevamente.
La conmutación por error automatizada de aplicaciones también es posible en este escenario. Utilizo scripts de AutoIT para automatizar el inicio de la aplicación después de la conmutación por error. Los scripts son buenos, pero este tipo de automatización es frágil: cada actualización de la versión de la aplicación puede romper el script.
El mayor problema son las aplicaciones a las que no les gusta fallar. Las aplicaciones que requieren un proceso de apagado y no pueden recuperarse de un apagado no planificado son difíciles de conmutar por error. Generalmente, estas aplicaciones requieren una mayor intervención manual, como enumerar y eliminar cada bloqueo de la base de datos. Puede ser más sencillo automatizar el proceso de alertas para reparar estas aplicaciones que automatizar los procesos de reparación.
Sobre el Autor:
Alastair Cooke es un formador independiente, consultor y bloguero que se especializa en virtualización de servidores y escritorios. Conocido en Australia y Nueva Zelanda por el Podcast de virtualización APAC y eventos de la comunidad regional, Cooke recibió el estado vExpert de VMware por sus esfuerzos en 2010.