Chaos Monkey es una herramienta de software que fue desarrollada por ingenieros de Netflix para probar la resistencia y la capacidad de recuperación de sus Amazon Web Services (AWS).
El software simula fallas de instancias de servicios que se ejecutan dentro de Auto Scaling Groups (ASG) al apagar una o más de las máquinas virtuales. Según los desarrolladores, Chaos Monkey recibió su nombre por la forma en que causa estragos como un mono salvaje y armado suelto en un centro de datos.
Chaos Monkey se basa en el principio de que la mejor manera de evitar fallas importantes es fallar constantemente. Sin embargo, a diferencia de las fallas inesperadas, que parecen ocurrir en los peores momentos posibles, el software está excluido de forma predeterminada. También se puede configurar para optar por participar.
Chaos Monkey tiene un programa configurable que permite que ocurran fallas simuladas en momentos en que se pueden monitorear de cerca. De esta manera, es posible prepararse para errores inesperados importantes en lugar de simplemente esperar a que ocurra una catástrofe y ver qué tan bien puede administrar.
Chaos Monkey fue el miembro original de Simian Army de Netflix, una colección de herramientas de software diseñadas para probar la infraestructura de AWS. El software es de código abierto para permitir que otros usuarios de servicios en la nube lo adapten para su uso.
Se han agregado otros miembros del Ejército Simio para crear fallas y verificar condiciones anormales, configuraciones y problemas de seguridad. Chaos Gorilla, otro miembro del Ejército Simio, simula cortes en regiones enteras.
Los ingenieros de Netflix planean agregar más monos al ejército, algunos basados en sugerencias de la comunidad.
Esto se actualizó por última vez en Agosto 2013
Continuar leyendo sobre Chaos Monkey