Un objetivo de nivel de servicio (SLO) es la parte de un acuerdo de nivel de servicio (SLA) que documenta los indicadores clave de rendimiento (KPI) que el cliente debe esperar de un proveedor. Además de especificar detalles sobre el servicio que se está adquiriendo, un SLO también documenta cuáles serán las consecuencias si no se logran los SLO.
Un SLO contiene métricas medibles que se documentan y comparten entre las partes interesadas para brindar responsabilidad, producir una calidad de servicio (QoS) constante y demostrar un compromiso continuo. Los SLO se basan en indicadores de nivel de servicio (SLI), que son las métricas elegidas para medir.
Los SLO son útiles para que los líderes empresariales definan objetivos internos para mantener un nivel de servicio coherente y ayuden a evitar disputas sobre las expectativas entre un proveedor de servicios y un usuario final. Los ejemplos comunes de métricas que se pueden asociar con los SLO son el tiempo de recuperación ante desastres, la disponibilidad de la aplicación, el tiempo de respuesta de la comunicación en vivo, la tasa de resolución de la primera llamada y el mantenimiento de la aplicación.
Cómo funciona
Los SLO están destinados a definir un rango de lo que es más y menos aceptable para los estándares de desempeño. Como proceso paso a paso, la formación de un SLO debe comenzar con la definición de métricas clave o SLI.
Por ejemplo, si la latencia de un servicio es el SLI, el SLO puede indicar cuántas solicitudes se completarán por milisegundo y definir la tasa de error aceptable. Además, el SLA describiría a qué tiene derecho el cliente si no se cumple este objetivo.
Una vez que un proveedor de servicios y el usuario final acuerdan las métricas, los proveedores deben comenzar a recopilar y monitorear esas métricas (para esto se puede usar software de monitoreo como Nagios o Datadog). Se deben configurar alertas para notificar al proveedor de servicios para notificarles cuando el valor de SLO especificado cae por debajo de su tasa aceptable. Luego, los informes se pueden realizar y analizar como un SLI en función de esas mediciones.
Ejemplos de medidas de SLO
Cada objetivo corresponde a un único indicador de desempeño. Los SLO elegidos pueden variar según la importancia del servicio para el usuario final, los recursos disponibles y el presupuesto. Los SLO que se miden comúnmente incluyen el rendimiento, las frecuencias, los tiempos de respuesta, la latencia, la disponibilidad y las llamadas de soporte completadas. Los SLO se pueden medir en función del nivel de logro, que se puede mostrar como promedio, tasa o percentil.
No hay límite para la cantidad de SLO que se pueden incluir en cada SLA, pero debe restringirse solo a las mediciones que sean relevantes para el consumidor. Además, un proveedor de servicios debe evitar medir los clientes basados en Internet y las solicitudes HTTP, ya que la latencia puede variar enormemente en función de las conexiones a Internet.