Un acuerdo de nivel de servicio es un contrato entre un proveedor de servicios externo y sus clientes o entre una TI …
departamento y las unidades de negocio internas a las que sirve. El SLA documenta qué servicios producirá el proveedor o el departamento de TI y qué estándares de desempeño se espera que cumpla el proveedor o el departamento de TI.
¿Por qué son importantes los SLA?
Los SLA permiten a los clientes y las unidades de negocio internas (denominadas colectivamente aquí como «clientes») medir el rendimiento del proveedor de servicios o del departamento de TI (denominado colectivamente aquí «proveedor de servicios») y confirmar que está prestando servicios según el contrato. Normalmente, los SLA se establecen para cada área de servicio de TI, como el centro de llamadas, el centro de datos o el mantenimiento de aplicaciones. Los clientes crean SLA para cada servicio que compran a un proveedor de servicios, cada uno de los cuales incluye un subconjunto de métricas de desempeño.
¿Qué son los SLO y por qué son importantes?
Los objetivos de nivel de servicio (SLO) se refieren a las métricas de rendimiento, o niveles de servicio, asociados con un SLA. Los SLO describen, generalmente en términos mensurables, puntos de referencia u objetivos establecidos por las partes involucradas en torno a los servicios que un proveedor proporciona a un cliente dentro de un período de tiempo determinado. Por ejemplo, cuando se utiliza como métrica de un centro de llamadas, un SLO puede ser que los agentes del proveedor de servicios respondan al 80% de las llamadas entrantes en un minuto.
Aunque no existe una regla estricta y rápida que rija cuántos SLO se pueden incluir en cada SLA, solo tiene sentido medir lo que importa.
Cada SLO se corresponde con una única característica de desempeño relevante para la entrega de un servicio general. Algunos ejemplos de SLO para proveedores de servicios incluirían: disponibilidad del sistema, tiempo de resolución de incidentes de la mesa de ayuda y tiempo de respuesta de la aplicación.
Ocho componentes de un SLA
Los SLA suelen incluir los siguientes componentes:
- Título de nivel de servicio
- Definición de métrica de nivel de servicio
- Cálculo de la medición (la fórmula matemática utilizada para calcular el rendimiento)
- Tipo de medición (basada en unidades o basada en eventos)
- Fuente de medición (las herramientas utilizadas para monitorear o medir)
- Período de medición (el período de tiempo durante el cual se mide el desempeño)
- Activadores predeterminados (la métrica medible que deben cumplir los proveedores de servicios para evitar el crédito de nivel de servicio; por ejemplo, el tiempo de resolución para incidentes de alta gravedad es de dos horas)
- Crédito de nivel de servicio (monto financiero asociado con una métrica de desempeño, al que el cliente tiene derecho si no se logra el nivel de servicio)
Metodología SLA para la gestión de servicios
La metodología SLA se refiere a cómo funcionan los SLA; si el proveedor de servicios no se desempeña según las métricas acordadas, se obtiene un crédito. El octavo componente de la metodología SLA enumerada anteriormente también define el crédito máximo; por ejemplo, la metodología del contrato podría indicar que no se acreditará más del 15% de la factura mensual debido a fallas en el desempeño.
Los expertos de Google Liz Fong-Jones, un sitio del personal de confiabilidad
ingeniero y Seth Vargo, un defensor de los desarrolladores,
discutir la importancia de los SLO, SLA y SLI
en DevOps.
Otra parte de la metodología describe el conjunto de puntos que el cliente puede asignar entre las diversas métricas de desempeño del servicio para designar prioridades entre las métricas. Esto permite a los clientes aumentar el peso o la importancia asociados con una falla de rendimiento de un SLA en particular. Los clientes deberían poder cambiar los puntos a lo largo del tiempo, en función de las prioridades cambiantes.
Ejemplos de SLO
A continuación se muestran tres funciones de TI y ejemplos de SLO asociados con cada función. Los ocho componentes de los SLA enumerados anteriormente se pueden aplicar a los ejemplos aquí:
- Centro de datos: Disponibilidad de la aplicación; aprovisionamiento de instancias virtuales; tiempo de recuperación ante desastres (por ejemplo, el rendimiento debe restablecerse en dos horas).
- Mesa de ayuda: Resolución en la primera llamada (por ejemplo, el 60% de todos los problemas deben resolverse durante la primera llamada); tiempo de respuesta de la comunicación en vivo (por ejemplo, el 80% de las llamadas deben responderse en un minuto); tasa de abandono (por ejemplo, la persona que llama no debe abandonar más del 3% de las llamadas recibidas).
- Mantenimiento de aplicaciones: Tasas de error de regresión; implementaciones de parches; disponibilidad de la aplicación (por ejemplo, 99,9% de tiempo de actividad).
Análisis comparativo de las métricas de SLO para obtener resultados óptimos
Además de comprender cómo establecer y hacer cumplir los SLA para sus proveedores de servicios, los clientes deben determinar los activadores predeterminados de SLA adecuados en función de los requisitos específicos del cliente y de la industria. Esto puede significar decidir entre un 99,9% o un 99,999% de tiempo de actividad de la aplicación, por ejemplo, o entre un 20% de resolución en la primera llamada o un 60% de resolución en la primera llamada.
Establecer puntos de referencia es un paso clave en la creación de un SLA porque sin ellos, los clientes pueden estar pidiendo muy poco o demasiado a sus proveedores de servicios. A menudo, los clientes no tienen datos sobre su desempeño actual si no han subcontratado antes esa función en particular. O pueden estar insatisfechos con sus resultados actuales de subcontratación, si están usando SLA con métricas de desempeño deficientes. Los clientes que están más satisfechos con el desempeño de sus proveedores son aquellos que comprenden lo que soportará el mercado con respecto al desempeño del SLA.