Los servidores como hardware tienden a llamar la atención solo cuando es el momento de actualizarse o cuando algo sale mal. Los tipos más comunes de fallas de hardware del servidor son fallas de discos duros, fuentes de alimentación, adaptadores RAID, placas base, RAM o CPU. Hay una serie de medidas preventivas que puede tomar para minimizar la probabilidad de una falla y tener la mejor posibilidad de una recuperación rápida en caso de una falla.
Utilice un buen equipo y cuídelo bien.
Primero, use un buen hardware y protéjalo bien. Si bien es posible utilizar una PC estándar como servidor, es una receta para el desastre en cualquier servidor de producción. Los servidores dedicados utilizan placas que están diseñadas para funcionar las 24 horas del día, los 7 días de la semana y, en general, están mejor diseñadas para reducir la probabilidad de fallas.
En el extremo superior, los servidores de fabricantes como Hewlett-Packard Co. y Dell pueden incluso incluir características como fuentes de alimentación duales, capacidad de intercambio en caliente para ranuras PCI y RAM tolerante a fallas que continuará funcionando incluso si falla un módulo RAM. De manera similar, tener una matriz RAID 5 o 10 es básico, pero el uso de unidades de clase empresarial también es importante. Busque las designaciones Raid Edition o Enterprise para asegurarse de que las unidades estén diseñadas para funcionar en un ciclo de trabajo 24 horas al día, 7 días a la semana.
En segundo lugar, proteja el hardware. Asegúrese de que los servidores estén conectados a protectores de sobretensión o fuentes de alimentación ininterrumpida (UPS) de alta calidad (no a $ 7,99). Los servidores y sus filtros de entrada de aire deben limpiarse con regularidad. El polvo metálico que a menudo se acumula en los edificios industriales puede contener partículas metálicas que no solo pueden hacer que un servidor se sobrecaliente, sino que también lo cortocircuite. No deje las ranuras descubiertas si quita las placas: los insectos y los ratones pueden entrar a través de los orificios descubiertos y causar estragos en el sistema.
Asegúrese de que los sistemas estén bien ventilados. Si están montados en bastidores, los orificios de ventilación no deben cubrirse, pero los equipos apilados en un armario de cableado pueden terminar fácilmente con salidas de ventilación obstruidas, lo que es una forma segura de sobrecalentar y acortar la vida útil de un servidor. También es una necesidad una refrigeración adecuada para el número de servidores. La sala de servidores no debe estar a más de 70 grados Fahrenheit, y cuanto más frío permanezca el equipo, más tiempo debería durar.
Qué hacer si el hardware falla de todos modos
Si después de todas las precauciones, el equipo falla de todos modos (lo que ocurrirá en ocasiones), puede hacer una de dos cosas: pagar más por el servicio en el lugar durante la noche y confiar en que el fabricante cumplirá con los términos del acuerdo. o tenga repuestos a mano. Si todos sus servidores se compraron al mismo fabricante al mismo tiempo, será relativamente barato tener al menos algunos repuestos a mano: una fuente de alimentación, una placa base, una CPU adicional o dos, suficiente RAM para un sistema y dos o tres unidades adicionales.
Si no compró sus sistemas al mismo tiempo, se vuelve más complejo. Incluso si todas son del mismo fabricante, es posible que las placas base no sean las mismas, incluso si el número de modelo lo es, y el mismo modelo también puede tener diferentes CPU y memoria. Puede ser más sencillo mantener un servidor adicional listo para usar y mover los discos de un servidor existente que se rompe al sistema de respaldo.
Reemplazar componentes es generalmente sencillo una vez que averigua qué está causando el problema. Los servidores son modulares y es un trabajo sencillo de quitar y reemplazar. Los servidores dedicados pueden incluso facilitar esta pieza, con luces de avería que muestran exactamente dónde se encuentra una falla o qué pieza ha fallado. Lo único importante a tener en cuenta es la descarga electrostática; asegúrese de conectarse a tierra tocando la fuente de alimentación antes de manipular cualquier componente.
Sobre el Autor:
Logan Harbaugh es un revisor independiente, analista y consultor de sistemas de red, que se especializa en revisiones de hardware y software de red, incluidos sistemas operativos de red, agrupación en clústeres, equilibrio de carga, almacenamiento conectado a la red y redes de área de almacenamiento, simulación de tráfico, administración de red y hardware de servidor.
¿Qué te pareció esta función? Escriba a Matt Stansberry de SearchDataCenter.com sobre sus inquietudes sobre el centro de datos en [email protected].