sábado, 12 de marzo de 2011

Niveles de disponibilidad

Regularmente ando buscando esta información y no la tenía a la mano…


Entonces, ¿qué porcentaje de disponibilidad será el adecuado para una aplicación determinada? A continuación se incluyen algunas pautas:

Categoría Número de errores anual Tiempo de inactividad anual Tiempo medio de reparación Disponibilidad
No comercial 10 88 horas 10 horas 99.00%
Comercial 5 44 horas 8,8 horas 99.50%
Crítica para la empresa 4 8,5 horas 2,25 horas 99.90%
Crítica para una misión 4 1 hora 0,25 horas 99.99%
Nota Para realizar estos cálculos de disponibilidad se han utilizado 365,25 X 24 = 8.766 horas al año.

fuente: Microsoft MSDN


Tal y como se describe en el tema referente a la confiabilidad, se pueden producir errores en las aplicaciones por muchos motivos:

  • Comprobación inadecuada
  • Problemas relacionados con cambios en la administración
  • Falta de control y análisis continuados
  • Errores en las operaciones
  • Código poco consistente
  • Ausencia de procesos de diseño de software de calidad
  • Interacción con aplicaciones o servicios externos
  • Condiciones de funcionamiento distintas (cambios en el nivel de uso, sobrecargas máximas)
  • Sucesos inusuales (errores de seguridad, desbordamientos en la difusión)
  • Errores de hardware (discos, controladores, dispositivos de red, servidores, fuentes de alimentación, memoria, CPU).
  • Problemas de entorno (red eléctrica, refrigeración, incendios, inundaciones, polvo, catástrofes naturales)

Alrededor de un 40 por ciento del tiempo de inactividad de las aplicaciones se debe a una comprobación inadecuada, a una administración de cambios y a la ausencia de un control continuo de los errores. Otro 40 por ciento se debe a errores operativos producidos por la ausencia de procedimientos rigurosos y a errores de copia de seguridad/restauración. La confiabilidad del hardware ha mejorado durante los últimos años que menos del 10 por ciento del tiempo de inactividad se debe a problemas de hardware. El 10 por ciento restante del tiempo de inactividad se debe a problemas de entorno y a problemas de otro tipo.

En términos generales, se puede decir que la disponibilidad es una medida de la frecuencia con la que se puede utilizar la aplicación. Para ser más exactos, la disponibilidad es un cálculo porcentual del tiempo en que la aplicación está realmente disponible para controlar las solicitudes de servicio en comparación con el tiempo de ejecución total disponible previsto. El cálculo formal de la disponibilidad incluye el tiempo de reparación, ya que una aplicación que se está reparando no está disponible.

En el cálculo de la disponibilidad se utilizan varias medidas:

Nombre Acrónimo Cálculo Definición
Tiempo medio entre errores MTBF Horas / número de errores Duración media de funcionamiento de la aplicación antes de que produzca errores.
Tiempo medio de recuperación MTTR Horas de reparación / número de errores Tiempo medio necesario para reparar y restaurar el servicio después de que se produzca un error.

La fórmula de disponibilidad tiene esta forma:

Disponibilidad = (MTBF / (MTBF + MTTR)) X 100

Considere, por ejemplo, una aplicación concebida para que funcione continuamente. Pongamos un punto de control de 1.000 horas consecutivas, dos errores de una hora durante ese período darían lugar a una disponibilidad de ((1.000/2) / ((1.000/2) + 1)) X 100 = (500 / 501) X 100 = 0,998 X 100 = 99,8 %.

Una forma conocida de describir la disponibilidad es mediante los "nueves": los tres nueves de una disponibilidad de un 99,9%. No obstante, hay que tener en cuenta que las implicaciones de la medición por nueves a veces se malinterpretan. Es necesario realizar algunos cálculos para descubrir que tres nueves (disponibilidad de un 99,9%) representan aproximadamente 8,5 horas de interrupción de servicio en un solo año. El nivel inmediatamente superior, cuatro nueves (99,99%), representa alrededor de una hora de interrupción de servicio en un año. Cinco nueves (99,999%) representan sólo cinco minutos de interrupción al año.

fuente: Microsoft MSDN

Etiquetas de Technorati: ,