La mayoría de fabricantes de componentes de hardware, especialmente cuando hablamos de dispositivos de almacenamiento y de ventiladores para PC, suelen dar el dato de MTBF expresado en horas (muchas veces, millones de horas). En este artículo te vamos a contar qué es este parámetro, para qué sirve y cómo se calcula para que puedas entender su importancia y repercusión.
«Este SSD tiene un MTBF de 1,5 millones de horas». Es una expresión con un valor altísimo (1,5 millones de horas equivale a más de 171 años) que está relacionada con la fiabilidad de un componente, pero es tan alto el valor que nos hace dudar porque, al fin y al cabo, nadie se imagina un componente funcionando durante tantísimo tiempo, ¿verdad?
Qué es el MTBF y para qué sirve
MTBF viene de las siglas en inglés de Mean Time Before Failures o tiempo medio entre fallos. Denota el tiempo previsto entre fallos de un sistema mecánico o electrónico durante el funcionamiento normal del sistema. Este valor se suele calcular como media aritmética (promedio), y se utiliza para sistemas que se pueden reparar. Esto es importante, porque también existe el término MTTF (Mean Time To Failure) que es el equivalente pero cuando no hay reparación posible.
Por lo tanto, la definición de MTBF depende de la definición de lo que el fabricante considere un fallo, es decir, es algo subjetivo. En el caso de sistemas complejos y reparables se considera que los fallos son aquellos fuera de las condiciones de diseño que ponen al sistema fuera de servicio y en estado de reparación. Los fallos que puedan darse pero que no dejen al sistema fuera de servicio, no se tienen en cuenta.
En todo caso, se supone que este parámetro es el tiempo que un componente es capaz de funcionar antes de que comience a sufrir fallos, y se calcula como media aritmética de lo que prevé el fabricante, ni más ni menos. No es por lo tanto un valor exacto ni fiable.
Pongamos un ejemplo para entenderlo mejor: supongamos tres sistemas idénticos que comienzan a funcionar correctamente al mismo tiempo (tiempo 0) hasta que todos ellos fallan. El primer sistema falla después de 100 horas, el segundo tras 120 horas y el tercero se mantiene funcionando 130 horas antes de fallar. El MTBF de los sistemas es el promedio de estos tres tiempos de fallo, que es de 116,667 horas. Si además estos sistemas no se pudieran reparar, estaríamos hablando de MTTF.
Así pues, este parámetro sirve para decirnos lo que el fabricante «calcula» que es el tiempo de vida medio de un dispositivo antes de que de algún fallo electrónico o mecánico, y cuidado con esto porque no contempla otro tipo de fallos, como por ejemplo que las celdas de un SSD hayan llegado a su límite de escrituras (no se considera que haya fallado, sino que ha llegado al final de su vida útil).
¿Para qué sirve entonces este parámetro? ¿Es fiable?
El valor MTBF se puede utilizar como parámetro de fiabilidad del sistema o para comparar diferentes sistemas o diseños. Este valor solo deben entenderse condicionalmente como «vida media» y no como una identidad cuantitativa entre unidades en funcionamiento y averiadas.
Dado que se puede expresar como la expectativa de vida media, muchos ingenieros suponen que el 50% de los componentes habrán fallado cuando lleguen a su MTBF. Esta inexactitud puede conducir a malas decisiones de diseño, porque además la predicción de probabilidad de fallo implica la ausencia total de fallos sistemáticos (es decir, una tasa de fallos constante con solo fallos intrínsecos y aleatorios), lo cual no es fácil de verificar.
Dicho todo esto, debéis saber que el MTBF si bien es un valor de fiabilidad, en realidad es más bien de confiabilidad. Este valor no nos garantiza que un componente vaya a funcionar por un tiempo determinado, porque al fin y al cabo solo se consideran los fallos electrónicos y mecánicos al calcular este valor y no se tienen en cuenta muchas otras variables circunstanciales, como el tipo de uso, condiciones ambientales y un largo etcétera.
Lo que os queremos decir con esto es que si bien el MTBF puede ser indicativo de que un producto es fiable, no nos garantiza absolutamente nada (al fin y al cabo es una predicción y un cálculo… nadie ha estado probando un ventilador durante 171 años para asegurarte de que su tiempo medio entre fallos es de 1,5 millones de horas).