MTBF,即平均故障间隔时间,英文全称是“Mean TimeBetweenFailure”。是衡量一个产品(尤其是电器产品)的可靠性指标。单位为“小时”。它反映了产品的时间质量,是体现产品在规定时间内保持功能的一种能力。具体来说,是指相邻两次故障之间的平均工作时间,也称为平均故障间隔。产品故障少的就是可靠性高,产品的故障总数与寿命单位总数之比叫“故障率”(Failurerate)。它仅适用于可维修产品。也规定产品在总的使用阶段累计工作时间与故障次数的比值为MTBF。磁盘阵列产品一般MTBF不能低于五千小时。
MTBF计算方法:
MTBF是可修复产品可靠性的一种基本参数。度量方法为:在规定的条件下和规定的时间内,产品的寿命单位总数与故障总次数之比
MTBF值是产品设计时要考虑的重要参数,可靠度工程师或设计师经常使用各种不同的方法与标准来估计产品的MTBF值。相关标准包括MIL-HDBK-217F、TelcordiaSR332、SiemensNorm、Fides或UTEC80-810(RDF2000)等。这些方法估计到的值和实际的平均故障间隔仍有相当的差距。计算平均故障间隔的目的是为了找出设计中的薄弱环节。
MTBF的数学式表达:
在工程学上,常用希腊字母θ来表示MTBF,既有:
在概率论中,可用(t)形式的概率密度方程表示MTBF,既有:
此处指的是直到下次失效经过时长的概率密度方程——满足标准概率密度方程——
设有一个可修复的产品在使用过程中,共计发生过N0次故障,每次故障后经过修复又和新的一样继续投入使用,其工作时间分别为:T0,T1。那么产品的平均故障间隔时间,也就是平均寿命为Q为:(T0+T1)/N0。
关于MTBF值的计算方法,*通用的性标准是MIL-HDBK-217、GJB/Z299B和Bellcore,分别用于**产品和民用产品。其中,MIL-HDBK-217是由美国国防部可靠性分析中心及Rome实验室提出并成为行业标准,专门用于**产品MTBF值计算,GJB/Z299B是我国军用标准;而Bellcore是由AT&TBell实验室提出并成为商用电子产品MTBF值计算的行业标准。
MTBF计算中主要考虑的是产品中每个器件的失效率。但由于器件在不同的环境、不同的使用条件下其失效率会有很大的区别,例如,同一产品在不同的环境下,如在实验室和海洋平台上,其可靠性值肯定是不同的;又如一个额定电压为16V的电容在实际电压为25V和5V下的失效率肯定是不同的。在计算可靠性指标时,必须考虑上述多种因素。所有上述这些因素,几乎无法通过人工进行计算,但借助于软件如MTBFcal软件和其庞大的参数库,我们就能够轻松得出MTBF值。
故障时间:
随着服务器的广泛应用,对服务器的可靠性提出了更高的要求。所谓“可靠性”,就是产品在规定条件下和规定时间内完成规定功能的能力;产品或其一部分不能或将不能完成规定的功能是出故障。故障率常用λ表示,例如正在运行中的100只硬盘,一年之内出了2次故障,则每个硬盘的故障率为0.02次/年。当产品的寿命服从指数分布时,其故障率的倒数就叫做平均故障间隔时间(Mean Time Between Failures),简称MTBF。即:
MTBF=1/λ
假设一款可用于服务器的WD Caviar RE2 7200 RPM 硬盘,MTBF 高达120万小时,保修5年。120万小时约为137年,并不是说该种硬盘每只均能工作137年不出故障。由MTBF=1/λ可知λ=1/MTBF=1/137年,即该硬盘的平均年故障率约为0.7%,一年内,平均1000只硬盘有7只会出故障。