概述
平均故障间隔时间又称平均无故障时间,英文全称是“Mean Time Between Failure”指可修复产品两次相邻故障之间的平均时间,记为MTBF。MTBF是衡量一个产品(尤其是电器产品)的可靠性指标。单位为“小时”。它反映了产品的时间质量,是体现产品在规定时间内保持功能的一种能力。具体来说,它仅适用于可维修产品。同时也规定产品在总的使用阶段累计工作时间与故障次数的比值为MTBF。磁盘阵列产品一般MTBF不能低于50000小时。
MTBF计算随着伺服器的广泛应用,对伺服器的可靠性提出了更高的要求。所谓“可靠性”,就是产品在规定条件下和规定时间内完成规定功能的能力;反之,产品或其一部分不能或将不能完成规定的功能是出故障。概括地说,产品故障少的就是可靠性高,产品的故障总数与寿命单位总数之比叫“故障率”(Failure rate),常用λ表示。一款可用于服务器的WD Caviar RE2 7200 RPM 硬盘,MTBF 高达 120万小时,保修 5年。120万小时约为137年,并不是说该种硬盘每只均能工作137年不出故障。由MTBF=1/λ可知λ=1/MTBF=1/137年,即该硬盘的平均年故障率约为0.7%,一年内,平均1000只硬盘有7只会出故障。当产品的寿命服从指数分布时,其故障率的倒数就叫做平均故障间隔时间(Mean Time Between Failures),简称MTBF。
设有一个可修复的产品在使用过程中,共计发生过N0次故障,每次故障后经过修复又和新的一样继续投入使用,其工作时间分别为T1、T2、T3、T4、T5......T0:那么产品的平均故障间隔时间,也就是平均寿命为Q为:
Q=MTBF=
通常,我们在产品的手册或包装上能够看到这个MTBF值,如8000小时,2万小时,那么,MTBF的数值是怎样算出来的呢,假设一台电脑的MTBF 为3万小时,是不是把这台电脑连续运行3万小时检测出来的呢?答案是否定的,如果是那样的话,我们有那么多产品要用几十年都检测不完的。其实,关于 MTBF值的计算方法,目前最通用的权威性标准是MIL-HDBK-217、GJB/Z299B和Bellcore,分别用于军工产品和民用产品。其中,MIL-HDBK-217是由美国国防部可靠性分析中心及Rome实验室提出并成为行业标准,专门用于军工产品MTBF值计算,GJB/Z299B是我国军用标准;而Bellcore是由AT&TBell实验室提出并成为商用电子产品MTBF值计算的行业标准。
MTBF计算中主要考虑的是产品中每个器件的失效率。但由于器件在不同的环境、不同的使用条件下其失效率会有很大的区别,例如,同一产品在不同的环境下,如在实验室和海洋平台上,其可靠性值肯定是不同的;又如一个额定电压为16V的电容在实际电压为25V和5V下的失效率肯定是不同的。所以,在计算可靠性指标时,必须考虑上述多种因素。所有上述这些因素,几乎无法通过人工进行计算,但借助于软件如MTBFcal软件和其庞大的参数库,我们就能够轻松的得出MTBF值。
可靠性是最初是确定一个系统在一个特定的运行时间内有效运行的概率的一个标准。可靠性的衡量需要系统在某段时间内保持正常的运行1。
MTTF、MTBF和MTTR的区别可靠性是最初是确定一个系统在一个特定的运行时间内有效运行的概率的一个标准。可靠性的衡量需要系统在某段时间内保持正常的运行。
目前,使用最为广泛的一个衡量可靠性的参数是,MTTF(mean time to failure,平均失效前时间),定义为随机变量、出错时间等的"期望值"。但是,MTTF经常被错误地理解为,"能保证的最短的生命周期"。MTTF 的长短,通常与使用周期中的产品有关,其中不包括老化失效。
MTTR(mean time to restoration,平均恢复前时间),源自于IEC61508中的平均维护时间(mean time to repair),目的是为了清楚界定术语中的时间的概念,MTTR是随机变量恢复时间得期望值。它包括确认失效发生所必需的时间,以及维护所需要的时间。 MTTR也必须包含获得配件的时间,维修团队的响应时间,记录所有任务的时间,还有将设备重新投入使用的时间。
MTBF(Mean time between failures,平均故障间隔时间)定义为,失效或维护中所需要的平均时间,包括故障时间以及检测和维护设备的时间。对于一个简单的可维护的元件,MTBF = MTTF + MTTR。因为MTTR通常远小于MTTF,所以MTBF近似等于MTTF,通常由MTTF替代。MTBF用于可维护性和不可维护的系统。
MTBF分析的目的1)针对高频率故障零件的重点对策及零件寿命延长的技术改造依据。
2)进行零件寿命周期的推算及最佳维修计划编制。
3)有关点检对象、项目的选择与点检基准的设定、改善。
4)用于指导内外部维修工作分配。根据公司内设备修复能力的评价,以设备类型、作业种类的不同来决定内部分别承担工作的维修质量与设备效率方面的风险,作为维修外包的重要参考。
5)设定备品备件基准。机械、电气零件的各储备项目及基本库存数量,应根据MTBF的记录分析来判断,使其库存水平达到最经济的状况。
6)作为选择维修技术方法改善重点的参考依据。为了提高设备开动率,必须缩短与设备停机相关的长时间维修作业及工程调整、切换的时间。因此,有必要对维护作业方法进行检验,而其检验的项目、优先顺序的选择等基本情况,均需要依据MTBF的分析记录表。
7)用于设备对象设定预估运行时间标准,及其维护作业的选定与维护时间标准的研究。维修计划预估时间标准的设定及维护作业的选定,必须考虑设备维护重复周期或标准时间值与实际维护时间的差异及相应维护作业特性等因素,因此,MTBF分析表是非常必要的。
8)图样整理及重新选定重点设备或零件时的参考。MTBF的分析记录表所记录的设备零件改造项目或摩擦劣化等信息,以及设备图样修改或前期制作等情况,通过能经常作分析检验及重要性排序管理,可以使工程图样管理变得更容易。
9)运行操作标准的设定、修订及决定设备维护业务的责任分派。
10)提供设备的可靠性、可维修性设计的技术资料。维护技术最重要的是以MTBF分析表为基础,收集有关设备的可靠性、可维修性设计的技术信息,以便提供给设计部门在设计设备时参考。
MTBF分析的应用1)对于维修部门而言,很难了解维修活动与产品质量间的关系。例如,就故障修理而言,一般多以功能修理为重点,不会去确认维修作业所达到的产品质量改善的情况。但如何将产品质量和维修活动相结合,是非常重要的,MTBF分析表可作为重要的参考资料。
2)PM(生产维修)是着重以设备诊断技术为中心的预知维修,但其具体课题结果是很难把握的;从MTBF分析表中,找出设备诊断技术开发的课题,是一种很有效果的做法。
3)设备培训资料的制作:培养对设备熟悉、能力强的人员是PM的重要课题,然而一般培训多以市面上销售书籍为范本,并没有充分结合自己公司、单位的问题状况,与书本上所述的背景问更存在着差异。因此,如果能利用MTBF分析,培训有关公司生产设备的结构、功能、薄弱环节及注意事项,是较具体的做法。
4)关于设备寿命周期费用(LifeCycleCost,LCC)的把握及其研究资料:MTBF分析表,是以设备为主体,经长期而编制的一览表。因此,根据设备所发生的维修作业、费用、备品备件及损失的发生状况,来掌握设备寿命周期费用资料,是设备一生管理的重要基础。综上所述,MTBF分析不仅是维修记录的方法之一,其维修记录更可作为维护活动、管理和技术活动指南的原始资料,价值和意义重大2。
MTBF分析表步骤1:确定要分析的设备对象——通常先选择重点设备来记录,也可以按某类设备群或针对设备某重点部位进行记录。
步骤2:故障资料的收集——以过去3~5年或至少30次以上的设备故障资料来分析。
步骤3:故障分布图的绘制——将设备整体示意图绘出,利用步骤2的资料,标示出故障部位。
步骤4:编制MTBF分析表。
分析表的内容以能记入一年的资料为准。
将步骤3的内容,按部位类别、发生日期顺序记录。
尽可能用图形方式或颜色类别、记号记录,以增加易读性。
持续记录到“设备突发故障为零时”为止。
步骤5:故障分析及对策的检验。
由MTBF分析表来做故障原因分析及对策检验(常用的分析方法包括柏拉图、特征要因图(鱼骨图)和故障树法等)。
对策方法应采用易懂的方式,并切实可行。