提高系统(或产品或元器件)在整个寿命周期内可靠性的一门有关设计、分析、试验的工程技术。系统可靠性是指在规定的时间内和规定条件(如使用环境和维修条件等)下能有效地实现规定功能的能力。系统可靠性不仅取决于规定的使用条件等因素,还与设计技术有关。有组织地进行可靠性工程研究,是20世纪50年代初从美国对电子设备可靠性研究开始的。到了60年代才陆续由电子设备的可靠性技术推广到机械、建筑等各个行业。后来,又相继发展了故障物理学、可靠性试验学、可靠性管理学等分支,使可靠性工程有了比较完善的理论基础。
系统可靠性可靠性工程衡量系统可靠性有三个重要指标。①保险期:系统建成后能有效地完成规定任务的期限,超过这一期限系统可靠性就会逐渐降低。②有效性:系统在规定时间内能正常工作的概率。概率的大小取决于系统故障率的高低、发现故障部分的快慢和故障修复时间的长短。③狭义可靠性:由结构可靠性和性能可靠性两部分组成。前者指系统在工作时不出故障的概率,后者指系统性能满足原定要求的概率。
系统可靠性不能仅仅依靠对系统的检验和试验来获得,还必须从设计、制造和管理等方面加以保证。首先,设计是决定系统固有可靠性的重要环节,制造部门力求使系统达到固有的可靠性,而管理则是保证系统的规划、设计、试验、制造、使用等阶段都按科学的程序和规律进行,即对整个系统研制实行严格的可靠性控制。
可靠性数学用来定量描述系统可靠性的数学工具。常用的度量指标主要有可靠度、故障率、平均无故障工作时间和平均故障修复时间等。①可靠度R():系统在规定工作时间内无故障的概率。如数字电压表工作 24小时的可靠度为0.9,即意味着多次抽取一定数量的该产品样品,在规定条件下工作24小时,平均有90%能保持全部产品性能处于有效的工作状态。相应地,系统在时间内发生故障的概率用F()表示,称为不可靠度,与可靠度R()的关系为R()=1-F()。②故障率λ:系统工作到 时刻时单位时间内发生故障的概率。系统在正常工作状况下,其故障率趋于稳定,可靠度与故障率的关系为R()=。③平均无故障工作时间:系统在相邻两次故障间隔内有效工作时的平均时间。④平均故障修复时间:系统出现故障后到恢复正常工作时的平均时间。
工作步骤步骤可靠性工程的具体工作步骤为:①通过试验或使用,发现系统在可靠性上的薄弱环节;②研究分析导致这些薄弱环节的主要内外因素;③研究影响系统可靠性的物理、化学、人为的机理及其规律;④针对分析得到的问题原因,在技术上、组织上采取相应的改进措施,并定量地评定和验证其效果;⑤完善系统的制造工艺和生产组织。
问题解决在影响系统可靠性的主要问题得到解决后,再采用上述步骤解决一些次要的薄弱环节。可靠性工程实质上是对影响系统可靠性的薄弱环节的不断发现和不断改进的过程。为了提高系统的可靠性,从而延长系统的使用寿命,降低维修费用,提高经济效益,在系统规划、设计、制造和使用的各个阶段都要贯彻以可靠性为主的质量管理。
可靠性定义定义可靠性是指产品在规定的条件下和规定的时间内,完成规定功能的能力。产品的可靠性与外界环境的应力状态和对产品功能的需求密切相关。理解产品的可靠性需要从两个角度出发,其一是按照产品的层次结构理解可靠性,其二是按照产品的全寿命周期理解可靠性。按照产品的层次结构理解可靠性是指需要根据产品各层次特点开展相应的可靠性工作;按照产品的全寿命周期理解可靠性是指在需求分析、总体设计、分项设计和生产、试验、使用、维修维护等过程都需开展相应的可靠性工作。
可靠性工程的具体项目产品的可靠性是设计出来的,生产出来的,管理出来的。可靠性工程是为了达到系统可靠性要求而进行的有关设计、管理、试验和生产一系列工作的总和,它与系统整个寿命周期内的全部可靠性活动有关。可靠性工程是产品工程化的重要组成部分,同时也是实现产品工程化的有力工具。利用可靠性的工程技术手段能够快速、准确地确定产品的薄弱环节,并给出改进措施和改进后对系统可靠性的影响。可靠性工程具体如下图1所示。产品在需求分析阶段、设计阶段、工程研制阶段和生产制造阶段都需开展一定的可靠性设计分析、管理、试验工作。开展的时机和推荐开展的项目如下表所示:
按照产品的层次结构,产品的系统层次、装置层次、部件层次和零件层次都分别有相应的可靠性工作内容,即产品不同层次的可靠性影响因素和薄弱环节各有特点,需要分别开展相应的可靠性设计、管理、试验工作项目解决。总师和项目管理者需要在产品的工程化角度把握可靠性工程的开展和实施。影响器件可靠性的主要因素包括器件的种类和数量、器件的额定工作电参数和电应力、额定工作温度和环境温度、元器件的质量等级和品质保证等级,器件的降额特性和热敏感特性,器件的储存可靠性;影响部件可靠性的主要因素包括器件本身的可靠性与器件相互影响,主要需要考虑的因素为热分析、电磁兼容、耐环境、信号完整性、潜通路和工艺工装;影响装置可靠性的主要因素包括部件之间的相互影响和结构、工艺、连接;影响系统可靠性的主要因素包括冗余设计、人机工程和系统可靠性设计。
建立可靠性工程体系,开展和实施可靠性工程是产品高可靠性的必要条件,可靠性设计分析是可靠性工程的基础,可靠性设计水平差的产品可靠性必然低;可靠性的设计需要可靠性管理,可靠性管理是开展可靠性设计的技术管理保证和组织结构保证;设计出的产品在生产阶段难免引入“瑕疵”,需要可靠性试验“暴露”。
可靠性具体工作思路需求开发阶段在需求开发阶段,要明确用户的可靠性需求,将用户的可靠性需求转化为明确的可靠性设计指标要求值;通过绘制可靠性框图和建立可靠性模型,对系统可靠性进行评估,并确定系统失效判定准则,明确返修的依据,并根据返修率调整售后服务策略。
总体设计阶段在总体设计阶段,需利用可靠性分配,将总体的可靠性指标值逐层分解,转化为各装置、的可靠性设计指标要求值,同时通过每个装置选用器件的大致种类、数量和使用条件进行可靠性预计,得出每个装置的基本可靠性设计值大致范围。可靠性分配结合可靠性预计确定每个装置的可靠性设计要求值。同时,在总体设计阶段需要建立可靠性工作组织和明确后续构建阶段、实现阶段和产品交付用户后,需要开展的可靠性设计分析、管理和试验工作项目,保证各装置的可靠性设计指标能够达到设计指标要求值。
构建阶段在构建阶段,需将装置的可靠性设计指标要求值分配到各部件,形成各部件可靠性设计指标要求值。分配需要结合预计的结果,最终得到相对合理的各部件可靠性指标设计要求值。
详细设计阶段详细设计阶段是分别开展器件级别、部件级别、整件级别、装置级别和系统级别的可靠性设计分析、可靠性试验和管理活动,确保产品各级设计可靠性指标达到可靠性指标要求值。元器件级的可靠性设计方法包括器件的选择与使用、降额设计、器件面向使用电应力设计和失效机理分析;电路的可靠性设计方法包括简化方案,避免片面追求高性能指标和过多的功能,合理划分软硬件功能和合理的元器件使用,综合热设计、容差与漂移设计、电气互连的可靠性设计、机械防振设计、气候环境防护设计、电磁兼容设计、工艺工装设计和对外协的要求。装置和系统的可靠性设计包括简化设计、冗余设计、热设计、环境防护设计、抗冲击、振动、嗓声设计、健壮设计、安装设计、原材料、零部件、元器件选用设计、包装、存储、装卸和运输设计、系统可靠性评估。各级系统除开展可靠性设计外,还需进行可靠性统计分析,确定各级系统的薄弱部位和关重件,外界条件敏感环节,设计改进措施/建议和改进后的效果。
流程产品定型后可靠性的提升将非常有限。根据产品研发的过程,可靠性工程的总体流程图如下:
产品可靠性工程的基础是用于开展可靠性具体设计分析工作的基础数据库,基础数据库是设计经验的汇总,需要导入专家的意见和设计经验。基础数据库的完备与否直接决定了开展可靠性设计分析工作的水平。产品的高可靠性不是一次达到的,是渐次逼近的过程。需要注意,开展可靠性工程并不能直接使产品具有高可靠性,可靠性工程是产品高可靠性的思路、手段、途径和制度保证。可靠性工程,是采购、研发、仓储、运输、质量、管理多个职能部门共同工作的结果,在任一个环节措施不当,都可能引入产品失效的随机过程。例如,研发人员应对产品采购提供技术支持,对器件的生产年限、采购渠道、工艺特性、包装要求和验收准则提出明确具体的要求;研发人员根据器件在储存条件下的失效过程提出器件的存储要求。
特性可靠性是产品质量诸多特性中的专门特性之一,产品的专门特性还包括维修性,可靠性工程的开展需要与维修性相互协调,协调的标准是总费用与可用度的权衡。
目前,无论国内外和军品、民品,可靠性工程都有了一定程度的积累,并形成了很多标准,企业需要根据自己产品的特点结合打造精益研发流程和管理流程的目标要求,结合现有公司的资源和成果物系统布局,从中吸取有价值的工具、方法、流程和模板,打造适合本企业业务特点的可靠性工程体系。
分类在科学实验、生产实践及日常生活各个方面,可靠性理论都具有重大意义。可靠性理论又分成了三个重要领域或三个独立学科。
(1)可靠性数学。可靠性数学是研究可靠性的理论基础。它着重研究解决各种可靠性问题的数学方法及数学模型,研究可靠性的定量问题。主要数学手段有概率论、数理统计、随机过程、运筹学、拓扑学等数学分支,应用于数据收集、数据分析、系统设计及寿命实验中。
(2)可靠性物理。可靠性物理又称为失效物理。它从机理方面、失效本质方面研究产品的不可靠因素,研究失效的物理原因与数学物理模型、检测方法及纠正措施等,如研究机械零件的疲劳损伤、裂纹的形成和扩展规律等,从而为研制、生产高可靠性产品提供理论依据。
(3)可靠性工程。可靠性工程是指为了达到产品可靠性要求而进行的有关设计、试验和生产等一系列工作。可靠性工程包括对零件、部件、装备和系统等产品的可靠性数据的收集、分析,可靠性设计、预测、试验、管理、控制和评价,是系统工程的重要分支。1
基本任务可靠性工程的基本任务概括起来就是:确定产品可靠性和获得产品可靠性。在时间上,这两个基本任务是相互穿插在一起的。确定产品可靠性就是通过各种途径,如各种预计、试验、系统分析等来确定产品的失效机理、失效模式以及各种可靠性特征量的数值或范围等。获得产品的可靠性就是通过产品的寿命循环期(包括仅存在于意识、图纸、计划、公式中的“虚”的产品时期和从产品生产、出厂到报费为止的“实”的产品时期),即从构思、审查、研制、生产、使用、维修等一系列活动中的各种获得并提高可靠性的各项措施,得到最优化的可靠性。
可靠性是衡量产品保持其功能的能力。丧失了功能就是发生了故障。研究可靠性实际上是从研究故障着手的。一切可靠性活动都是围绕故障展开的,都是为了防止、消除和控制故障的发生。一切可靠性投资都是为了提高产品可靠性,降低可靠性方面的风险。所以,对在研制、试验和使用过程中出现的故障,一定要抓住不放,充分利用故障信息去分析,评价和改进产品的可靠性。2
主要内容产品可靠性工程可分为以下三部分:
(1)可靠性管理。它包括制订可靠计划和其他可靠性文件,如可靠性标准等,对供应厂的可靠性监督,计划评审,建立失效报告、分析和改进系统,建立失效评审委员会,收集可靠性数据和进行可靠性教育等。
(2)可靠性设计。它包括建立可靠性模型,进行可靠性分配、可靠性预计和各种分析(失效模式、影响及后果分析、失效树分析、潜在通路分析、容差分析、贮备分析、功能试验、储存、装卸、包装、运输及维修的影响分析,并提出必要的对策),以及部件选择和控制,确定可靠性关键部件等。
(3)可靠性试验。包括环境应力筛选试验,可靠性增长试验,可靠性鉴定试验,可靠性验收试验等。
事实上,还有许多内容可作为可靠性工程的分支或与可靠性工程有关的边缘学科。例如由组成系统的单元可靠性出发研究系统可靠性问题的系统可靠性;专门研究可靠性工程数学基础的可靠性数学;专门研究机械结构可靠性问题的机械工程概率设计;研究在人一机系统中,人为因素造成的系统失效及对策的人机工程也与可靠性工程有关;还有研究软件故障及对策的软件可靠性等。
可靠性工作应该贯穿于产品寿命的全过程,它与产品的设计、制造、使用、维护、管理、人员因素和环境状况密切相关。设计、制造决定了产品的“固有可靠性”,使用、维护则能保持“使用可靠性”。因此,为提高产品的可靠性,需采取综合性措施。
可靠性工作主要包括可靠性工程技术与可靠性管理两个方面。一切可靠性工程技术活动都应在可靠性管理之下去规划、组织、协调、控制与监督。因此,可靠性管理在可靠性活动中应处于领导与核心地位。3
本词条内容贡献者为:
张静 - 副教授 - 西南大学