跳到主要内容

白皮书

用失效物理方法增强MIL-HDBK-217可靠性预测

通过James G. McLeish, CRE


美国国防部(DoD)的国防标准化计划办公室(DSPO)已经启动了一项多阶段工作,对MIL-HDBK-217(217)进行更新,MIL-HDBK-217是军方经常模仿和经常批评的电子设备可靠性预测圣经。该文件基于现场数据拟合的经验模型,自1995年以来没有更新。缺乏更新导致人们期望其基于统计的经验方法将被逐步淘汰。特别是在基于科学的故障物理(PoF)(即可靠性物理)研究之后,负责研究、开发和采买的陆军助理部长Gilbert F. Decker宣布MIL-HDBK-217不会出现在陆军RFP采买要求中,因为它“被证明是不可靠的,它的使用可能导致错误和误导性的可靠性预测”。

尽管有这样的批评,MIL-HDBK-217现在正在更新,作为国防部最近气候的一部分,重新采用可靠性、可用性、可维护性和安全性(RAMS)方法。本文回顾了该文件的复兴和更新的原因,以及对其不足的主要关注。

致力于更新MIL-HDBK-217的团队提出了解决经验可靠性预测局限性的建议。开发了一种混合方法,其中改进和更全面的经验MTBF模型将用于项目收购-供应商选择活动期间的比较评估。随后,基于科学的PoF可靠性建模与概率力学技术相结合,被提出用于实际系统设计开发阶段,以评估和优化设计的应力和磨损限制,从而促进高可靠性、鲁棒性电气/电子(E/E)系统的创建。

将该方法纳入MIL-HDBK-217未来修订版H的提案已提交给国防部- DSPO,目前正在考虑实施和资助该提案的计划。本文综述了MIL-HDBK-217中PoF方法如何与经验预测技术共存的概念。这是从MIL-HDBK-217修订小组成员的角度来讨论的。作者感谢217工作组的领导和团队成员所做的贡献。这篇论文的动机是来自许多初创公司和成熟公司对焊点设计、可接受的材料组合和回流工艺开发的建议的请求。

mil-hdbk-217电子设备可靠性预测概述

MIL-HDBK-217中定义的两种经验可靠性预测方法称为“零件计数”和“零件应力”,用于根据其平均故障间隔时间(MTBF)估计电子设备的平均寿命,MTBF是故障率λ (Lambda)的倒数。在零件计数法中,MTBF值是通过对电子设备中每个组件的故障率之和(从通用表中)取倒数来确定的(见下面的公式)。

然后,这些基本故障率可以按比例计算,以说明在恶劣环境条件下运行造成的故障率的平均增加,例如;地面机动、海上、空中、导弹、太空等。MIL-HDBK-217可识别14种不同的通用环境条件。零件应力法提供了额外的通用比例因子,用于考虑诸如功率、电压和温度等使用应力对可靠性退化的影响。应力因子不能用于预测,直到程序成熟到可以通过使用电路仿真工具或功能设计原型的参数测量来量化这些应力的程度。应力因子可以通过元件降额准则在设计过程的早期使用,该准则为特定电路应用中的元件建立了应力规则。

mil - hdbk - 217的担忧

对于MIL-HDBK-217中所定义的经验可靠性预测方法,存在许多担忧。其他出版物4、5已全面讨论的主要批评总结如下:

  1. 手册的可靠性预测完全基于恒定的故障率,这意味着只模拟随机故障情况。使用恒定故障率是因为它简化了故障数据的收集和计算,这在20世纪50年代和60年代计算机化之前的世界是必要的,当时这些预测方法首次开发出来。当失效趋势仅通过指数分布建模为随机事件时,不考虑早期失效和磨损相关失效。将早期故障和磨损问题统计为随机故障的制表错误是该方案的另一个风险。当使用受污染(混合故障模式)基础数据的指数分布进行可靠性预测时,可能会出现重大错误。这样的不准确性是不合适的,并且会误导可靠性改进工作,使其远离更有效的质量和耐久性改进活动。
  2. 经验可靠性预测通常与实际现场性能相关性较差,因为它们没有考虑到失效的物理或力学原因。因此,它们不能提供控制实际故障机制的洞察力,也无法评估缺乏现场历史的新技术。
  3. 这些模型是基于行业范围内的平均故障率,与供应商、设备或事件无关。
  4. MTBF的结果并没有提供真实失效趋势的起点增长率和分布范围。此外,没有经过正规可靠性培训的人经常误解MTBF的概念。
  5. 过度强调Arrhenius模型和稳态温度是电子元件失效的主要因素,而温度循环、湿度、振动和冲击等关键应力因素的作用尚未单独建模6,7,8。
  6. 尽管可靠性信息分析中心(RIAC)的数据显示,至少78%的电子故障是由于没有建模的其他问题,如:设计错误,印刷电路板(PCB)组装缺陷,焊料和布线互连故障,PCB绝缘电阻和通过故障,软件错误等,但过度强调组件故障
  7. 上一次217次更新是在1995年;从那时起,新部件、技术进步和质量改进都不包括在内。它完全过时了。例如,微电路模型最后一次更新是在1992年,用于开发模型的数据是基于1991年或之前制造的部件,大部分数据来自20世纪80年代连接器模型可以追溯到1985年,使用的数据是20年前的
  8. 217手册需要与定期发布的新数据保持同步。这是一项艰巨的任务,随着需要跟踪的每个新设备和组件系列的创建,这项任务变得更加复杂。这种维护工作资金不足,目前的217个数据已经过时超过15年,并且无法处理当今持续的质量/可靠性改进过程,这些过程可以迅速使组件更加可靠。

mil-hdbk-217的更新工作

MIL-HDBK-217修订G更新是在国防部采办精简和标准化信息系统(ASSIST)项目# SESS-2008-001下授权的,该项目是国防部dpso的一项倡议。海军水面作战中心(NSWC)起重机分部负责管理该项目。217 Rev G工作组(217WG)启动会议于2008年5月8日在印第安纳州的印第安纳波利斯举行来自海军、空军、国防承包商、RAMS软件供应商、顾问和测试实验室的23名管理人员和可靠性专业人员参加了会议。不再使用217的陆军没有参加。该项目的目标是:

    • 刷新当今电子零件技术的数据。
    • 不产生新的可靠性预测方法。如果需要,可以对模型进行审查和修改,但通常应保持完整。
    • 为了保持外观和工作相同,可靠性工程师不必学习新的工具。
    • 尽管显然需要一个基于网络的、实时的电子故障率数据库,但要继续以纸质文档的形式存在,这对于跟上电子技术的快速、持续发展至关重要。
    • 与过去由大学和研究机构签订合同进行修订的做法不同,Rev G将依靠志愿者的支持,以极低的预算进行修订。

Rev G项目的目标不是开发更好、更准确的可靠性预测工具或生产更可靠的系统。实际目标是在采购过程中回归到一种通用和一致的方法来估计最终成熟设计的固有可靠性,这样竞争性设计就可以通过一个通用的过程来评估。为了支持这一观点,NSWC Crane的一项调查数据显示,大多数受访者使用217进行可靠性预测,并且他们希望继续使用目前的格式。其次是PRISM, 217 PLUS和Telcordia SR-332。

217 Rev F的故障率数据和模型是15年前的冰冻快照,已经过时了。许多组织试图通过使用改进的或替代的预测方法来改进其可靠性估计。这些方法从使用217模型和自己的组件故障率数据到使用替代的经验模型,如SR-332,欧洲FIDES方法,或RAC PRISM(后来更名为RIAC217-PLUS)方法,以及PoF技术。这些做出更好预测和更可靠系统的努力受到了许多可靠性专家的鼓励。然而,这种多样性使得采办人员和项目经理很难评估承包商和他们的产品。万博网

在启动会议上,有人提出了这样的担忧:对目前使用经验预测方法的用户进行的调查未能捕捉到那些已停止使用这些方法的人的观点。有相当多的讨论认为,在确定多年来第一次更新217的目标时,不满意的原因、停止使用的原因以及寻找更好方法的各种个人努力应与获取需求同等考虑。人们认为MIL-HDBK-217实证方法的高调查排名部分是由于缺乏开发和批准更好的方法来取代实证可靠性预测方法的努力。

提出了在217 Rev G工作之后开展第二次工作以开发更好的可靠性预测方法的概念。然而,在启动会议上的讨论导致了这个提案的加速,并将项目扩展到多个阶段。最初更新当前故障率模型和数据的Rev G工作将作为第一阶段的工作继续进行。

第二阶段的任务是研究和定义一个改进的可靠性预测方法的建议,以及实现它的最佳方法。在接受第二阶段计划后,将创建第三阶段工作来实施第二阶段计划,该计划将成为MIL-HDBK-217-Rev。H。

第二期研究结果

在研究可选的可靠性预测方法时,217WG利用航空航天车辆系统研究所(AVSI) AFE 70可靠性框架和路线图项目收集的数据利用质量功能部署(QFD)方法,该方法汇编并记录了潜在用户的需求,并将其关联到实现目标的功能和任务中。QFD是一种广泛使用的工具,用于帮助项目团队对复杂问题的需求进行分类、识别和优先排序,以便从潜在客户或最终用户的角度创建包含关键质量特征的新产品或服务。结果以矩阵格式记录,称为质量屋。

QFD分析表明,除了总体可靠性之外,还需要一种更全面的可靠性预测方法,以更准确地评估特定问题的风险。除了MTBF之外,还需要一种方法来评估首次故障的时间,以及一种方法来处理不断出现的新技术,这些新技术在可靠性预测之前不需要多年的现场性能。经过大量的评估,第二阶段团队集中在两种基本方法上:1)改进经验可靠性预测方法;2)采用并标准化基于科学的PoF方法,其中使用基本工程原理分析因果确定性关系。

在进一步考虑了每种方法的优缺点后,很明显,这两种方法都不能解决所有的可靠性预测问题,以满足每个用户组的需求。最后,显然应该考虑两部分混合的办法。

提出了一种基于RIAC 217 PLUS方法的更新和改进的经验方法,根据历史组件故障率提供初步的模块或系统级可靠性估计。这种方法将在采办计划的早期阶段支持采办比较和项目管理活动。

建议的第二部分将定义PoF建模,以便在程序的实际工程设计和开发阶段使用。这些方法将用于评估设计备选方案在预期使用概况和应用环境下对各种失效机制的易感性和耐久性。通过这种方式,可以在设计阶段早期以低成本筛选出缺乏应用所需的耐久性和可靠性的项目,从而产生更可靠的军事硬件和系统。由于217 PLUS方法已经在其他出版物中得到了很好的定义,因此本文的其余部分将概述为217 Rev H提出的PoF方法。

失效物理基础

故障物理(也称为可靠性物理)方法在设计过程的早期应用分析,以预测特定应用中设计替代方案的可靠性和耐久性。这使得设计人员能够做出设计和制造选择,最大限度地减少故障机会,从而生产出可靠性优化、坚固耐用的产品。万博网PoF侧重于理解导致材料和部件降解和失效的物理过程和机制的因果关系。它基于对应用中的载荷和应力的分析,并从材料的强度和力学角度评估材料承受它们的能力。这种方法通过基于科学的评估材料、结构和技术的过程,将可靠性集成到设计过程中。

这些被称为载荷-强度干扰分析的技术已经使用了几个世纪。它们是机械、结构、建筑和土木工程过程的基本组成部分。不幸的是,在20世纪50年代和60年代E/E技术的早期发展和演变中,由于电气工程师没有接受过结构分析技术的培训或不熟悉结构分析技术,而且电子设备的小型化尚未达到需要结构和强度优化的程度,因此没有使用这种方法。与任何新技术一样,失败的原因最初也没有得到很好的理解。对E/E故障的研究既缓慢又困难,因为与机械和结构项目不同,大多数E/E故障并不明显。评估和了解新的E/E故障更加困难,因为它们不容易被肉眼看到,因为大多数组件是微观的,电子是不可见的。

由于这些困难,经验概率可靠性方法被采用,并且变得如此根深蒂固,以至于更好的替代方法的发展受到抑制。

在过去的25年里,PoF建模和E/E材料性能表征取得了很大的进展。通过采用机械和结构工程技术,使用确定性物理和化学模型的电子电气设备的计算机耐久性模拟现在成为可能,并且每年都变得更加实用和具有成本效益。失效分析研究导致PoF方法围绕三种常见的根本原因失效类别进行组织:错误和过度变化,磨损机制和过度应力机制。

过分强调失败

当应用的应力迅速或大大超过设备材料的强度或能力时,就会发生屈服、屈曲和电涌等超应力失效。这会导致立即或即将发生的失败。在为其应用中的负载设计良好的项目中,过度应力失效是罕见的和随机的。它们只会在超出设备设计意图的情况下发生,例如天灾或战争,例如被闪电击中或淹没在洪水中。超应力是传统可靠性理论对随机失效的PoF工程观点。如果经常发生过应力失效,则要么该装置不适合应用,要么设计者低估了应用应力的范围。PoF载荷应力分析用于确定设计的强度极限,以应对冲击和电气瞬变等应力,并评估它们是否足够。

磨损故障

PoF中的磨损被定义为应力驱动的材料损伤积累,包括疲劳和腐蚀等失效机制。机械工程师开发了许多结构材料的应力分析方法。一旦确定了材料的性质,这些技术就很容易适用于电子学的微结构。PoF磨损分析不仅仅是估计一个装配的平均磨损失效时间。它确定了设备中最可能出现第1、2、3次故障的组件或特征,以及它们到第一次故障的时间和之后的相关脱落率,针对各种磨损机制。这使设计人员能够确定哪些(如果有的话)项目在新产品的预期使用寿命期间容易出现各种类型的磨损。然后可以对设计进行优化,直到在期望的使用寿命期间对磨损风险的敏感性被设计出来。

错误和过度变化相关的失败

错误和过度变化问题构成了早期失效传统概念的PoF观点。错误和变化的机会涉及设计、供应链和制造过程的各个方面。这些类型的失败是最多样化和最具挑战性的类别。由于涉及多种随机事件,这些类型的故障不能使用确定性的PoF因果方法建模或预测。然而,当PoF知识和经验教训被用于评估和选择被证明有能力的制造工艺时,可靠性的提高仍然是可能的,确保鲁棒性并实现防错。

将pof集成到mil-hdbk-217中

217WG开发了一种双重方法,将PoF过度应力和磨损分析整合到217 Rev. H中,并改进了经验预测方法。一个提议的PoF部分解决电子元件问题,而第二个处理电路卡组装(CCA)问题。这些部分旨在作为用于可靠性评估的PoF模型和方法类型的指南。

部件失效方法的物理学

提议的PoF组件部分侧重于半导体芯片,微电路封装,互连和电容器等组件的磨损机制的失效机制和可靠性方面。目前业界关注的一个关键问题是,由于集成电路(IC)芯片特征的缩小,已经达到了90、65和45纳米(nm)的纳米级水平,寿命可靠性的预期降低评估IC失效机制的模型,如随时间的介电击穿、电迁移、热载流子注入和负偏置温度不稳定性,正在考虑解决这一问题

电路卡组件失效方法的物理学

提议的PoF电磁卡组装部分定义了4类分析技术(见本文末尾的图2),可以使用当前可用的计算机辅助工程(CAE)软件执行。使用概率力学方法来解释变异问题该方法与SAE J1211《汽车电气/电子模块稳健性验证手册》第8节中推荐的分析、建模和仿真方法保持一致。

  1. E/E性能和变化建模用于评估是否在静态和动态条件下实现稳定的E/E电路性能目标,包括公差和漂移问题。
  2. 电磁兼容性(EMC)和信号完整性分析,用于评估CCA是否产生或容易受到电磁干扰的干扰,以及高频信号的传输是否稳定。
  3. 应力分析用于评估CCA的物理封装能力,以保持结构和电路互连的完整性,保持E/E电路可靠运行的合适环境,并确定CCA是否容易受到过应力故障的影响
  4. 磨损耐久性和可靠性建模使用应力分析的结果来预测cca的长期应力老化/应力耐久性,逐渐退化和磨损能力。17结果提供了第一次失效的时间,第1,第2,第3等设备的有序列表中的预期失效分布,特征,机制和最有可能预期失效的地点。

实现概念

这四组中的每一组都包含使用类似分析技巧和工具的分析任务。结合起来,这些技术提供了一个多学科的虚拟工程原型过程,用于发现设计弱点,对故障机制的敏感性,并在设计早期预测可靠性,从而可以以低成本实现改进。

大多数这些建模技术需要专门的建模技能和CAE软件的经验。可靠性工程师不需要亲自学习和执行这些任务。然而,将PoF方法定义和认可为创建鲁棒性和高可靠性系统的完整、可接受的可靠性方法,有望帮助可靠性专业人员与设计工程师建立联系,并通过设计概念将可靠性整合到设计活动中。

PoF部分并不打算强制要求每个模型必须应用于每个设计中的每个项目,或者建模仅限于列出的模型,因为新模型正在不断开发中。此外,由于每个问题的PoF模型尚不存在,因此该列表并不包括所有问题。目标是确定现有的评估方法,这些方法可以在设计和开发活动中根据需要进行选择,以降低可靠性风险。通过这种方式,可以在项目设计阶段的虚拟环境中以更低的成本更快地提高可靠性。

通过建立一个路线图来合并基本的工程师分析和可靠性方法,可以鼓励技术基础设施继续增长(也许更快),为可靠性工程师和产品设计团队提供更多的工具和方法来统一使用。

欲了解更多信息,并要求Ansys可靠性工程服务团队报价,请访问:万博https://upl.inc/a5b0679

分享这篇技术论文

看看Ansys能为万博您做些什么

立即联系我们

* =必填字段

谢谢你的帮助!

我们在这里回答您的问题,并期待与您交谈。我们Ansys销售团队的一名成员万博将很快与您联系。

页脚的形象