跳转至主要内容

白皮书

用物理失效方法加强MIL-HDBK-217可靠性预测

通过James G. McLeish, CRE


美国国防部(DoD)国防标准化项目办公室(DSPO)已经启动了一项多阶段工作来更新MIL-HDBK-217(217),这是军方经常模仿和经常批评的电子设备可靠性预测圣经。该文件基于符合经验模型的实地数据,自1995年以来就没有更新过。由于缺乏更新,人们预期其基于统计的经验方法将逐步淘汰。特别是在基于科学的故障物理学(PoF)(即可靠性物理学)研究导致陆军研究、开发和采买助理部长吉尔伯特·德克尔(Gilbert F. Decker)宣布MIL-HDBK-217不出现在陆军RFP的采买要求中,因为它已被“证明是不可靠的,使用它可能导致错误和误导性的可靠性预测”。

尽管存在这样的批评,MIL-HDBK-217现在正在作为国防部内部最近气候的一部分进行更新,以重新采用可靠性、可用性、可维护性和安全性(RAMS)方法。2,3本文回顾了该文件恢复和更新的原因,以及对其缺点的主要关注。

致力于更新MIL-HDBK-217的团队提出了一项通过经验可靠性预测解决局限性的建议。开发了一种混合方法,其中改进和更全面的经验MTBF模型将用于项目采购-供应商选择活动期间的比较评估。后来,基于科学的PoF可靠性建模与概率力学技术相结合,被提出用于实际系统设计开发阶段,以评估和优化设计的应力和磨损限制,以促进高可靠、健壮的电气/电子(E/E)系统的创建。

将该方法纳入MIL-HDBK-217未来修订H的提案已提交给国防部DSPO,目前正在考虑实施和资助该提案的计划。本文综述了PoF方法在MIL-HDBK-217中如何与经验预测技术共存的概念。这是从MIL-HDBK-217修订小组成员的观点讨论的。作者要感谢217工作组的领导和成员所作的贡献。这篇论文的动机来自初创企业和成熟公司对焊点设计、可接受的材料组合和回流焊工艺开发的大量要求。

mil-hdbk-217电子设备可靠性预测概述

MIL-HDBK-217中定义的两种经验可靠性预测方法被称为“零件数”和“零件应力”,用于根据其平均故障间隔时间(MTBF)来估计电子设备的平均寿命,MTBF是故障率λ (Lambda)的倒数。在零件计数法中,MTBF值是通过取电子设备中每个部件故障率(来自通用表)总和的倒数来确定的(见下式)。

然后,这些基本故障率可以被缩放,以解释在恶劣环境条件下运行所导致的平均故障率的增加,例如;地面机动、海军、空降、导弹、太空等。MIL-HDBK-217识别14种不同的广义通用环境条件。零件应力方法提供了额外的通用比例因子,用于解释使用应力(如功率、电压和温度)的可靠性退化效应。应力因子不能用于预测,直到程序成熟到可以通过使用电路仿真工具或功能设计原型的参数测量来量化这些应力。应力因子可以通过元件降额准则在设计过程早期使用,该准则为特定电路应用中的元件建立应力规则。

mil - hdbk - 217的担忧

MIL-HDBK-217中定义的经验可靠性预测方法存在许多问题。其他出版物4、5中已全面涵盖的主要批评的摘要如下:

  1. 手册的可靠性预测仅基于恒定的故障率,这意味着仅模拟随机故障情况。使用恒定故障率是因为它们简化了故障数据的收集和计算,这在20世纪50年代和60年代的预计算机化世界中是必要的,当时这些预测方法首次被开发出来。当失效趋势仅通过指数分布建模为随机事件时,早期失效和与磨损相关的失效未被考虑在内。这种方案的另一个风险是,早期故障和磨损问题被计算为随机故障的表格错误。后来,当使用污染(混合失效模式)基础数据的指数分布进行可靠性预测时,可能会出现重大错误。这样的不准确是不合适的,并且会误导可靠性改进工作,使其偏离更有效的质量和耐久性改进活动。
  2. 经验可靠性预测通常与现场实际性能相关性不高,因为它们没有考虑失效的物理或力学因素。因此,他们不能提供控制实际故障机制的见解,也不能评估缺乏现场历史作为预测基础的新技术。
  3. 这些模型基于全行业的平均故障率,不针对特定的供应商、设备或事件。
  4. MTBF结果没有提供真实失效趋势的起始点增长率和分布范围。此外,MTBF概念经常被没有接受过正式可靠性培训的人误解。
  5. 过度强调Arrhenius模型和稳态温度作为电子元件失效的主要因素,而没有单独模拟温度循环、湿度、振动和冲击等关键应力因素的作用6,7,8。
  6. 尽管可靠性信息分析中心(RIAC)的数据表明,至少78%的电子故障是由于其他没有建模的问题,如:设计错误,印刷电路板(PCB)组装缺陷,焊接和布线互连故障,PCB绝缘电阻和通过故障,软件错误等
  7. 最近的217次更新是在1995年;自那时以来的新部件、技术进步和质量改进都不包括在内。它已经严重过时了。例如,微电路模型最后一次更新是在1992年,用于开发模型的数据是基于1991年或以前制造的部件,这些数据大部分来自20世纪80年代连接器模型可以追溯到1985年,使用的是20年前的数据
  8. 217手册需要与定期发布的新数据保持同步。这是一项巨大的任务,随着需要跟踪的每个新设备和组件家族的创建,这项任务变得更加复杂。这种维护工作资金不足,目前的217数据已经过时超过15年,无法处理今天持续的质量/可靠性改进流程,快速使组件更加可靠。

mil-hdbk-217更新工作

MIL-HDBK-217修订G更新是根据国防部采办精简和标准化信息系统(ASSIST)项目# SESS-2008-001授权的,这是国防部dpso的一个倡议。海军水面作战中心(NSWC)吊车部门负责管理该项目。217 Rev G工作组(217WG)启动会议于2008年5月8日在印第安纳波利斯举行来自海军、空军、国防承包商、RAMS软件供应商、顾问和测试实验室的23名管理人员和可靠性专业人员参加了会议。不再使用217号武器的陆军没有参与。该项目的目标是:

    • 更新当今电子零件技术的数据。
    • 提出了一种新的可靠性预测方法。如果需要,可以对模型进行审查和修改,但通常应该保持完整。
    • 继续保持相同的外观和工作,这样可靠性工程师就不必学习新的工具。
    • 尽管很明显需要基于web的、动态的电子故障率数据库,但仍然是纸质文档,这对于跟上电子技术快速、持续的进步至关重要。
    • 与过去大学和研究机构签订修订合同的修订工作相反,Rev G将在有限的预算下进行,依靠志愿者的支持。

Rev G项目的目标不是开发更好、更准确的可靠性预测工具,也不是生产更可靠的系统。实际目标是在采办过程中重新采用一种通用和一致的方法来估计最终成熟设计的固有可靠性,以便能够通过一种通用的过程来评估竞争性设计。为了支持这一立场,引用了NSWC Crane调查的数据,显示大多数受访者使用217进行可靠性预测,并且他们希望继续以当前的格式使用它。其次最常用的方法是PRISM, 217 PLUS和Telcordia SR-332。

217 Rev F故障率数据和模型是15年前的冻结快照,这些数据已经过时了。许多组织试图通过使用修改过的或替代的预测方法来改进他们的可靠性估计。这些方法从使用217个具有各自部件故障率数据的模型到使用其他经验模型,如SR-332,欧洲FIDES方法,或RAC PRISM(后来更名为RIAC217-PLUS)方法,以及PoF技术。这些做出更好预测和更可靠系统的努力受到许多可靠性专家的鼓励。然而,这种多样性使得采办人员和项目经理很难评估承包商及其产品。万博网

在启动会议上提出了一些担忧,即对目前使用经验预测方法的用户进行的调查未能捕捉到那些已经停止使用这些方法的人的观点。有相当多的讨论认为,在确定多年来第一次更新217的目标时,不满意的原因、停止使用以及寻找更好方法的各种个人努力应与获取需求同等考虑。人们认为MIL-HDBK-217经验方法的调查排名较高,部分原因是缺乏努力开发和认可更好的方法来取代经验可靠性预测方法。

提出了在217 Rev G之后开始第二次努力开发更好的可靠性预测方法的概念。然而,启动会议上的讨论加速了这一提议,并将项目扩展到多个阶段。最初的Rev G更新当前失败率模型和数据的工作将继续作为第一阶段的工作。

第二阶段的任务是研究和定义一种改进的可靠性预测方法和实施它的最佳方法。在第二阶段计划被接受后,第三阶段工作将稍后创建以实施第二阶段计划,该计划将成为MIL-HDBK-217-Rev。H。

第二阶段的发现

在研究替代可靠性预测方法时,217WG利用了质量功能部署(QFD)方法,该方法使用了航空航天车辆系统研究所(AVSI) AFE 70可靠性框架和路线图项目收集的数据,该项目编译并记录了潜在用户的需求,并将其关联到实现目标的功能和任务中。QFD是一种广泛使用的工具,用于帮助项目团队对复杂问题的需求进行分类、识别和优先排序,以便从潜在客户或最终用户的角度创建包含关键质量特征的新产品或服务。结果以矩阵格式记录,即质量之家。

QFD分析表明,除了总体可靠性外,还需要一种更全面的可靠性预测方法,可以更准确地评估特定问题的风险。除了MTBF之外,还需要一种方法来评估第一次故障的时间,以及一种方法来应对不断出现的新技术,这些技术不需要多年的现场性能就可以做出可靠性预测。经过大量评估后,第二阶段团队集中在两种基本方法上:1)改进经验可靠性预测方法;2)采用并标准化基于科学的PoF方法,其中使用基本工程原理分析因果确定性关系。

在进一步考虑每种方法的优缺点后,很明显,这两种方法都不能解决所有的可靠性预测问题,以满足每个用户组的需求。最终,很明显应该考虑两部分混合的方法。

提出了一种基于RIAC 217 PLUS方法的更新和改进的经验方法,以根据历史部件故障率提供初步的模块或系统级可靠性估计。这种方法将支持采办项目早期阶段的采办比较和项目管理活动。

提议的第二部分将定义PoF建模,以便在项目的实际工程设计和开发阶段使用。这些方法将用于评估设计替代方案在预期使用情况和应用环境下对各种故障机制的敏感性和持久性。通过这种方式,在设计阶段就可以以较低的成本将缺乏应用所需的耐久性和可靠性的项目尽早筛选出来,从而获得更可靠的军事硬件和系统。由于217 PLUS方法已经在其他出版物中得到了很好的定义,12本文的其余部分将概述为217 Rev H提出的PoF方法。

故障基础物理

失效物理学(也称为可靠性物理学)方法在设计过程的早期应用分析来预测特定应用中设计备选方案的可靠性和耐久性。这使设计人员能够做出设计和制造选择,最大限度地减少故障机会,从而生产出可靠性优化、坚固的产品。万博网PoF专注于理解导致材料和组件退化和失效的物理过程和机制的原因和影响。它基于应用中的载荷和应力分析,并从材料的强度和力学角度评估材料承受它们的能力。这种方法通过基于科学的评估材料、结构和技术的过程,将可靠性集成到设计过程中。

这些被称为负荷强度干扰分析的技术已经使用了几个世纪。它们是机械、结构、建筑和土木工程过程的基本组成部分。不幸的是,在20世纪50年代和60年代电子/电子技术的早期发展和发展中,这种方法没有被使用,因为电气工程师没有接受过结构分析技术的培训或熟悉结构分析技术,电子器件的小型化还没有达到需要结构和强度优化的程度。而且,与任何新技术一样,失败的原因最初并没有得到很好的理解。对E/E故障的研究是缓慢和困难的,因为与机械和结构项目不同,大多数E/E故障并不明显。评估和了解新的电子/电子故障更加困难,因为它们不容易被肉眼看到,因为大多数组件是微观的,电子是不可见的。

由于这些困难,经验概率可靠性方法被采用,并且变得如此根深蒂固,以至于更好的替代方案的发展被扼杀了。

在过去的25年里,在PoF建模和E/E材料性能表征方面取得了很大的进展。通过采用机械和结构工程技术,使用确定性物理和化学模型的电子/电子设备的计算机耐久性模拟现在是可能的,而且每年都变得更加实用和具有成本效益。失效分析研究使PoF方法围绕三种常见的根本原因失效类别进行组织,它们是:错误和过度变化,磨损机制和过度应力机制。

过分强调失败

当应用的应力迅速或大大超过器件材料的强度或能力时,就会发生屈服、屈曲和电涌等超应力失效。这会导致立即或即将发生的故障。在为其应用中的负载精心设计的项目中,过度应力失效是罕见的和随机的。它们只会在超出设备设计意图的情况下发生,比如天灾或战争,比如被闪电击中或被洪水淹没。超应力是传统可靠性理论中随机故障的PoF工程观点。如果过度应力失效频繁发生,那么要么设备不适合应用,要么设计师低估了应用应力的范围。PoF载荷-应力分析用于确定设计应力(如冲击和电瞬变)的强度极限,并评估它们是否足够。

磨损故障

PoF中的磨损被定义为应力驱动的材料损伤积累,包括疲劳和腐蚀等失效机制。机械工程师开发了许多结构材料的应力分析方法。一旦材料的特性得到了表征,这些技术就很容易适应电子的微结构。PoF磨损分析不仅仅是估计装配磨损故障的平均时间。它确定了设备中最可能发生第1、2、3次故障的组件或功能,以及它们第一次故障的时间和之后的相关脱落率,用于各种磨损机制。这使设计师能够确定哪些(如果有的话)项目在新产品的预期使用寿命内容易出现各种类型的磨损。然后可以对设计进行优化,直到设计出预期使用寿命内的磨损风险敏感性。

与故障相关的错误和过度变化

错误和过多的变化问题构成了早期故障传统概念的PoF观点。错误和变化的机会涉及设计、供应链和制造过程的各个方面。这些类型的失败是最多样化和最具挑战性的类别。由于涉及到不同的、随机的、随机的事件,这些类型的故障不能用确定性的PoF因果方法建模或预测。然而,当PoF知识和经验教训被用于评估和选择已被证明有能力的制造工艺,确保稳健性和实现防错时,可靠性改进仍然是可能的。

将pof集成到mil-hdbk-217中

217WG开发了一种双重方法,将PoF超应力和磨损分析与改进的经验预测方法集成到217 Rev. H中。一个提议的PoF部分处理电子元件问题,而第二个处理电路卡组装(CCA)问题。这些部分旨在作为可靠性评估中存在的PoF模型和方法类型的指南。

部件失效方法的物理学

所提出的PoF组件部分着重于半导体模具、微电路封装、互连和电容器等组件的磨损机制的失效机制和可靠性方面。目前业界关注的一个关键问题是,由于集成电路(IC)模具特征的尺寸缩小,已经达到了90,65和45纳米(nm)的纳米级水平,预计寿命可靠性将会降低评估IC失效机制的模型,如随时间变化的介电击穿、电迁移、热载流子注入和负偏置温度不稳定性,正在考虑解决这一问题

电路卡组件失效方法的物理学

提出的PoF电路卡组装部分定义了4类分析技术(参见本文末尾的图2),这些技术可以用当前可用的计算机辅助工程(CAE)软件执行。一种概率力学方法被用来解释变化问题该方法与SAE J1211 -汽车电气/电子模块稳健性验证手册第8节中推荐的分析、建模和仿真方法相一致。

  1. E/E性能和变差建模用于评估在静态和动态条件下是否实现稳定的E/E电路性能目标,其中包括公差和漂移问题。
  2. 电磁兼容性(EMC)和信号完整性分析,以评估CCA是否产生或易受电磁干扰干扰,以及高频信号的传输是否稳定。
  3. 应力分析用于评估CCA的物理封装保持结构和电路互连完整性的能力,为E/E电路的可靠运行维持合适的环境,并确定CCA是否易受过度应力失效的影响
  4. 磨损耐久性和可靠性建模使用应力分析的结果来预测cca的长期应力老化/应力耐久性、逐渐退化和磨损能力。17结果是根据第一次故障的时间、第1、2、3等设备的有序列表中的预期故障分布、最可能的预期故障的特征、机制和位置提供的。

实现概念

这四组中的每一组都包含使用类似分析技能和工具的分析任务。这些技术结合在一起,提供了一个多学科的虚拟工程原型过程,用于发现设计弱点、故障机制的易感性,并在设计早期预测可靠性,以便以低成本实现改进。

这些建模技术大多需要专门的建模技能和使用CAE软件的经验。可靠性工程师不需要亲自学习并执行这些任务。然而,将PoF方法定义和认可为创建健壮和高可靠系统的完整的、公认的可靠性方法,有望帮助可靠性专业人员与设计工程师联系起来,并有助于将设计概念的可靠性集成到设计活动中。

PoF部分并不打算强制要求每个模型都必须应用于每个设计中的每个项目,或者建模仅限于列出的模型,因为新模型正在不断开发。此外,该列表并不是全部的,因为还不存在每个问题的PoF模型。目标是确定现有的评估方法,可以在设计和开发活动期间根据需要选择,以减轻可靠性风险。通过这种方式,在项目设计阶段的虚拟环境中,可以以更低的成本更快地实现更高的可靠性增长。

通过建立合并基础工程师分析和可靠性方法的路线图,可以鼓励技术基础设施继续增长(也许更快),为可靠性工程师和产品设计团队提供更多的工具和方法,以便一致使用。

欲了解更多信息,并向Ansys可靠性工程服务团队索取报价,请访问:万博https://upl.inc/a5b0679

分享这篇技术论文

Scopri cosa può fare 万博Ansys per te

Contattaci急速地

* = Campo义务

祝你好运!

我们在这里回答你的问题,期待与你交谈。我们Ansys销售团队的一名成员万博将很快与您联系。

想象一下del footer