FMEA方法培训.pptx
- 文档编号:18876940
- 上传时间:2024-02-07
- 格式:PPTX
- 页数:31
- 大小:1.49MB
FMEA方法培训.pptx
《FMEA方法培训.pptx》由会员分享,可在线阅读,更多相关《FMEA方法培训.pptx(31页珍藏版)》请在冰点文库上搜索。
l可靠性工作介绍可靠性工作介绍l故障管理设计故障管理设计lFMEAFMEA分析方法介绍分析方法介绍l可靠性验证测试(可靠性验证测试(FITFIT)课程目的课程目的11、概述概述通信网的可用性通信网的可用性接接入入层层骨骨干干网网设设备备层层骨骨干干网网接接入入层层骨骨干干网网设设备备层层骨骨干干网网骨骨干干网网1、设备都是通信网络中的一个设备都是通信网络中的一个接点,网络的可靠性或者说端到接点,网络的可靠性或者说端到端的可靠性是用户最终关心的。
端的可靠性是用户最终关心的。
不能仅仅关注设备可靠性而忽视组网、网络其他部件对可靠性的影响;2、不同网络层次的设备有不同不同网络层次的设备有不同的可靠性要求。
的可靠性要求。
核心层设备偏重于HA,中间层设备偏重于成本与HA的良好结合,终端设备偏重于成本与返修率;3、HA不仅仅包括设备软、硬件不仅仅包括设备软、硬件的的HA,而且包括计划性中断、人,而且包括计划性中断、人为差错等的为差错等的HA,所以也要关注升级、数据配置、补丁等造成的业务中断;4、需求的落实需要可靠性工程、需求的落实需要可靠性工程师对产品设计方案的了解,需求师对产品设计方案的了解,需求跟踪,跟踪,FIT测试验证。
更需要开发测试验证。
更需要开发人员的并肩作战。
人员的并肩作战。
HA网络级HA设备HA人为差错HA系统HA连接设备HA计划性活动HA交换模块HA线路处理模块HA平台软件模块HA主控模块HA电缆HA背板HA硬件HA软件HA机电模块HA服务器模块HA功能框1HA功能框2HA功能框3HAl产品的可靠性可以理解为三个规定,即规定条件下、规定时间内、产品完成规定功能的能力。
l从用户的角度考虑,可简单地理解为几个层面的要求:
硬件故障,仅对性能硬件故障,仅对性能有部分影响,设备的有部分影响,设备的功能不受损。
功能不受损。
硬件不出故障硬件不出故障硬件故障,设备部分或硬件故障,设备部分或全部功能受损。
但能尽全部功能受损。
但能尽快恢复业务。
快恢复业务。
第二层面第二层面第一层面第一层面第三层面第三层面11、概述概述可靠性的层次可靠性的层次电路应用规范、器件应力降额、环境适应性、EMC、防护、安规、HALT试验等冗余、倒换策略,倒换条件完善,数据备份策略故障检测、隔离,定位,维修性等元器件降额分析元器件降额分析可靠性可靠性FMEAFMEA、CACA分析分析l系统结构的考虑。
如冗余、负荷分担。
l其他容错设计l故障检测。
重要故障需要“知情”。
检测灵敏度;l故障隔离。
能隔离到影响最小,定位到FRU;l故障恢复。
倒换策略、复位、重启、数据恢复等;l故障测试验证。
重要、影响或措施不明确的故障、故障模式,FIT模拟测试;l器件使用的考虑。
如降额、热设计、器件应用审查;l简化设计等nAWP:
availabilityworkprocess故障插入计划故障恢复设计故障隔离设计故障检测设计可用性计划更新设计FMEA分析操作过程操作最简化计划操作界面故障原因和影响可用性模型测试和现场数据可用性工作过程数据流11、概述概述业界可靠性流程(业界可靠性流程(MOTOROLAMOTOROLA的的AWPAWP)11、概述概述可靠性流程可靠性流程验证阶段概念阶段计划阶段开发阶段需求提出需求分析综合映射需求分解与回溯规格形成概要设计详细设计与实现单元测试、SDV、SITBeta测试工程设计调研与设计建议l可靠性工程基线2.0l板间信号级FMEA分析报告l单板总体设计方案(可靠性)系统可靠性系统可靠性设计报告设计报告l可靠性指标论证报告TR2TR3TR1l器件级FMEA分析报告l单板硬件详细设计报告(可靠性)l元器件降额分析报告TR4TR4ASVTIPDSEHCMM3.0FIT可靠性验证测试可靠性工程师可靠性工程师硬件/软件开发工程师可靠性工程师测试工程师可靠性工程师可靠性工程师11、系统可靠性设计报告、系统可靠性设计报告22、板间信号级、板间信号级FMEAFMEA分析报告分析报告1产品构成及功能定义2产品功能层次框图3产品可靠性框图4产品编码原则5环境定义6严酷度等级定义7功能模块(单板)接口信号FMEA分析表格8总结8.1软件故障管理需求列表8.2硬件故障管理需求列表8.3测试验证需求列表8.4故障降级分析8.5分析总结1产品概述2产品系统结构及可靠性建模3系统可靠性分析4主控类单板可靠性设计5网板(交叉)类单板可靠性设计6业务类单板可靠性设计7时钟子系统设计8电源子系统设计9监控及散热系统保护设计10存储保护与数据安全11系统及单板复位设计12系统可靠性设计规格及测试验证需求汇总1、概述可靠性流程、概述可靠性流程11、器件级、器件级FMEAFMEA分析报告分析报告1单板构成及功能定义2单板功能层次框图3单板可靠性框图4编码原则(可选)5环境定义6严酷度等级定义7单板器件级FMEA分析7.1单板器件级FMEA分析表格8总结8.1软件故障管理需求列表8.2硬件故障管理需求列表8.3测试验证需求列表8.4故障降级分析8.5故障定位率计算8.6冗余单元倒换成功率计算8.7分析总结22、产品元器件降额分析报告、产品元器件降额分析报告1、系统功能2、环境定义3、测试环境4、单板元器件降额分析4.1单板1元器件降额分析4.2单板2元器件降额分析5、总结1、概述可靠性流程、概述可靠性流程l可靠性工作介绍可靠性工作介绍l故障管理设计故障管理设计lFMEAFMEA分析方法介绍分析方法介绍l可靠性验证测试(可靠性验证测试(FITFIT)课程目的课程目的故障检测在线故障诊断故障隔离故障恢复故障修复离线故障诊断预警告警22、故障管理设计、故障管理设计故障插入计划故障恢复设计故障隔离设计故障检测设计可用性计划更新设计FMEA分析操作过程操作最简化计划操作界面故障原因和影响可用性模型测试和现场数据可用性工作过程数据流故障检测:
发现故障故障检测:
发现故障故障诊断方法:
1、自诊断(如:
电压模块、风扇自带诊断);2、在线诊断;故障定位方法:
1、功能单元隔离(如影响到总线或通信通道的故障、二路电源的二极管隔离等)2、禁止功能单元工作;3、安全值输出(如:
参考时钟的自激振荡)4、重选路由;故障检测方法:
1、数值范围检查;(如:
温度、电压、槽位号、MAC地址等)2、数据正确性检查(如:
奇偶校验、求检验和、CRC校验、槽位号异或校验等)3、比较检查(有冗余输出时)4、时间检查(如:
心跳检测)5、用户直观检查(如:
告警、声光显示)故障诊断(定位):
确定造成故障的单元故障诊断(定位):
确定造成故障的单元故障定位:
故障定位:
把检测到的故障隔离到必须进行修理范围的过程,通常是现场可更换单元。
即确保单元的故障不会造成系统的故障。
故障恢复方法:
1、倒换;(对主备用冗余)2、重新分配资源(对N+1冗余、资源池)3、软件复位;4、重启;故障恢复(自动):
恢复产品执行规定功能故障恢复(自动):
恢复产品执行规定功能的能力。
的能力。
22、故障管理设计、故障管理设计故障修复方法:
1、更换功能单元;2、调试和诊断(离线)3、软件补丁;4、软件升级;告警方法:
告警方法:
1、趋势图法;2、多变量综合分析法;3、专家系统法;故障修复:
故障完全排除的过程。
故障修复:
故障完全排除的过程。
22、故障管理设计、故障管理设计1、报警;2、信息文本(如:
写入运行日志中)3、故障分级处理(不同级别的故障采取不同的告警方法)预警方法:
预警方法:
l可靠性工作介绍可靠性工作介绍l故障管理设计故障管理设计lFMEAFMEA分析方法介绍分析方法介绍l可靠性验证测试(可靠性验证测试(FITFIT)课程目的课程目的系统系统薄弱环节薄弱环节可靠性设计可靠性设计故障概率高故障影响大可靠性定性分析FMEA可靠性定量分析建模预计可靠性分析方法33、可靠性分析方法、可靠性分析方法在产品设计过程中,通过对产品各组成单元潜在的各种故障模式及其对产品功能的影响进行分析,并把每一个潜在的故障模式按它的严酷度予以分类,提出可以采取的预防改进措施,以提高产提出可以采取的预防改进措施,以提高产品可靠性品可靠性的一种设计分析方法。
FailureModeEffectAnalysisFailureModeEffectAnalysis,故障模式影响分析,故障模式影响分析遍历性、系统性。
FMEAFMEA的基本思想:
的基本思想:
.33、可靠性分析方法可靠性、可靠性分析方法可靠性FMEAFMEAFMEAFMEA目的:
目的:
n能帮助设计者和决策者从各种方案中选择满足可靠性要求的最佳方案n保证所有元器件、单元的各种故障模式及影响都经过周密考虑保证所有元器件、单元的各种故障模式及影响都经过周密考虑n能找出对系统故障有重大影响的元器件、元器件故障模式及单元、单元故障模式并分能找出对系统故障有重大影响的元器件、元器件故障模式及单元、单元故障模式并分析其影响程度析其影响程度n有助于在设计评审中对有关措施(如冗余措施)、检测设备等作出客观的评价有助于在设计评审中对有关措施(如冗余措施)、检测设备等作出客观的评价n能为进一步更改产品设计、定量计算提供资料FMEAFMEA的分析层次:
的分析层次:
n系统级:
系统级:
按各功能模块进行分析n板间信号级:
板间信号级:
单板的接口信号进行分析n器件级:
器件级:
按各器件的故障模式进行分析33、可靠性分析方法可靠性、可靠性分析方法可靠性FMEAFMEAFMEAFMEA的分析方法的分析方法:
n硬件法硬件法:
从硬件的角度,对每个器件管脚输出分别去考虑故障模式、故障影响、检测补偿措施。
n功能法功能法:
每个产品可以完成若干功能,而功能可以按输出分类。
这种方法将输出一一列出,并对它们的故障模式进行分析。
对应系统级、单板级分析。
33、可靠性分析方法可靠性、可靠性分析方法可靠性FMEAFMEAFFMMEEAA分分析析步步骤:
骤:
33、可靠性分析方法可靠性、可靠性分析方法可靠性FMEAFMEA从可靠性工程师的角度去理解系统;包括对系统完成的功能、工作阶段以及各种工作方式给出详细的描述;网络位置、组网方式和典型配置描述系统功能系统按照功能划分,通常可以分为:
电源模块、风扇监控模块、网管模块、功能模块。
对于功能模块,再继续划分到功能实体上,如主控功能模块、交换网功能模块、线路处理功能模块等。
33、可靠性分析方法可靠性、可靠性分析方法可靠性FMEAFMEA定义严酷度类别给产品故障造成的最坏潜在后果规定一个量度。
功能模块名称故障模式严酷度备注电源子系统输出异常高电压导致系统功能异常,甚至烧毁I电源子系统电源模块一路-48V供电故障,且不能检测II电源子系统电源配电子系统监控电路滤波部分故障,且系统不能检测II电源子系统电源配电子系统监控电路电压检测部分故障,且系统不能检测III风扇监控子系统全部风扇停转,导致系统温度过高而不能正常工作甚至烧毁I风扇监控子系统单个风扇框的所有风扇停转,导致系统温度升高而不能正常工作II风扇监控子系统风扇框监控电路故障,但系统能够检测,可以控制风扇全速运转III背板背板总线信号开路、短路故障,导致整个系统故障I主控模块主用主控模故障,不能倒换到备用I主控模块备用主控模故障,能检测III主控模块一路业务同步时钟故障,能检测,且有相应的补偿措施III主控模块双路业务同步时钟故障,导致系统无法工作I交换网模块一个交换网模块故障,故障,不能检测并将业务切换到其它交换网模块II交换网模块一个模块故障,故障,能将业务切换到其它交换网模块,但交换能力严重下降II交换网模块一个模块故障能检测,并将业务切换到其它交换网模块,对系统性能基本无影响III线路处理模块一个线路处理模块故障,能检测II线路处理模块线卡个别端口故障,能够通过端口捆绑的负荷分担将业务切换到其它端口IIII.这种故障会导致整个系统崩溃或主要功能受到严重影响;II.这种故障会导致系统主要功能受到影响、任务延误的系统轻度损坏或存在较大的故障隐患;III.系统次要功能丧失或下降,须立即修理,但不影响系统主要功能实现的故障;IV.部分次要功能下降,只须一般维护的,不对功能实现造成影响(一般告警或指示灯故障等)。
III类故障通常称为重大故障,也即“单点故障”;III类故障可简单理解为需要尽快修复的故障。
当一个故障不能被检测出来时,是“隐患”,级别上升一级。
具体产品具体定义;33、可靠性分析方法可靠性、可靠性分析方法可靠性FMEAFMEA描述功能层次框图目的:
为了描述系统各功能单元的工作情况、相互影响及相互依赖关系,以便可以逐层分析故障模式产生的影响。
表示系统及系统各功能单元的工作情况和相互关系,以及系统和每个约定层次的功能逻辑顺序。
33、可靠性分析方法可靠性、可靠性分析方法可靠性FMEAFMEA描述可靠性模型框图目的:
表示系统可靠性与各功能模块可靠性之间的关系。
可靠性模型框图分为基本可靠性模型框图和任务可靠性模型框图。
33、可靠性分析方法可靠性、可靠性分析方法可靠性FMEAFMEA描述结构图目的:
清晰功能模块之间的相互关系,主要输入/输出信号。
确定故障模式和故障原因确定故障模式和故障原因(板间信号级)(板间信号级)光信号光信号无光、光功率衰减过大、时序错误电信号电信号常高、常低、开路、时序错误确定故障模式和故障原因(器件级)确定故障模式和故障原因(器件级)分类类型失效形式百分比电容器纸/塑料薄膜电容器短路74开路13参数漂移13玻璃釉电容器短路53开路25参数漂移22云母电容器短路83开路10参数漂移733、可靠性分析方法可靠性、可靠性分析方法可靠性FMEAFMEA确定故障模式和故障原因(系统级)确定故障模式和故障原因(系统级)业务类功能故障;对接类功能故障;信息上报类故障;故障诊断类故障;业务保障类故障;安全类故障;用户界面类故障;子系统层面:
全部功能不能实现;各部分功能不能实现;功能异常。
FMEAFMEA分析表格分析表格33、可靠性分析方法可靠性、可靠性分析方法可靠性FMEAFMEA软件故障管理需求列表硬件故障管理需求列表33、可靠性分析方法可靠性、可靠性分析方法可靠性FMEAFMEA测试验证需求列表CriticalityAnalysisCriticalityAnalysis,危害性分析,危害性分析按每一种故障模式的严酷度类别及故障模式发生概率所产生的影响对其分类,以便全面地评价各种可能的故障模式的影响。
是FMEA的补充和扩展。
用RPN(RiskPriorityNumber,风险占先数)来定量表示RPNSPD*其中:
S严重程度,对于IIV类故障分别选取100,5,1,0.2P故障发生的概率,器件失效率与故障模式发生概率的乘积,FIT;D客户发现故障的概率,很容易发现5,稍加注意即可发现1,不会发现0.2。
*通常可不考虑该参数33、可靠性分析方法、可靠性分析方法CACAl可靠性工作介绍可靠性工作介绍l故障管理设计故障管理设计lFMEAFMEA分析方法介绍分析方法介绍l可靠性验证测试(可靠性验证测试(FITFIT)课程目的课程目的开发阶段验证产品开发阶段验证产品MTBFMTBF或或AA:
l可靠性是基于统计的结果,需要有足够的样本量;l时间较长;试验量大;l难以模拟现场应用环境;44、可靠性验证测试及评估可靠性验证测试、可靠性验证测试及评估可靠性验证测试可靠性可靠性FIT测试验证目的:
测试验证目的:
1、可靠性增长,测试发现问题,提高系统可靠性;2、验证系统可靠性,验证系统的故障管理能力;3、对产品故障恢复能力定量估计(可靠性指标验证);FIT(FaultInsertionTest):
故障插入测试软件硬件维护操作44、可靠性验证测试及评估可靠性验证测试、可靠性验证测试及评估可靠性验证测试器件分类失效模式1失效模式2失效模式3器件分类失效模式1失效模式2失效模式3电阻短路开路阻值变化指示灯变暗不亮时好时坏电容器短路开路漂移晶体管、光电耦合器短路开路漂移二次模块电源无输出输出偏低输出偏高传感器性能退化输出为0或最大值无输出FPGA短路无功能电性能退化光电器件光功率低无光功率其他专用集成芯片激光驱动器整体失效厚膜、音频及通信网口变压器开路短路光分路器性能退化开路粘污感性器件开路漏电短路波分复用器整体失效继电器开路不能动作光纤衰减器断纤退化接触器不能动作断不开光开关整体失效晶体振荡器无输出输出频率不对输出时有时无射频功率放大器IC增益低P1db低无输出滤波器短路开路漏电射频开关插损变大隔离度变小P1db变小接插件开路接触不良短路电池性能退化无输出短路开关开路破裂粘连风扇不转无法启动保险管不能熔断熔断慢过早熔断显示器变暗缺点不显示硬件常用器件失效模式44、可靠性验证测试及评估可靠性验证测试、可靠性验证测试及评估可靠性验证测试验证系统故障管理能力1)出现故障后系统处理不当引起业务中断;比较典型的例子:
出现故障后系统处理不当引起业务中断;比较典型的例子:
线路的1.8V电源失效,网络发生复用段倒换,但几分钟后倒换确恢复了,导致网络业务中断;2)主备之间的信号检测未加过滤,导致误倒换;比较典型的例子:
主备之间的信号检测未加过滤,导致误倒换;比较典型的例子:
主备单板之间的主备信号、好坏信号等等的检测没有增加过滤,由于这些信号是时钟信号,因此外界出现干扰,系统主备出现误倒换;3)模块之间处理错误;比较典型的例子:
模块之间处理错误;比较典型的例子:
时钟板的1.5V电源出现问题,由于BOIS和单板软件的接口错误,导致倒换失常;再比如:
线路发现交叉过来的业务出现LOS,会上报给主机,但却被主机给抑制了,系统无法知道原因;4)重大故障无法准确定位;比较典型的例子:
重大故障无法准确定位;比较典型的例子:
线路的622M晶振失效,系统出现很多业务的告警,但无法准确定位是哪一块单板出现故障;5)检测不全面;比较典型的例子:
检测不全面;比较典型的例子:
在位线或者ID线在单板运行过程中出现故障,系统无法知道,单板硬复位或者重起后,无法和主控联系,业务中断;6)告警抑制不正确;这个问题很多,其中比较典型的例子:
告警抑制不正确;这个问题很多,其中比较典型的例子:
单板电源出现问题,系统会上报电源或者单板不在位告警,但其他会随之上报很多读写错误、总线错误等等杂乱的告警,定位困难,没有做到真正的抑制关系。
44、可靠性验证测试及评估可靠性验证测试、可靠性验证测试及评估可靠性验证测试验证系统故障管理能力不但要保证故障后可以倒换,还需要提供相应的告警指示。
产品可靠性指标验证产品可靠性指标验证44、可靠性验证测试及评估可靠性验证测试、可靠性验证测试及评估可靠性验证测试l主用单板故障定位率l备用单板故障定位率l切换成功率l平均故障恢复时间l主备倒换时间l主备倒换过程中业务的受损情况FMEAFIT测试验证
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- FMEA 方法 培训