芯片级主板维修经典案例.docx
- 文档编号:13470952
- 上传时间:2023-06-14
- 格式:DOCX
- 页数:26
- 大小:1.08MB
芯片级主板维修经典案例.docx
《芯片级主板维修经典案例.docx》由会员分享,可在线阅读,更多相关《芯片级主板维修经典案例.docx(26页珍藏版)》请在冰点文库上搜索。
芯片级主板维修经典案例
第一节 维修步骤
BFT维修的基本步骤与ICT/ATE维修步骤基本相同,只是分析过程,使用的维修工具和分析手法更多更复杂。
一、了解不良状况
主板不良故障一般分为三类:
关键性故障,是指主板出现严重故障,未能完成POST过程,不能给出任何提示,表现为无影、无声甚至无法开机上电等。
一般性故障,是指主板部分功能异常,但不引起主板致命性故障,一般在测试过程中会给出错误提示,表现为某外设或内部部件测试Fail。
除此之外的第三类故障能够完成POST,但运行或测试过程中出现无法给出提示
的故障,表现为无法进入系统、中途文件机、中途断电、测试异常、显示画面异常等。
根据不良状况区分其类型做出相应分析动作。
二、确认不良现象
利用维修工具,模拟测试环境,对主板进行测试与分析判断其不良现象与想象描
述是否吻合,确认其真正不良现象。
只有在确认其真正不良现象才有利于正确的分析
和判断不良故障。
同时在此步骤中排除误测现象。
注意,确认误测必须反复测试,同时要完全模拟BFT测试环境。
三、分析故障原因
分析故障原因是整个维修过程中的重点和难点,确认不良现象后利用测试测量工具设备根据主板维修的技能知识以及维修方法经验找出故障原因。
四、维修
这里指对故障原因做出处理,如更换不良元件,Rework不良焊接,刷新记录、修补线路等。
五、维修确认
指对维修后的主板从外观到功能的一个全面检测,以确认维修OK且未引起其它不良现象。
第二节 维修基本方法
-1–
主板不良故障现象很多,针对不同的不良现象,维修思路和方法各不相同。
但一些基本的维修思路和方法经常用到,列举如下:
一、观察法
观察法是一个最基本、最直接,而且在些不良现象时最有效的一种方法。
这里的
观察法不仅仅是指对主板外观的检查,还有测试过程中对测试画面、测试设备、诊断工具的异常观察。
观察法主要用在:
1 了解不良状况后针对不良相关部位重点检查如元件表面有无损害、焊接是否不良、有无断线、接口弹片是否变形、插件引脚是否异常等。
2 加电过程中元件是否发热、Debug诊断卡指示灯/代码是否正常。
3 测试过程中测试画面是否有异常出现
二、最小系统法
最小系统法是一个最常用的方法,主要用在分析不良故障时。
其原理是针对不良
现象,尽可能将外设甚至内存减少到最少,在最小的系统环境下测试主板,观察不良,将不良原因缩到最小范围,最终找出故障。
最小系统法主要用在:
1 档机故障分析,很多外部设备会引起系统文件机,在逐步减少外设的同时测
试主板,观察档机现象是否依然存在,如减少某一外设时档机现象消除,可确认为该外设相关模块故障引起档机。
2 无显示故障分析。
3 中途断电故障分析。
4 无法进入操作系统故障分析。
其使用方法原理都类似。
三、最大系统法
与最小系统法相反的是最大系统法,其原理正好相反,是尽量增加外设以及提高主板的工作负载,除了插上所有的外设外还尽量使主板工作在高CPU频率,高内存频率和大容量,而且使系统工作在处理大量数据的程序中如运行3D等。
最大系统法主要用在两个方面:
1 确认不良时,在确认不良过程中常会遇到发现不了不良状况,为了避免误判
-2–
为误测,一是尽量模拟正常测试环境,二是尽量加大系统的负载良以期达到发现不良的目的。
2 维修OK确认时,维修后的主板为保证其不良故障已消除,且无其它不良现象存在或引起新的不良,要使主板在最大系统下运行以确保主板维修OK。
四、屏蔽法
屏蔽法类似于最小系统法,只是减少的不只是外部设备,更主要的是屏蔽主板的
某个功能模块或某个功能模块的部分功能。
其目的也是在屏蔽主板模块的同时找出故障所在部位。
屏蔽的方式有硬件屏蔽和软件屏蔽。
软件屏蔽如在CMOS设置中屏蔽板载Audio、LAN、IDE界面或IDE的DMA功能,在测试程序的配置参数中屏蔽如USB测试的HighSpeed、LowSpeed,LAN测试程序的LoopBack等。
硬件屏蔽主要是将某个功能模块的工作必要条件屏蔽,甚至将功能模块的IC取下。
硬件屏蔽常用的方法是将功能IC的CLK断开。
屏蔽法主要用在无显示、无法进入操作系统、文件机等。
五、反复法
反复法有两种,一种是同一系统环境下反复测试测量,另一种是更换不同的系统
环境反复测试测量。
由此得出相同或不同的测试结果和测量值,以帮助分析故障。
反复法主要应用在各种不良现象不足以判断故障所在,所以利用反复测试测量的方式增加分析判断依据。
如USBFail时反复测试判断是单一PortFail还是多PortFail,是固定PortFail还是不稳定等。
如PCI设备不良时在不同的PCI插槽安装设备观察是某一插槽Fail还是PCI总线Fail等。
六、复位法
复位法主要针对与BIOS、CMOS、EPPROM相关的不良,由于这些模块固有的
特性,会将一些历史信息记录下来,其中可能会有错误的信息或数据影响主板的功能,
从而导致分析判断出现失误,所以采用复位的方法清除记录。
复位的方法有重新烧录和手动清除,如重烧BIOS,刷新EPPROM,清除CMOS或进入CMOS删除记录等。
七、测量比较法
利用维修工具对电源、时钟信号、控制信号以及其它信号的阻抗、电平、波形等
参数进行测量,并与正常主板在同一环境下测量到的数据进行比较。
此方法主要针对
-3–
不熟悉的信号参数做出判断其是否正常,再依异常信号来源找出故障所在。
八、替换法或试探法
替换法或者说试探法适用于各种不良,主要是针对在分析过程中出现无法确定
的故障,比如说有多种可能性的情况下,试探着替换某一部件。
替换法正确的可能性
很大程度上依赖维修者的分析技能和维修经验,故替换法的一般原则是从最大可能
部位替换,但考虑到维修成本和维修后造成的隐患,一般从较小的周边元器件和成本较低的部件着手,切忌盲目更换BGA等关键部件。
小结:
实际维修过程中会使用到多种维修方法,或交替使用或结合使用,应灵活运用,联系实际。
第三节 维修注意事项
在遵照维修基本步骤,运用各种维修方法分析维修主板的过程中,一些基本的注意事项必须注意。
一、检查外观
在主板维修之前和之后都要检查外观。
维修之前检查外观可以将外观不良引起
的功能故障轻易排除,达到事半功倍的效果,减少维修时间,避免分析判断错误,是
一个基本的维修手段。
维修之后检查外观,避免维修特别是更换元件引起的其它故障
或维修隐患,确保维修质量和产品品质。
同时在维修过程中对于一时无法找出故障原因的可以对主板做个全面仔细的外观检查,可以发现一些罕见的故障现象。
二、保护设备和主板安全
在测试和测量以及更换元件过程中都要注意保护维修设备和主板的安全。
安装CPU之前一定要测量主板特别是CPU电压,确定其电压稳定且在电压值在正常范围之内,否则容易烧坏CPU。
CPU电压可以利用专门的CPU保护座模拟VID接地产生。
主板上设备的安装与拆除都必须在断电的状态下进行。
用万用表测量阻抗、容值等必须在主板断电状态下进行。
更换主板元件不管大小忌带电操作。
在主板电源异常情况下测量电压波形时忌开机时间过长,否则容易不良故障相关元件连带损害。
如CPU电压不稳时开机时间过长会因过度发热烧坏MOS管,很连带击穿北桥芯片。
-4–
三、保养维修工具设备
工于善其事,必先利其器。
使用维修工具设备前必须保证其性能良好。
如万用表、示波器的精确度是否合格;CPU、内存的性能是否完好;USBHUB、AUDIOLoopback、LANLoopback等是否稳定;SIO、PIO接头是否损坏;硬盘(含操作系统、测试程序等)、软驱(含软盘)、光驱(含光盘)是否读写正常等。
保证维修设备工具的正常,在很大程度上保证了维修分析判断的正确性,由于维
修设备的不良会给不良分析工作带来很大的困扰甚至使分析思路陷于僵局,带来不
必要的麻烦,而且维修设备工具带来的不良现象存在一定的隐蔽性,很难发现,所以
在确认不良现象过程中发现出现的不良现象与原本的描述相差悬殊时一定要检测相
关的维修设备工具。
特别是硬盘、软盘等容易被主板损坏的设备。
注意,当在一片主
板上出现设备损坏或怀疑被损坏时,不要用另一设备去检测该主板是否会损坏设备。
四、灵活使用维修工具
合理充分的灵活使用维修工具可以使维修分析准确而迅速。
第四节 常见不良现象
依照前面我们讲过的在确认不良后再对不良原因进行分析,按不良的类型,其分
析的一般思路方法也不同。
不良的现象大致分为三类,但实际的不良现象复杂多变,其故障原因也不一而足,在这里先了解一下各种不良现象。
关键故障类:
无电源(无电源、无法开机、开机断电、自动开机等)
无显示(孤灯、“00”代码、其它错误代码、代码正常等)
一般故障类:
LAN、AUDIO、USB、IDE、FDD、PIO、SIO、KB、Mouse等Fail。
不良表现在:
找不到该设备或测试Fail等
其它故障类:
档机(开机档机、测试档机、中途断电、中途重启、随机档机等)
-5–
画面异常(颜色异常、字符异常、开机画面异常、测试画面异常等)
第五节 常见不良维修思路方法
NO1:
无电源
现象:
按PowerButton无作用,PowerButton灯闪烁、CPU风扇不转。
分析:
主板无电源是因为P4Power未接收到PS-ON信号,可能引起的原因有主
板有短路现象导致5VSB、3VSB不稳定;RTCCLK异常;南桥未接收到PowerButton信号;南桥未产生PS-ON信号等。
方法:
测量5VSB、3VSB电压,异常则根据线路图查找故障;断电状况下测量RTCCLK频率、波形,异常则检查电池电压、匹配电容等;测量ButtonBoard到南桥线路;测量南桥是否有PS-ON信号发出;检查南桥到PowerConnect之间的线路。
备注:
5VSB转换为3VSB后再转换为1.5VSB是南桥的工作电压之一,RTCCLK是南桥工作时钟之一,PowerButton信号是产生PS-ON的必要信号。
无电源相关电路如图,电路图1~电路图6。
-6–
电路图1
电路图2
电路图3
-7–
ToICH4
电路图4
电路图5
-8–
电路图6
NO2:
无显示1
现象1:
按PowerButton后CPU风扇工作,但未产生CPU电压或CPU电压异常,Debug卡上只有PWR灯亮。
分析:
CPU电压异常是因为VRM模块工作异常。
由CPU供电电路可知影响CPU电压的主要因素有VID、VCCVID、PGOK等基本控制信号以及反馈回路、负载阻抗、保护电路等。
方法:
测量VCCP对地阻抗,异常则检查线路;利用插上CPU保护座仿真的VID信号测量CPU电压VCCP,电压异常则测量VID电平、三相输出的每相的PWM信号、每相驱动的输出波形和频率、反馈波形等;若无CPU电压输出则测量PWM芯片工作的控制信号:
芯片工作电压、VID电平、PWROK电平等。
备注:
VCCP对地阻抗偏低会引起VCCP输出电流过大,VRM的保护功能会中止输出电压。
VID信号异常会使输出电压与额定电压不匹配。
三相输出如果有一组异常会使CPU电压不稳定,严重情况下会烧坏开关MOS管。
无显示相关电路如电路图7
-9–
电路图7
NO2:
无显示2
现象2:
CPU电压正常,Debug卡上依然只有PWR灯亮。
分析:
在CPU电压正常的情况下依然只有Debug卡上的PWR灯亮表示CPU没有开始工作。
CPU工作的最基本条件出了工作电压正常外,还有
CLK、RESET、PWROK、INIT#等控制信号。
方法:
利用CPU保护座测量时钟合成器供给CPU的两路时钟信号,观察其频率、波形是否正常,若异常则检查时钟合成器的工作状态;测量南桥供给CPU的PWROK,INIT#等信号,若异常则检查其到南桥的线路和南桥的工作状态;测量CPURST信号,若无则测量南桥供给北桥的PCIRST信号,若无则测量VRM供给南桥的PG信号。
备注:
CPU开始工作必需的基本信号除了上述之外,其它很难利用示波器测量其电压和波形,可以在断电情况下用万用表测量其对地阻抗。
无显示相关电路如图15:
“孤灯”主要测量信号脚位图
-10–
图15
NO2:
无显示3
现象3:
“00”代码,Debug卡上数据、地址灯亮。
分析:
Debug卡上有数据、地址灯亮表示CPU有开始工作。
CPU发出不同的地址信号则对应着Debug卡上的地址信号灯,CPU发出信号后从BIOS收到数据则对应着Debug卡上的数据信号灯。
当地址数据灯不再闪烁时即表示CPU发送地址接收数据出现错误,中止了工作。
方法:
观察Debug卡上数据地址灯的状况,如开机则数据地址灯全亮或地址灯全亮表示CPU发送出第一个地址后未接收到数据,可利用FLASH卡引导开机判断是否BIOS电路或BIOS本身不良;如数据地址灯有亮有灭则为地址数据传输错误,多
为地址数据信号线出现故障,利用万用表静态测量前端总线的数据地址线对地的阻抗。
备注:
引起“00”代码无显示的原因特别多特别复杂,在排除BIOS方面的原因后,最多的故障就是CPU与主板线路的导通与否,一个最简单的分析方法就是测量CPU所有引脚对地阻抗与正常板比较,找出异常。
NO2:
无显示4
现象4:
有代码,无显示。
分析:
一般“00”代码我们称为无代码。
在开机上电自检(POST)过程中BIOS程
-11–
序检测整个主板各个部件以及配置功能等,在执行每段自检程序的同时会有对应的一个代码在Debug卡上显示出来,当检测某个主板设备或某个功能出错时会中止POST,此时显示出的代码我们称为错误代码(ErrorCode)。
一般主板都有其对应的错误代码表,附Bluford3主板错误代码表。
方法:
有代码维修的基本思路是根据代码查看代码表,根据代码对应的信息检测相关的模块。
如一块主板POST到“25”代码停止,查看代码表“25”代码表示初始化PCI,主板上PCI的Debug卡使用正常一般来说PCI总线OK,而主板载有PCI总线的网卡,测量为其提供工作频率的晶振,发现晶振不起振,换之OK。
备注:
引起错误代码的故障初次出现比较难分析,但同样的代码其故障部位较固定,积累了一定的经验,分析维修都较容易。
NO3:
开机档机
现象:
从有显示到完成POST即代码跳变到最后这段过程中出现的档机。
分析:
开机档机与有代码无显示的本质是相似的,因为同样会出现错误代码,故分析时可以采用类似的方法。
不同的是无显示时一般主板上只安装了CPU、内存,开机档
机的主板可能是因为加有外设的原故,所以观察档机时所显示出的提示信息。
方法:
首先查看提示信息,根据提示信息和错误代码检测相关的部件,其次拆除
外设,采用最小系统法,排除外设引起故障的可能性。
同时还可以采用屏蔽法,排除
主板上某些部件引起故障的可能。
需要注意的是有些外设特别如键盘不良会导致误认为是主板档机。
备注:
主板从开机到进入系统之前,所有的不良现象都可能由BIOS引起,所以对BIOS功能是否正常的判断特别重要,常用的方法就是利用PCIFlash卡替代主板BIOS引导系统,一方面可以判断故障是否由BIOS引起,另一方面可以将主板不良BIOS进行刷新。
NO4:
无法进入操作系统
现象:
完成POST过程,代码正常,但进操作系统时出现死循环或出现文件丢失、文件损坏等提示信息。
分析:
无法进入操作系统主要是加载操作系统时要从硬盘读取大量数据,由于ATA总线采用快速的UltraDMA方式,从硬盘到南桥DMA控制器到北桥内存控制器到内存整个信道任一模块功能故障都可能出现无法进入操作系统的现象。
-12–
方法:
首先保证系统能够找得到硬盘,查看CMOS设置中是否找到硬盘或是否4个IDE通道被屏蔽。
换不同的IDE界面进操作系统,如果其中一个能进而另一个不能进,可能是其IDE界面线路故障。
如都不能进则可能是南桥故障,进入CMOS屏蔽UDMA以及其它外设界面,排除南桥其它控制界面故障的可能性。
换不同的操作系统,如不能进Windows时却可以进DOS系统,很可能是北桥的内存控制界面和图形处理器故障,因为进Windows系统需要传输和处理的数据要比DOS系统更多更复杂。
备注:
无法进操作系统的分析方法是屏蔽法和反复法。
NO5:
画面异常
现象:
包括字符异常、图形异常、颜色异常等。
分析:
画面异常多在开机时就会出现,在Windows界面时更加明显,在测试画面
偶尔出现。
因为图形处理器是集成在北桥内部,大多画面异常都是北桥故障引起,但如果单纯是颜色异常则多由北桥到VGA接口线路故障引起。
方法:
对于颜色异常,测量RGB三基色的波形,在黑白画面时三基色的波形是
完全一样的,如果其中某基色波形异常或缺色,断开其线路与接口的连接测量北桥是
否有信号输出,如有输出则检测外部线路特别是其滤波电容,如无输出则检测北桥工
作状态。
对于字符、图形画面异常除了北桥故障外,重点测量北桥的工作电压、工作
频率等。
北桥的工作电压异常或供给北桥的工作频率异常都可引起画面异常。
颜色异常相关电路图8~电路图9:
电路图8
-13–
电路图9
备注:
在开机的BIOS画面(即厂商LOGO画面),因其画面内容是存储在BIOS中,如BIOS数据异常也可引起画面异常,对此处理的方法是刷新BIOS或利用程序更改其数据。
NO6:
网卡不良1
现象1:
网卡MACAddress无法烧录或烧录过程提示出错。
分析:
网卡MACAddress烧录是利用烧录程序将一个唯一的地址信息固化在一个EPPROM芯片中。
MAC无法烧录主要是因为系统侦测不到网卡,原因有两个,一是CMOS中网卡被屏蔽,另一个是因为网卡是PCI总线的网卡,PCI总线或网卡芯片本身故障。
烧录过程中出错是控制芯片内部寄存器故障或EPPROM芯片故障。
方法:
对于侦测不到网卡的情形,能是网卡芯片与南桥之间的PCI总线故障,可以通过测量网卡芯片上的PCI总线数据地址以及控制信号线的对地阻抗来判断。
正
常的情形下其对地阻抗为固定值,当有开路或短路情况时阻抗会升高或降低。
对于烧录出错的情形,检测网卡芯片和EPPROM芯片之间的线路,或采用替换法判断其故障所在。
备注:
烧录在EPPROM中的信息可能会丢失或出错,利用检测程序Check时如果出错可以通过重新烧录的方式纠正。
-14–
NO6:
网卡不良2
现象2:
登录网络Fail或网卡测试Fail。
分析:
对于Bluford3主板板载网卡,有一个专门的测试程序(BCM-Diag),主要针
对其内部寄存器测试,而利用登录网络和测试网络回路的方式测试其数据传输功能。
方法:
对于网卡内部寄存器测试Fail的情形,在检查其外观无不良焊接后一般采
用替换法判断其故障,很少的情况下会由于是南桥故障引起。
对于网卡数据传输功能不良的情形,首先是检测网卡芯片到网络接口RJ45之间的线路,然后是检测RJ45连接器,因为RJ45比一般的连接器要复杂,其内部还有电子器件,最后是检测网卡芯片本身。
备注:
网卡测试程序测试内容比较多,所以不同的测试不良项目其故障也不同,如10Mb测试Pass而100MbFail时多为芯片寄存器故障,而10Mb和100Mb测试都
不良时多为接口线路故障。
为网卡单独提供一个基准频率的晶振也容易出故障,如不起振会造成无显示,而频率未在标称范围内则引起测试不稳定等。
NO7:
AUDIO不良1
现象1:
内部寄存器测试Fail
分析:
声卡测试程序也分为两部分,一部分是内部寄存器测试,一部分是声卡回
路测试。
内部寄存器测试会出现的两种不两现象一是找不到声卡芯片模块,二是逻辑功能不良。
声卡芯片与南桥连接的AC97总线由5路信号构成,同时也有一个专用的晶振提供基准频率。
方法:
找不到声卡芯片时测量晶振是否起振,若晶振起振则测量AC97的5路信
号的电压、波形、频率等。
若晶振不起振,可能是晶振本身故障或声卡芯片故障以及线路故障。
一个好的判断晶振是否OK的方法是在开机到进入系统的过程中一直用示波器监测晶振的波形,如果在中途晶振曾经起振过则证明晶振OK。
因为在开机过
程中初始化声卡芯片时若声卡某一功能模块正常就会使晶振有一个短暂的震动过程。
在测试声卡逻辑功能出现不良时一般由声卡芯片和南桥控制模块故障引起,需要根据测量5路AC97信号具体分析,同时要根据经验采用试探法。
找不到声卡相关电路图10如下:
-15–
-16–
NO7:
AUDIO不良2
现象2:
音频回路测试Fail
分析:
声卡音频回路测试是针对声卡的音频输出、音频输入回路的一个测试,其原理是利用从SpeakOut接口输出音频信号,通过回路从MICIn和LineIn以及CDIn接口接收信号,检测回路是否通畅、信号是否完整等。
任一回路故障都会造成不良出现。
测试原则是先测LineIntoSpeakOut再测MICIn和CDIn。
方法:
查看测试不良提示信息,如显示LineIntoMICInFail或LineIntoCDInFail表示有音频信号输出,声卡芯片功能基本正常,故障出在接口回路,用万用表检测MICIn和CDIn接口以及回路的线路,重点在线路中的耦合和滤波电容;如不良提示信息显示的是LineIntoSpeakOutFail则可能是声卡芯片未能输出音频信号或
输出回路故障,除检测输出接口外重点测量输出信号。
测量方法一是不带电情况下测
试声卡芯片输出音频信号对地的阻抗,二是运行测试程时测量输出的音频信号的电压波形等。
音频输出相关电路如下:
电路图11是前端音频输出转接口
前端音频输出转接口
电路图11
电路图12是后端音频输出转接口
-17–
音频输出耦合电解电容
电路图12
NO8:
USB不良
现象:
利用USBHUB测试6个USB接口时出现Fail
分析:
USB的控制器集成在南桥中,由时钟合成器产生的48MHzCLK为其工作频率。
USB的外部线路非常简单,但由于接口较多,且测试内容包涵USB的多种工作模式,所以出现的不良类型也很多。
常见的不良表现:
找不到USB;某个USBPORT找不到;所有PORTHighSpeed测试Fail;电压测试Fail;某个PORTFail等。
方法:
USB测试找不到时一般是US
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 芯片级 主板 维修 经典 案例