EMB5116告警处理手册Word格式文档下载.docx
- 文档编号:4905894
- 上传时间:2023-05-04
- 格式:DOCX
- 页数:37
- 大小:910.16KB
EMB5116告警处理手册Word格式文档下载.docx
《EMB5116告警处理手册Word格式文档下载.docx》由会员分享,可在线阅读,更多相关《EMB5116告警处理手册Word格式文档下载.docx(37页珍藏版)》请在冰点文库上搜索。
GPS天线开路
12、或2060
GPS天线短路
96、或2144
GPS接收机正在计算位置
等待45分钟
表22GPS故障状态表
1.1.3GPS搜星原理
GPS空间卫星星座由24颗卫星组成,分布在6个轨道面内,每个轨道上分布有4颗卫星。
在同一观测点,位于地平线以上的卫星数目,随时间和地点而异,但最少为4颗,最多可达11颗。
GPS定位原理要求在同一时刻,至少观测到4颗以上卫星才能定位;
GPS锁星数至少为4颗就能保证GPS接收机在正常天气下可靠工作。
图21GPS卫星图
1.1.4GPS天线安装位置
GPS天线应安装在较开阔的位置上,保证周围较大的遮挡物(如树木、铁塔、楼房等)对天线的遮挡不超过30度,天线竖直向上的视角应大于120度。
为避免反射波的影响,GPS天线尽量远离周围尺寸大于20厘米的金属物2米以上。
不要将GPS天线安装在其他发射和接收设备附近,不要安装在微波天线的下方,高压线缆下方,避免其他发射天线的辐射方向对准GPS天线。
两个或多个GPS天线安装时要保持2米以上的间距,建议将多个GPS天线安装在不同地点,防止同时受到干扰。
在满足位置的情况下,GPS馈线应尽量短,以降低线缆对信号的衰减损耗。
判断GPS工作环境比较方便的办法就是观察GPS接收到的卫星信号的强度。
一般使用C/No来判断,这个值越大越好。
正常情况下至少能收到6颗卫星的C/No在38到50之间,至少有3颗卫星的C/No大于43。
图22GPS天线安装位置示意图
GPS相关告警
告警编号
名称
告警源
可能原因
处理思路
20162
GPS进入HOLDOVE预警状态
主控板
1、长时间没有捕捉到GPS信号
2、GPS信号长时间过弱
1、查看GPS状态、配置数据
2、检查GPS天馈安装环境
3、排查工程问题
4、检查设备问题
20163
GPS进入HOLDOVER超时状态
20164
时钟锁相环异常
1、主控板晶振锁定异常
1、检查设备问题
21056
管脚CDD_BOARD5V监测值超出阈值上限(附加信息是VOLT_GPS_SYSTEMAlarm;
SCT5VGPSVoltage)
1、主控板卡硬件故障
1、排查工程问题
2、检查设备问题
表23GPS相关告警表
20162:
GPS进入HOLDOVER预警状态
告警编号:
20162
告警值:
255(无效)
1.1.5排障方法概述
✓查看GPS状态、配置数据
✓检查GPS天馈安装环境
✓排查工程问题
✓检查设备问题
1.1.6排障方法详述
1.1.6.1查看GPS状态、配置数据
1)在LMTB上查看“时钟源索引”:
1表示GPS,2表示北斗,3表示级联,4表示1588,参照实际情况修改。
2)在LMTB上查看“GPS故障状态代码”:
如果是2,修改“时钟源天线工作状态”为无源;
如果是8、10、12或2056、2058、2060,转入“2.3.2.3排查工程问题”;
如果是96或2144,等待45分钟。
3)在LMTB上查看“是否无GPS启动”:
参照实际情况修改。
1.1.6.2检查GPS天馈安装环境
1)参照“2.1.4GPS天线安装位置”检查安装环境是否满足要求,主要检查120度净空要求、周围可能存在的干扰、多个蘑菇头的放置。
2)用一个圆柱形通口的金属罩罩住GPS天线,对比GPS锁星情况,确定是否有外界干扰。
3)用GPS手持仪测试锁定情况,与基站GPS锁定情况做对比,确定是否有外界干扰。
1.1.6.3排查工程问题
1)排查节点为与GPS相关的蘑菇头天线、馈线、放大器、功分器、避雷器、接地线、GPS级联线缆等。
2)量电压:
从蘑菇头向基站方向进行测量
GPS线缆除了传输GPS射频信号外,还为GPS蘑菇头、放大器等设备供电。
可将基站假想为5.3V的直流电源,使用万用表向基站方向测量电压。
测量节点为各个接头,如GPS天线接头、分路器的GPS天馈接头、避雷器的GPS天馈接头、基站的GPS天馈接头等。
将黑(-)表笔接天线的芯、红(+)表笔接天线的屏蔽地。
各测量节点的电压值都在5V左右(此经验值需要各地项目在实际中获取);
如为0V,说明开路。
测量节点离基站越远,电压值应该越小;
如不符合,可能某个器件有损坏。
3)量电阻:
从基站向蘑菇头方向进行测量
使用万用表电阻档的20K量程,向蘑菇头方向测量GPS天线的等效电阻。
将红(+)表笔接GPS天线的芯、黑(-)表笔接GPS天线的屏蔽地,测量结果为R1;
红(+)表笔接GPS天线的屏蔽地、黑(-)表笔接GPS天线的芯,测量结果为R2;
一般来说,R1和R2的值相差不大,可以记为一个值R。
各测量节点的电阻值在150K到400K之间(此经验值需要各地项目在实际中获取);
如果电阻值极大,说明开路;
如果电阻值极小,说明短路。
如下是一组经验值。
万用表
档位
GPS天线类型
R1
R2
DT9204
20K
UCT
9K
3.6K
4)查馈线
线缆长度需求
线缆型号及损耗
备注
0~70m
LMR400(衰减18dB/100m)
无
70~110m
LMR600(衰减12dB/100m)
70~150m
增加GPS信号放大器
5)查级联线
用网线对GPS进行级联,级联线长度3~10米,可以支持3级;
3米以内支持4级。
线序
级联基站时钟源
级联基站时钟源天线工作状态
上级5116,下级5116
全部直连,不对网线内部的线序作调整
2(需要与18AE统一为3)
与上一级基站配置相同
上级18AE,下级18AE
1、3号细线对调,2、6号细线对调,4、5、7、8直连
3
6)查功分器
在安装的功分器上明确标明有+5V供电的接口下接的基站可以设置为有源工作方式,其它接口下的基站一定要设置为无源工作方式(如星时通公司的一分四功分器)。
在安装的功分器上没有明确标明有+5V供电的功分器下接的所有基站请设置为无源工作方式(如宁波泰立公司的一分二功分器(SP2WB136MS))。
1.1.6.4检查设备问题
1)查主控板锁相环状态
在LMTB上查询GPS故障状态,并且查询结果为GPS没有故障状态告警。
用OSPStudio登录主控板卡,此时控制台上会周期打印
0x7d4f800(tDpllMain):
ADJUSTEPLD
ResetingEpldPhaseTwice
在控制台下输入PLL_PRINT_SWITCH4后,会看到THECURRENTPP1S_REFPHASEDIFFERENCE的值一直在变化。
满足以上现象的板卡,为锁相环不正常。
如果下电复位不能解决就更换主控板。
建议联系研发支持处理。
2)查总线
通过LMTB查询各个板卡的温度为无效;
通过LMTB查询风扇转速为有效。
满足以上现象,为总线挂死,上站插拔风扇并下电复位基站可以解决。
20163:
20163
1.1.7排障方法概述
同“2.3.1排障方法概述”。
1.1.8排障方法详述
同“2.3.2排障方法详述”。
20164:
20164
1.1.9排障方法概述
1.1.10排障方法详述
1)用OSPStudio登录主控板卡,敲命令PLL_STATE_RECOVER,如果不能解决就更换主控板。
2)查锁相环问题,转入“2.3.2.4检查设备问题”。
21056:
管脚CDD_BOARD5V监测值超出阈值上限
20165
1.1.11排障方法概述
1.1.12排障方法详述
1)排查GPS天馈是否短路,转入“2.3.2.3排查工程问题”。
2)附加信息是VOLT_GPS_SYSTEMAlarm;
SCT5VGPSVoltage,说明主控板给GPS供电有异常。
开站时GPS长时间不能锁定
1.1.13排障方法概述
1.1.14排障方法详述
第2章传输故障
传输及告警介绍
图31传输拓扑示意图
目前RNC侧采用155M光纤,ATM方式基站侧用每路2M的E1线缆。
基站侧最多可以支持16路E1。
基站的SCT板卡可以支持8路E1,如果要连8路以上,需要加E1扩展板ETP,而且要求所有线缆都连到ETP上,不能将E1既插在SCT又插在ETP上。
传输的拓扑如图所示,RNC的CASA或CAPA板卡每拉出一路光纤,可支持64路E1,RNC给每个站点分配的一个或两个IMA组,给基站分配这路光纤上的E1逻辑链路号,链路号可以不连续,但必需分配到一路光纤上。
RNC拉出的光纤连到ODF配线架上,然后连接到SDH传输网络的光端机上。
SDH通过分配,将某个站点的所有逻辑链路分配到一路光纤,拉到站点机房的光端机上。
基站侧一般配置一个IMA组,包含多路E1。
多路E1通过机房的DDF搭线架和光端机拉出的E1对接。
本节说的传输,主要是指基站E1底层传输和基于E1之上的IMA协议,协议层次可以参考下图:
图32链路状态表
上图可以看出,传输分为三层,E1层,TC层和IMA层,基站和RNC传输通,要求IMA组激活。
一个IMA组中可包含多路E1,IMA组激活,至少要求一路E1可用。
一路E1可用的标志,可以从Lmtb的“IMA信息”中获得。
对上图的说明:
E1层:
要求近端有信号,单帧同步;
复帧失步无所谓,目前基站采用单帧同步。
TC层:
要求信元同步状态为同步。
IMA层:
要求近端IMA帧同步,远端TC同步,远端IMA帧同步,近端接收逻辑链路为RNC给基站配置的逻辑链路(就是RNC侧一根光纤中分配的E1链路的逻辑编号),近端发送接收和远端发送接收都激活,各路都有相同的IMA版本,远端操作模式为对称,远端时钟模式为ITC,远端帧长为128,远端IMA组ID为RNC给该基站分配的IMA组ID(各路必需一致),远端发送参考链路逻辑ID要求各路一致。
如果有一项不满足上述要求,该路E1有问题。
传输的告警做过多次精简,为了避免告警重复上报,目前传输发生故障,由RNC上报告警,基站侧的告警只记录到告警日志中,不上报OMCR。
基站现有传输告警有两条:
1、21502“IMA模式下IMA组内链路故障/TC模式下TC链路故障”;
2、21500“IMA组去激活”;
与传输相关告警
在IUB口协议中,IMA处于底层,如果底层出了故障,会对高层协议产生影响,会导致高层协议传输链路的故障。
图33Iub接口协议结构
下面告警与传输相关,如果基站正常启动后,传输长时间故障,必然会有下列告警:
1、20151“IPOA链路故障”;
2、20105“一条NBAP用SAAL故障”;
3、20106“NBAP用SAAL全部故障”;
4、20107“一条ALCAP用SAAL故障”;
5、20108“ALCAP用SAAL全部故障”;
6、20007“网元时间同步失败”
21502:
IMA模式下IMA组内链路故障/TC模式下TC链路故障
21502
0~15(链路号)
2.1.1排障方法概述
该告警上报,表示一路传输存在问题,表示该路E1没有连接或连接后没有激活。
通过告警值确定是哪路E1。
2.1.2排障方法详述
如果某个基站的某些E1没有连接,上报这个告警无需处理。
重点看连接后连路故障的情况,可以从lmtb的IMA信息里查看该路E1的状态,参见前面的“图3-2链路状态表”。
根据链路状态表中的状态,分步排查:
1、E1层就没有信号,说明基站侧没有受到RNC端的电信号,存在两种可能:
a)收发方向接反了,倒换收发尝试。
b)从基站到光端机的某个环节没有接好,需要逐段检查。
目前最有效的逐段检查是物力打环的办法。
比如在基站的E1出口处用过E1线缆打环,看Lmtb上E1的状态,也可以用一个发光二极管将基站侧的收发连接起来,看二极管灯是否亮,如果亮说明所测试的环节线路是好的。
在基站机房,对基站侧的测试,最远只能测到DDF搭线架,如果在DDF搭线架上给基站打环,基站正常,说明问题出在搭线架的对端以后的部分。
需要找传输人员确认光端机是否工作正常。
2、TC层没有同步,外场从未遇到。
3、IMA层没有激活,需要和RNC侧以及传输机房联合定位。
a)先记录激活链路的IMA组的ID。
将已经激活的链路暂时拔除(避免该路影响问题定位),只连这路观察IMA组是否可以激活,如果可以激活,看激活的IMA组ID和之前激活时记录的IMA组ID是否一致,如果不一致,说明RNC或传输机房的连路参数错误,给该基站不同的连路分配了不同的IMA组ID,需要RNC和传输机房重新调整IMA数据。
b)如果只连路还是无法激活,在基站侧指给该路E1向基站侧打环,看是否IMA可以激活,如果可以激活,表示从基站到打环处没有问题。
c)从基站机房给RNC侧的这路打环,看RNC侧IMA是否激活,如果不能激活,说明问题出在RNC到光端机之间,需要逐级排查。
d)从传输机房给RNC侧打环,确认RNC和打环处是否正常。
总之,传输问题定位可以采用逐级打环的办法定位,
21500:
IMA组去激活
21500
0~1(IMA组号)
2.1.3排障方法概述
IMA组去激活表明整个IMA组中没有一路E1可用,如果原来是激活的,突然去激活,表示基站和RNC之间的传输链路的某个环节出了问题,比如RNC复位或中间传输线缆被拽断。
2.1.4排障方法详述
如果是单IMA组,基站的IMA参数都采用默认的参数,参见下图,和下面参数相同即可,不用做再调整。
如果是双IMA组,需要根据具体需求配置双IMA组参数。
图34单IMA配置截图
图35双IMA配置截图第1部分
图36双IMA配置截图第2部分
IMA组去激活的排障方法和单路链路排障方法基本相同,有时施工不合格,将一捆E1线缆顺序弄乱,会给排障造成较大麻烦,处理方法是一路一路整理,整理好一路后作好标记,再去排除剩余的连路。
20151:
IPOA链路故障
20151
2.1.5排障方法概述
IPOA故障,表示OMCR和基站之间的管理通道故障,根据IUB接口图可以看到IPOA在IMA之上,在OMCR和基站之间存在IPOA保活机制,需要由此入手排障。
2.1.6排障方法详述
IPOA故障主要有两类:
1、IPOA无法建立:
基站启动后给RNC发IPOA请求消息,如果RNC收到消息后,RNC给基站回响应消息,基站根据响应消息中的内容建立IPOA通道。
目前有几种情况IPOA无法建立:
a)基站的EID不正确,导致RNC收到IPOA请求消息后不回响应消息,需要根据RNC给基站分配的EID修改基站EID,修改后复位基站。
b)基站收到RNC的响应消息,但是有CRC校验错误,部分传输数据丢失,可能存在某路连路异常,RNC发的数据没有完全到达基站。
c)基站收到RNC的响应消息,从si日志中看到,基站每次打印收到消息类型为133,说明某个环节环回了,基站发出去的消息被环回给基站了。
2、IPOA闪断:
IPOA闪断主要是OMCR(NEA)每5秒钟给基站设置的存活报文没有到达基站,如果基站连续3次基站没有收到就会发起IPOA重建,体现出反复IPOA故障又成功。
这时需要从NEA-〉RNC-〉Nodeb逐个排查。
先要看NEA是否发了Set报文,再看RNC是否透传了报文给基站,基站在SCT的21号日志中记录了基站收到NEA保活消息的情况,可以参考21号日志分析。
20105:
一条NBAP用SAAL故障
20105
10(Saal链路标识)
2.1.7排障方法概述
承载NBAP的SAAL链路负责基站和RNC之间传递NBAP消息,如果该SAAL链路故障,RNC和基站的NBAP过程无法交互。
一般情况IMA传输故障时间足够长,必然会导致该告警。
2.1.8排障方法详述
SAAL链路也有保活机制,目前保活周期是7秒钟,如果某条SAAL链路基站侧连续7秒收不到RNC存活消息,基站会上报SAAL链路故障。
如下情况会导致SAAL链路故障:
1、IMA故障时间超过7秒,会出现SAAL链路故障,排除IMA故障问题,参见前面章节;
2、IMA正常,基站侧有SAAL链路故障,要考虑是否某路传输出了问题,导致RNC侧给基站发的信元丢失,导致了SAAL链路闪断。
排障时要观察“IMA链路信息”中是否存在某路E1有帧失步计数;
3、需要和RNC联合定位,看RNC是否下发SAAL链路存活消息。
20106:
NBAP用SAAL全部故障
20106
2.1.9排障方法概述
IUB口协议中,对于SAAL链路可以配置两条,也可以一条,配置两条的时候是主备备份,防止一条SAAL链路故障时影响业务。
而实际上,主备配置在两个IMA组中更有意义,如果在一个IMA组中意义不大。
所以在基站侧只配置一个IMA组的时候,只有一个承载NBAP的SAAL链路。
如果这条故障,基站承载NBAP的连路就都故障了,所以会上该告警。
2.1.10排障方法详述
排障思路同”3.6.2排障方法详述”。
20107:
一条ALCAP用SAAL故障
20107
1(Saal链路标识)
2.1.11排障方法概述
承载ALCAP的SAAL链路负责维护PATH通道的删建,如果该SAAL链路故障,RNC和基站的无线链路的承载无法正常建立,一般情况IMA传输故障时间足够长,必然会导致该告警。
2.1.12排障方法详述
20108:
ALCAP用SAAL全部故障
20108
2.1.13排障方法概述
排障思路同”3.7.1排障方法概述”。
2.1.14排障方法详述
排障思路同”3.7.2排障方法详述”。
20007:
网元时间同步失败
20007
2.1.15排障方法概述
网元同步失败是指基站没有获取到SNTP服务器时间上报的告警,对业务没有影响。
发生告警要排查基站和SNTP服务器之间的通路。
2.1.16排障方法详述
网元时间同步失败,主要有以下基站原因:
IPOA闪断,导致基站获取网络时间失败。
OMCR规划中SNTP服务功能没有开启,需要和OMCR维护人员确认。
基站的SNTP服务器地址是从RNC的IPOA响应消息中带回的,要检查RNC给基站配置的SNTP服务器地址是否正确。
第3章主站故障
主站侧问题介绍
主站侧故障一般表现为板卡不能正常工作,小区退服,或者基站不可用。
对于单板故障,先复位板卡,如果复位后仍然无法正常启动,需要笔记本直连板卡进行单板升级,如果升级后板卡还是不能正常工作,需要更换板卡;
发生小区退服时,一般是在OMT上看到的告警,基站侧没有相关的告警,此时需要检查对应小区的基带资源和射频资源是否故障,可能是单板故障导致的基带资源丢失,或者是RRU退服或故障后导致射频资源不足,从而引起小区退服;
产生基站不可用告警时,是基站没有一个可用的本地小区,此时需要查看基站侧时钟信息、板卡、RRU等。
主站侧还有一些告警是与设备所处环境有关系,如机房温度过高、风扇故障导致电源模块保护频繁下电,致使基站反复重启。
主站问题相关告警
1、22000“DSP不存活”
2、60000“基站启动通知”
3、21008“光模块不在位”
4、20068“基站不可用”
5、20121“环境温度过高”
6、20120“环境温度过低”
7、20137“雷击告警”
8、20228“风扇长时间告诉运转”
9、20156“单板不在位”
10、20078“规划设备不在位”
11、20226“散热风扇故障”
12、21050“板卡温度超出上限”
13、21066“板卡温度低于下限”
22000:
DSP不存活
22000
检测失败的目的处理器编号
3.1.1排障方法概述:
DSP不存活的告警原因是:
在规定时间内,BCP处理器对Dsp存活检测没有收到响应消息,产生此告警。
3.1.2排障方法详述:
DSP不存活的主要原因是个别板卡长时间工作导致软件或者硬件故障,目前采用的方法是对DSP状态进行全网轮询,通过轮询结果筛选出有DSP不存活的BPOA或者BPIA,复位对应的板卡。
如果复位后DSP仍然不存活,需更换板卡。
60000:
基站启动通知
60000
255(无效值)
3.1.3排障方法概述:
此告警原因是基站复位后重新启动,通过这个告警可以推断基站启动的时间点,需要确认启动原因,排除非正常因素导致的基站启动。
通过提取基站的SI日志分析启动原因。
此告警只在频繁出现时关注。
3.1.4排障方法详述:
分析基站告警日志,找到此告警产生的对应时间点,同时查看SI日志中基站启动原因,如果为poweron,即可定位为掉电导致的基站复位,如下:
CCU(0,0)[SFW]->
LastHardWareResetreason--OSP_HW_POWON_CUASE
C
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- EMB5116 告警 处理 手册