集中性能告警处理及工单回复指导手册(华为)
回复工单需严格按照集团要求完成,即需包括采取的措施、采取措施的时间点及处理结果,故障原因等内容。工单回复目前为了方便一线回单,启用了自动生成恢复模板功能,回单人员需要在回单时对模板中的内容进行修改,对于回单随意,对模板不加修改,回单内容与实际不符的,一律做驳回处理。另外请确保语句通顺,标点使用正确,不要出现逻辑性错误。各分公司务必按照以下模板回复:
格式: 网元xxx于2016年10月26日 15:59:15上报XXX告警;故障原因:详细说明;处理办法:详细说明;故障历时:1312分钟;回复人:xx。 例如:甘肃省庆阳地区网元(环三)庆城办公楼-0-3-3-LQ2-OCH_TTP_Si-1于2016年10月26日 15:59:15上报输入强光告警告警;故障原因:经维护人员核查,发现本端设备接收光模块异常(具体原因);处理办法:更换本端光模块后输入强光告警消除(详细说明处理办法);故障历时:100分钟;回复人:XXX。
厂家:华为
OTN指标
【指标名称:RS_CROSSTR】
1. 告警名称:RS_CROSSTR
2. 告警解释:再生段性能越限告警,性能模块上报再生段性能越限事件的同时,
上报该告警。
3. 设备类型: OSN6800/8800/9800 4. 网管告警级别:三级告警
5. 影响业务情况:线路上存在误码,会导致业务的服务质量下降。 6. 告警产生原因:
1) 对端站单板激光器性能劣化; 2) 本站单板输入光功率过高或过低; 3) 对端站时钟性能劣化; 4) 光纤性能劣化。 7. 预处理要求:
1) 根据预处理步骤进行预处理,把预处理结果填写到EOMS工单,手工派
发给相关处理部门; 2) 短信\\电话通知相关部门。 8. 预处理步骤:
1) 检查光纤线路是否存在老化或者衰减过大等,如果是,消除光纤故障;
2) 通过U2000查询单板是否存在B1_EXC、B1_SD、B2_EXC、B2_SD告警,如果存在,优先处理这些告警;
3) 通过U2000查询本站单板的输入光功率是否在正常范围内;如果U2000显示光功率正常,可能是单板故障,更换单板。如果U2000显示光功率不正常,调节其输入光功率到正常范围。 4) 如果告警没有清除,处理对端站单板故障。
9. 预处理输出:
告警时间、故障网元名称、告警名称、故障初步判断原因、对端网元名称(线缆故障)/板卡名称(设备故障)。
10. 闪断告警处理 :
如果告警频繁出现,则立即派单,并在预处理内容中写明告警闪断。
【指标名称:PM_BIP8_SD】
1. 告警名称:PM_BIP8_SD
2. 告警解释:光通道数据单元(ODU)层PM段误码劣化告警。即单板检测到
光通道数据单元层PM段BIP8校验误码数量超过劣化门限时产生本告警。 上报波分侧/客户侧:波分侧、客户侧。 3. 设备类型:WDM 4. 网管告警级别:二级告警
5. 影响业务情况:系统的业务信号产生误码,可能影响系统质量。 6. 告警产生原因:
1) 对于客户侧支持OTN业务类型的OTU单板,客户侧输入的信号本身存在大
量PM段BIP8误码; 2) 输入光功率过高或者过低;
3) 系统性能劣化,例如OSNR(光信噪比)过低、色散、非线性等; 4) 上游站单板故障; 5) 本站单板故障。 7. 预处理要求:
1) 登陆EMS,对性能故障进行详细分析,逐步排查性能降质原因,如可能通过
直接的手段解决进行尝试;
2) 如无法通过直接手段解决,则将性能故障的详细信息收集,传送至专家支持,
并电话通知。 8. 预处理步骤
1) 对于客户侧支持OTN业务类型的OTU单板,通过U2000查询客户侧输入的
信号是否存在大量PM段BIP8误码。如果是,先排除客户侧设备的故障; 2) 如果告警没有清除,通过U2000查询光口的输入光功率。检查光口的输入
光功率是否在正常范围内,具体单板光功率指标参见《产品描述》。如果功率不正常,请按照IN_PWR_HIGH或者IN_PWR_LOW告警处理; 3) 如果告警没有清除,可能本站单板故障,更换故障单板; 4) 如果告警没有清除,可能上游单板故障,更换故障单板。 9. 预处理输出:
告警时间、故障网元名称、告警名称、故障初步判断原因、对端网元名称(线缆故障)/板卡名称(设备故障)。
10. 闪断告警处理 :
如果告警频繁出现,则立即派单,并在预处理内容中写明告警闪断。
【指标名称:BEFFEC_EXC】
1. 告警名称:BEFFEC_EXC
2. 告警解释:FEC纠错前误码越限告警。即对端OTU单板波分侧发送的信号
具有FEC功能,则本站OTU单板波分侧接收方向在进行FEC纠错前会对其
误码率进行统计,如果超过规定门限,则产生本告警。 3. 设备类型: OSN6800/8800/9800 4. 网管告警级别:二级告警
5. 影响业务情况:系统容错能力降低,严重时会影响业务信号的质量。 6. 告警产生原因:
➢ 单波产生此告警的可能原因如下:
1) 原因1:OTU单板输入光功率过高或者过低。
2) 原因2:对接的两个OTU单板的FEC纠错模式不一致。 3) 原因3:OTU单板与分/合波板之间的光纤故障。 4) 原因4:安装的DCM模块类型不合适。
5) 原因5:上报此告警的单板或对端站OTU单板故障。 ➢ 多波产生此告警的可能原因如下: 1) 原因1:光缆或合波部分的光纤故障。 2) 原因2:信号在线路传输中损耗过大。 3) 原因3:外部环境异常。 7. 预处理要求:
1) 根据预处理步骤进行预处理,把预处理结果填写到EOMS工单,手工派发给
相关处理部门;
2) 短信\\电话通知相关部门。 8. 预处理步骤:
➢ ➢
在U2000上查询该告警,记录上报告警的光口号和通道号。 单波产生此告警的原因1:OTU单板输入光功率过高或者过低。
a) 通过U2000查询光口的输入光功率是否在正常范围内。具体单板光功率指标参见《产
品描述》“技术指标”。
说明: 参见《任务集》“查询光模块信息”或者《硬件描述》“单板条形码”可获取单板光模块制造信息。 b) 如果光功率过高或过低,参见IN_PWR_HIGH及IN_PWR_LOW告警的处理方法进行
处理。
c) 若光功率正常但告警未消除,转单波产生此告警的原因2。
➢ 单波产生此告警的原因2:对接的两个OTU单板的FEC纠错模式不一致。
a) 使用U2000查询相互对接的两个OTU单板的FEC纠错模式,将二者的纠错模式统一
为FEC或者AFEC模式,保证模式匹配。具体操作请参见《任务集》“设置FEC类型”。 b) 查询告警是否消除。若告警未消除,转单波产生此告警的原因3。
➢ 单波产生此告警的原因3:OTU单板与分/合波板之间的光纤故障。 a) 检查光纤连接器,如果发现有污损,清洁或更换光纤连接器。
b) 若告警未消除,检查尾纤,如果尾纤弯曲度过大、损坏或者老化,调整尾纤或者更换
尾纤。
c) 查询告警是否消除。若告警未消除,转单波产生此告警的原因4。
➢ 单波产生此告警的原因4:安装的DCM模块类型不合适。
a) 根据现网要求检查是否使用适合的DCM模块,如果没有,更换DCM模块。 b) 查询告警是否消除。若告警未消除,转单波产生此告警的原因5。
➢ 单波产生此告警的原因5:上报此告警的单板OTU(B)或对端站OTU(A)单板故障。 a) 如下图所示,告警在OTU(A)和OTU(B)单板IN口同时上报,将OTU(B)单板使用尾纤
并加上5dB固定光衰后进行波分侧硬环回。如告警未消失则表示OTU(B)单板故障,如告警消失则表示该单板正常,可能是OTU(A)单板故障。
b) 解除OTU(B)单板的环回,将OTU(A)单板使用尾纤并加上5dB固定光衰后进行波分侧
硬环回,如果OTU(A)告警未消失,则表示OTU(A)单板故障。 c) 更换故障单板,查询告警是否消除。
如果…… 则…… 单板支持可插拔光模块, 更换可插拔光模块。 如果…… 则…… 单板不支持可插拔光模块, 更换单板。 ➢ 多波产生此告警的原因1:光缆或合波部分的光纤故障。
a) 检查光纤连接器,如果发现有污损,清洁或更换光纤连接器。
b) 若告警未消除,检查尾纤,如果尾纤弯曲度过大、损坏或者老化,调整尾纤或者
更换尾纤。如果站内光纤无问题,请处理站点之间的光缆故障。 c) 查询告警是否消除。若告警未消除,转多波产生此告警的原因2。
➢ 多波产生此告警的原因2:信号在线路传输中损耗过大。
a) 逐段检查站内和站点之间合波部分的衰减值,如果衰减值配置过大,请调节衰减到正
常范围。
b) 查询告警是否消除。若告警未消除,转多波产生此告警的原因3。
➢ 多波产生此告警的原因3:外部环境异常。
a) 分别检测机房环境温度、防尘网清洁、风扇散热等情况。
b) 查询告警是否消除。若告警未消除,检查外部是否存在电磁干扰源。如外界电子设备、
设备供电电源不稳、雷电和高压输电线产生的电磁干扰等。若存在,采取相应抗干扰措施。
c) 查询告警是否消除。若告警未消除,请联系华为工程师处理。
9. 预处理输出:
告警时间、故障网元名称、告警名称、故障初步判断原因、对端网元名称(线缆故障)/板卡名称(设备故障)。
10. 闪断告警处理 :
如果告警频繁出现,则立即派单,并在预处理内容中写明告警闪断。
【指标名称:OTUk_DEG】
1. 告警名称:OTUk_DEG
2. 告警解释:OTUk信号劣化告警。当误码检测模式为突发模式时,信号劣化
或误码越限时上报此告警。当误码检测模式为泊松模式时,信号劣化时上报此告警。 k表示速率级别。
• 对于OptiX OSN 8800,取值为1、2、3。 • 对于OptiX OSN 6800,取值为1、2、3。 • 对于OptiX OSN 9800,取值为1、2、3、4。
3. 设备类型: OSN6800/8800/9800 4. 网管告警级别:三级告警
5. 影响业务情况:若产生该告警,将造成该路光接口承载业务产生误码,使得
业务信号失效甚至造成业务信号不可用。 6. 告警产生原因:
1) 本端光口故障; 2) 光纤传输线路异常。
7. 预处理要求:
1) 根据预处理步骤进行预处理,把预处理结果填写到EOMS工单,手工派发给
相关处理部门;
2) 短信\\电话通知相关部门。 8. 预处理步骤:
1) 检查单板输入光功率是否在正常范围内,具体单板光功率指标参见《产品描
述》“技术指标”。如果不在正常范围内,参照IN_PWR_HIGH、IN_PWR_LOW告警处理;
2) 如果告警没有清除,检查光纤是否满足如下要求: 3) 光纤的折弯半径不小于40mm; 4) 光接头接触良好; 5) 光缆连接器清洁; 6) 光缆完好。
7) 如果不满足如上要求,请清洁光纤连接器或更换光纤。 8) 如果告警没有清除,可能单板故障,更换故障单板。 9. 预处理输出:
告警时间、故障网元名称、告警名称、故障初步判断原因、对端网元名称(线缆故
障)/板卡名称(设备故障)。
10. 闪断告警处理 :
如果告警频繁出现,则立即派单,并在预处理内容中写明告警闪断。
【指标名称:OTUk_PM_DEG】
1. 告警名称:OTUk_PM_DEG
2. 告警解释:ODUk PM信号劣化告警。当BIP8误码检测模式为突发模式时,
信号劣化或误码越限时上报此告警。当BIP8误码检测模式为泊松模式时,信号劣化时上报此告警。
K表示速率级别。k表示速率级别。
• 对于OptiX OSN 8800,取值为0、1、2、3。 • 对于OptiX OSN 6800,取值为0、1、2、3。 • 对于OptiX OSN 9800,取值为0、1、2、3、4。
3. 设备类型: OSN6800/8800/9800 4. 网管告警级别:三级告警
5. 影响业务情况:若产生该告警,将造成该路光接口承载业务产生误码,使得
业务信号失效甚至造成业务信号不可用。 6. 告警产生原因:
1) 原因1:单板输入光功率异常。 2) 原因2:光纤传输线路异常。
3) 原因3:上报此告警的单板或上游单板故障。
7. 预处理要求:
1) 根据预处理步骤进行预处理,把预处理结果填写到EOMS工单,手工派发给
相关处理部门;
2) 短信\\电话通知相关部门。 8. 预处理步骤:
➢
原因1:单板输入光功率异常。
a) 通过U2000浏览全网告警,记录发生此告警的各单板的板位号、光口号和通道号;
b) 根据业务流向先检查第一个产生此告警的单板相应光口的输入光功率是否在正常范围
内。具体单板光功率指标参见《产品描述》“技术指标”。
c) 如果光功率在正常范围内,通过U2000查询光功率历史性能是否有异常变化,如果有
异常变化,请转原因2。
d) 如果光功率不正常,调节光衰使其输入光功率在正常范围内。查询告警是否消除。若
告警未消除,根据业务流向逐个消除此告警。 e) 查询告警是否消除。若告警未消除,转原因2。 ➢
原因2:光纤传输线路异常。
a) 检查光纤连接器,如果发现有污损,清洁或更换光纤连接器。
b) 若告警未消除,检查尾纤,如果尾纤弯曲度过大、损坏或者老化,调整尾纤或者
更换尾纤。
c) 查询告警是否消除。若告警未消除,转原因3。
➢
原因3:上报此告警的单板或上游单板故障。
a) 更换上报此告警的单板或上游故障单板,
如果…… 则…… 单板支持可插拔光模块, 单板不支持可插拔光模块, 更换可插拔光模块。 更换单板。 b) 查询告警是否消除。若告警仍未消除,联系华为工程师处理。
9. 预处理输出:
告警时间、故障网元名称、告警名称、故障初步判断原因、对端网元名称(线缆故障)/板卡名称(设备故障)。
10. 闪断告警处理 :
如果告警频繁出现,则立即派单,并在预处理内容中写明告警闪断。
【指标名称:CLIENT_PORT_PS】
1. 告警名称:CLIENT_PORT_PS
2. 告警解释:客户侧1+1保护倒换告警,当客户侧1+1保护组发生倒换,当
前通道由工作通道切换到保护通道时,上报此告警。 3. 设备类型: OSN6800/8800/9800 4. 网管告警级别:三级告警
5. 影响业务情况:客户侧1+1保护组发生倒换时,会造成业务瞬断。有此告
警上报,说明客户侧1+1保护组工作通道可能存在业务故障,需要修复。 6. 告警产生原因:
1) 原因1:用户下发外部倒换命令,例如:强制倒换、人工倒换等。使得客户侧1+1保护组
当前通道由工作通道切换到保护通道,上报此告警。
2) 原因2:客户侧1+1保护组工作通道业务发生故障,当前通道自动切换到保护通道,上报
此告警。
7. 预处理要求:
1) 根据预处理步骤进行预处理,把预处理结果填写到EOMS工单,手工派发给
相关处理部门;
2) 短信\\电话通知相关部门。 8. 预处理步骤:
➢
原因1:用户下发外部倒换命令。
1) 通过U2000查询保护组的倒换状态,如果倒换状态是强制倒换或人工倒换,确认外部
倒换操作是否为正常操作需要。
2) 如果确认外部倒换操作为正常操作需要,无需处理该告警;
3) 如果确认外部倒换操作为非正常操作需要,通过外部命令将当前通道切换到工作通道,
告警即可消除。
➢
原因2:客户侧1+1保护组工作通道业务发生故障,当前工作通道自动切换到保护通道。 1) 查询配置保护组的相关单板是否存在业务相关的告警,如果存在,根据相应告警的处
理消除这些告警。具体告警信息请参见表2。
2) 如果告警没有清除,查看保护组属性是否为“恢复”模式,如果是,当前通道会在“等
待恢复时间”后自动切换到工作通道,告警消除。如果是“非恢复”模式,改为“恢复”模式,在“等待恢复时间”后告警消除。
3) 查询告警是否消除。若告警仍未消除,联系华为工程师处理。
9. 预处理输出:
告警时间、故障网元名称、告警名称、故障初步判断原因、对端网元名称(线缆故障)/板卡名称(设备故障)。
10. 闪断告警处理 :
如果告警频繁出现,则立即派单,并在预处理内容中写明告警闪断。
【指标名称:ODU_SNCP_STA_INDI】
1. 告警名称:ODU_SNCP_STA_INDI
2. 告警解释:ODUk SNCP保护组状态指示告警。当保护组工作通道或保护通
道发生故障时,或者用户下发外部倒换命令时,或者当前状态在等待恢复状态时,保护组工作通道对应的单板上报此告警。 3. 设备类型: OSN6800/8800/9800 4. 网管告警级别:三级告警
5.
影响业务情况:发生ODUk SNCP保护组倒换时,会造成业务瞬断。上报该告警时,说明ODUk SNCP保护组工作通道或保护通道可能存在业务故障,需要恢复。
6. 告警产生原因:
1) 原因1:用户下发外部倒换命令,例如:强制倒换、人工倒换、锁定倒换等。 2) 原因2:ODUk SNCP保护组工作通道或保护通道业务发生故障。
3) 原因3:倒换状态为“等待恢复”状态,经过“等待恢复时间(s)”后,告警消失。
7. 预处理要求:
1) 根据预处理步骤进行预处理,把预处理结果填写到EOMS工单,手工派发给
相关处理部门;
2) 短信\\电话通知相关部门。 8. 预处理步骤:
➢
原因1:用户下发外部倒换命令。
1) 通过U2000查询保护组的倒换状态,如果倒换状态是强制倒换、人工倒换或锁定倒换,
确认外部倒换操作是否为正常操作需要。
2) 如果确认外部倒换操作为正常操作需要,无需处理该告警;
3) 如果确认外部倒换操作为非正常操作需要,通过清除倒换命令将外部倒换清除。 ➢
原因2:ODUk SNCP保护组工作通道或保护通道业务发生故障。
1) 查询配置保护组的工作通道或保护通道的相关单板是否存在相关的告警,例如:
R_LOF、R_LOS、R_LOC、HARD_BAD、OTUk_LOF、OTUk_LOM、OTUk_AIS、OTUk_TIM、ODUk_LOFLOM、ODUk_PM_AIS、ODUk_PM_LCK、ODUk_PM_OCI、ODUk_PM_TIM、ODUk_TCMn_AIS、ODUk_TCMn_LCK、ODUk_TCMn_OCI、ODUk_TCMn_LTC、ODUk_TCMn_TIM、OTUk_DEG、OTUk_EXC、ODUk_PM_DEG、ODUk_PM_EXC、ODUk_TCMn_DEG、ODUk_TCMn_EXC等,如果存在,根据相应告警处理消除这些告警,使工作通道或保护通道业务恢复正常;
2) 如果告警没有清除,查看保护组属性是否为“恢复”模式,如果是,当前业务工作通
道会在“等待恢复时间”后自动切换到工作通道,告警消除。如果是“非恢复”模式,改为“恢复”模式,在“等待恢复时间”后告警消除。
➢
原因3:倒换状态为“等待恢复”状态,经过“等待恢复时间”后,告警消失。 无需处理该告警,经过“等待恢复时间(s)”后,告警自动消失。
9. 预处理输出:
告警时间、故障网元名称、告警名称、故障初步判断原因、对端网元名称(线缆故障)/板卡名称(设备故障)。
10. 闪断告警处理 :
如果告警频繁出现,则立即派单,并在预处理内容中写明告警闪断。
【指标名称:ODU_SNCP_PS】
1. 告警名称:ODU_SNCP_PS
2. 告警解释:ODUk SNCP保护倒换告警,当ODUk SNCP保护组发生倒换,
当前通道由工作通道切换到保护通道时,保护组工作通道对应的单板上报此告警。
3. 设备类型: OSN6800/8800/9800 4. 网管告警级别:三级告警
5. 影响业务情况:发生ODUk SNCP保护组倒换时,会造成业务瞬断。上报该
告警时,说明ODUk SNCP保护组工作通道可能存在业务故障,需要恢复。 6. 告警产生原因:
1) 原因1:用户下发外部倒换命令,例如:强制倒换、人工倒换等。使得ODUk SNCP保护
组当前通道由工作通道切换到保护通道,上报此告警。
2) 原因2:ODUk SNCP保护组工作通道业务发生故障,当前通道自动切换到保护通道,上报
此告警。
7. 预处理要求:
1) 根据预处理步骤进行预处理,把预处理结果填写到EOMS工单,手工派发给
相关处理部门;
2) 短信\\电话通知相关部门。 8. 预处理步骤:
➢
原因1:用户下发外部倒换命令。
1) 通过U2000查询保护组的倒换状态,如果倒换状态是强制倒换或人工倒换,确认外部
倒换操作是否为正常操作需要。
2) 如果确认外部倒换操作为正常操作需要,无需处理该告警;
3) 如果确认外部倒换操作为非正常操作需要,通过外部命令将当前通道切换到工作通道,
告警即可消除。
➢
原因2:ODUk SNCP保护组工作通道业务发生故障,当前通道自动切换到保护通道。 1) 查询配置保护组的相关单板是否存在业务相关的告警,如果存在,根据相应告警的处
理消除这些告警。具体告警信息请参见表2。
2) 如果告警没有清除,查看保护组属性是否为“恢复”模式,如果是,当前通道会在“等
待恢复时间”后自动切换到工作通道,告警消除。如果是“非恢复”模式,改为“恢复”模式,在“等待恢复时间”后告警消除。
3) 查询告警是否消除。若告警仍未消除,联系华为工程师处理。
9. 预处理输出:
告警时间、故障网元名称、告警名称、故障初步判断原因、对端网元名称(线缆故障)/板卡名称(设备故障)。
10. 闪断告警处理 :
如果告警频繁出现,则立即派单,并在预处理内容中写明告警闪断。
【指标名称:OCH_SSF】
1. 告警名称:OCH_SSF
2. 告警解释:OCh层服务信号失效。当OCH_SSF-P和OCH_SSF-O同时存
在时,产生此告警,并抑制原来的OCH_SSF-P和OCH_SSF-O告警。 3. 设备类型: OSN6800/8800/9800 4. 网管告警级别:三级告警
5. 影响业务情况:若是由于连纤错误引起,不会影响业务,否则,系统业务中断。
6. 告警产生原因:
1) 物理连纤和逻辑连纤不一致;
2) 上层OTS产生OTS-LOS告警或OMS层产生OMS-LOS告警。 7. 预处理要求:
1) 根据预处理步骤进行预处理,把预处理结果填写到EOMS工单,手工派发给相关处理部门;
2) 短信\\电话通知相关部门。 8. 预处理步骤:
1)检查逻辑连纤配置是否和物理连纤一致,如果不一致,修改逻辑连纤使其与物理连纤一致;
2)检查与单板相连接的FIU单板是否有OTS_LOS、OTS_TIM、OTS_LOS-P、OTS_LOS-O或OMS_LOS-P告警,如果有,根据相应的告警处理方法清除告警;
3)如果告警没有清除,检查对端站点及上游站点是否有OTS_LOS、OTS_TIM、OTS_LOS-P、OTS_LOS-O或OMS_LOS-P告警,如果有,根据相应的告警处理方法清除告警。 9. 预处理输出:
告警时间、故障网元名称、告警名称、故障初步判断原因、对端网元名称(线缆故障)/板卡名称(设备故障)。 10. 闪断告警处理 :
如果告警频繁出现,则立即派单,并在预处理内容中写明告警闪断。
【指标名称:TEM_HA】
1. 告警名称:TEM_HA
2. 告警解释:激光器温度过高。即激光器温度高于激光器温度上限,产生此告警。
3. 设备类型: OSN6800/8800/9800 4. 网管告警级别:三级告警
5. 影响业务情况:光模块管芯温度过高,会影响到光模块的工作波长,对用户业务造成影响。 6. 告警产生原因:
1) 单板工作温度过高; 2)激光器故障;
3)模块性能检测电路发生故障。 7. 预处理要求:
1) 根据预处理步骤进行预处理,把预处理结果填写到EOMS工单,手工派发给相关处理部门;
2) 短信\\电话通知相关部门。 8. 预处理步骤:
1)查看单板环境温度和机房通风情况,如果是单板环境温度过高,请使用制冷设备降低机房温度,例如打开空调; 2)单板故障,更换单板。 9. 预处理输出:
告警时间、故障网元名称、告警名称、故障初步判断原因、对端网元名称(线缆故障)/板卡名称(设备故障)。 10. 闪断告警处理 :
如果告警频繁出现,则立即派单,并在预处理内容中写明告警闪断。
【指标名称:TEM_LA】
1. 告警名称:TEM_LA
2. 告警解释:激光器温度过低。即激光器温度低于激光器温度下门限产生此告警。
3. 设备类型: OSN6800/8800/9800 4. 网管告警级别:二级告警
5. 影响业务情况:光模块管芯温度过低,会影响到光模块的工作波长,对用户业务造成影响。
6. 告警产生原因:
1) 单板工作温度过低; 2)激光器故障;
3)模块性能检测电路发生故障。 7. 预处理要求:
1) 根据预处理步骤进行预处理,把预处理结果填写到EOMS工单,手工派发给相关处理部门;
2) 短信\\电话通知相关部门。 8. 预处理步骤:
1)查看单板环境温度,如果环境温度过低,改善单板工作环境温度; 2)单板故障,更换单板。 9. 预处理输出:
告警时间、故障网元名称、告警名称、故障初步判断原因、对端网元名称(线缆故障)/板卡名称(设备故障)。 10. 闪断告警处理 :
如果告警频繁出现,则立即派单,并在预处理内容中写明告警闪断。
【指标名称:IN_PWR_HIGH】
1. 告警名称:IN_PWR_HIGH
2. 告警解释:输入光功率过高告警。即输入光功率大于输入光功率上限值时产生此告警。
3. 设备类型: OSN6800/8800/9800 4. 网管告警级别:二级告警
5. 影响业务情况:当输入光功率过高时,可能会使接收信号产生误码及LOF等告警,影响业务,还可能损坏单板光模块。 6. 告警产生原因:
1) 客户侧原因1:输入光功率过高,没有加适量的衰减。 2)客户侧原因2:上报此告警的单板故障。 3)波分侧原因1:上游单板输出光功率过高。
4)波分侧原因2:上报此告警的单板故障。 7. 预处理要求:
1) 根据预处理步骤进行预处理,把预处理结果填写到EOMS工单,手工派发给相关处理部门;
2) 短信\\电话通知相关部门。 8. 预处理步骤:
1)在U2000上查询该告警,记录上报告警的光口号和通道号。 2)客户侧原因1:输入光功率过高,没有加适量的衰减。
3)客户侧原因2:上报此告警的单板故障。如果上报告警单板的输入光功率正常,可能是上报此告警的单板故障,更换故障单板 ;
4)波分侧原因1:上游单板输出光功率过高,如果上游单板的输入光功率在正常范围内,输出光功率不在正常范围内,可能是上游单板故障,更换故障单板;若告警未消除,转波分侧原因2 5)波分侧原因2:上报此告警的单板故障。
如果上报告警单板的输入光功率正常,可能是上报此告警的单板故障,更换故障单板
6)若是多波产生的告警,处理方法同波分侧产生此告警的处理方法。 9. 预处理输出:
告警时间、故障网元名称、告警名称、故障初步判断原因、对端网元名称(线缆故障)/板卡名称(设备故障)。 10. 闪断告警处理 :
如果告警频繁出现,则立即派单,并在预处理内容中写明告警闪断。
【指标名称:IN_PWR_LOW】
1. 告警名称:IN_PWR_LOW
2. 告警解释:输入光功率过低告警。即输入光功率小于输入光功率下限值时产生此告警。
3. 设备类型: OSN6800/8800/9800 4. 网管告警级别:二级告警
5. 影响业务情况:由于输入光功率过低,可能会导致接收到的信号出现较多误码,影响业务正常接收。 6. 告警产生原因:
1) 客户侧原因1:光纤连接器污损,尾纤弯曲度过大、损坏或老化。 2)客户侧原因2:上报告警的单板的接收光口加了过大的光衰减器。 3)客户侧原因3:上报此告警的单板故障。
4)波分侧原因1:光纤连接器污损,尾纤弯曲度过大、损坏或老化。 5)波分侧原因2:上报告警的单板的接收光口加了过大的光衰减器。 6)波分侧原因3:对端站单板的发送光口添加了过大的光衰减器或者发送光模块故障。
7)波分侧原因4:光信号在传输过程中衰减过大,没有得到足够的光放大补偿。
8)波分侧原因5:上报此告警的单板故障。 7. 预处理要求:
1) 根据预处理步骤进行预处理,把预处理结果填写到EOMS工单,手工派发给相关处理部门;
2) 短信\\电话通知相关部门。 8. 预处理步骤:
1)在U2000上查询该告警,记录上报告警的光口号和通道号。
2)客户侧原因1:光纤连接器污损,光纤弯曲过大、损坏或老化。使用光功率计测量本站单板的输入光功率是否在正常范围内;如果测量结果比较低,则检查光纤连接器,如果发现有污损,清洁或更换光纤连接器;查询告警是否消除。若告警未消除,检查尾纤,如果尾纤弯曲度过大、损坏或者老化,调整尾纤或者更换尾纤;询告警是否消除。若告警未消除,转客户侧原因2。 3)客户侧原因2:上报告警的单板的接收光口加了过大的光衰减器。检查单板的接收光口是否添加了过大的光衰减器,如果是,则减小光衰减器的衰减值至适当的程度或更换适量的光衰减器。查询告警是否消除。若告警未消除,转客户侧原因3。
4)客户侧原因3:上报此告警的单板故障。更换上报告警的单板,若告警仍未消除,联系华为工程师处理。
5)波分侧原因1:光纤连接器污损,尾纤弯曲度过大、损坏或老化。光纤连接器污损,光纤弯曲过大、损坏或老化。使用光功率计测量本站单板的输入光功率是否在正常范围内;如果测量结果比较低,则检查光纤连接器,如果发现有污损,清洁或更换光纤连接器;查询告警是否消除。若告警未消除,检查尾纤,如果尾纤弯曲度过大、损坏或者老化,调整尾纤或者更换尾纤;询告警是否消除。若告警未消除,转波分侧原因2。
6)波分侧原因2:上报告警的单板的接收光口加了过大的光衰减器。检查单
板的接收光口是否添加了过大的光衰减器,如果是,则减小光衰减器的衰减值至适当的程度或更换适量的光衰减器;查询告警是否消除。若告警未消除,转波分侧原因3。
7)波分侧原因3:对端站单板的发送光口添加了过大的光衰减器或者发送光模块故障。检查对端站单板激光器是否关闭,如果是,通过U2000打开对端站单板的激光器。 查询告警是否消除。若告警未消除,检查对端站单板的发送光口是否添加了过大的光衰减器,如果是,则需要减小光衰减器的衰减值到适当的程度或更换适量的光衰减器,使对端站单板的输出光功率正常。
查询告警是否消除。若告警未消除,查询对端站单板输出光功率性能值和相关告警,如果查询到有相关告警上报或性能值不符合指标值,参见其他告警或性能事件的处理步骤进行处理。查询告警是否消除。若告警未消除,转波分侧原因4。
8)波分侧原因4:光信号在传输过程中衰减过大,没有得到足够的光放大补偿。通过U2000逆着信号流的方向,查询本站OTU的上游单板的输入和输出光功率,找到光功率过低的单板,调节光衰减器的衰减值或更换适量的光衰减器使其输入光功率到正常范围。如果告警没有清除,通过U2000逆着信号流的方向逐站检查上游站的输入和输出光功率,找到光功率降低的故障区间。如果上游输出正常,检查线路光缆、尾纤、光纤连接器、光衰减器,如果线路光缆的线路损耗大于工程设计值,调节衰减器,或者整改或更换光缆;如果尾纤、光纤连接器、光衰减器有污损,清洁或更换尾纤、光纤连接器、光衰减器; 如果上游输出不正常,处理上游站故障,使其输出光功率正常。查询告警是否消除。若告警未消除,转波分侧原因5。
9)波分侧原因5:上报此告警的单板故障。更换单板后告警还未消除请联系华为工程师进行处理。 9. 预处理输出:
告警时间、故障网元名称、告警名称、故障初步判断原因、对端网元名称(线缆故障)/板卡名称(设备故障)。 10. 闪断告警处理 :
如果告警频繁出现,则立即派单,并在预处理内容中写明告警闪断。
【指标名称:FAN_FAIL】
1. 告警名称:FAN_FAIL
2. 告警解释:风扇故障告警。两个或两个以上风扇失效时上报此告警。
3. 设备类型: OSN6800/8800/9800 4. 网管告警级别:二级告警
5. 影响业务情况:两个或两个以上风扇失效,导致运行单板温度过高,损坏单板。
6. 告警产生原因:
1)风扇停止转动; 2)风扇速率过低; 3)风扇失效。 7. 预处理要求:
1) 根据预处理步骤进行预处理,把预处理结果填写到EOMS工单,手工派发给相关处理部门;
2) 短信\\电话通知相关部门。 8. 预处理步骤:
1)通过U2000检查“风扇速率级别”是否设置为“停止”或“低速率”,如果是,将“风扇速率级别”设置为“高速率”; 2)如果告警没有清除,更换故障风机盒。 9. 预处理输出:
告警时间、故障网元名称、告警名称、故障初步判断原因、对端网元名称(线缆故障)/板卡名称(设备故障)。 10. 闪断告警处理 :
如果告警频繁出现,则立即派单,并在预处理内容中写明告警闪断。
【指标名称:SUM_OUTPWR_HI】
1. 告警名称:SUM_OUTPWR_HI
2. 告警解释:合路输出光功率过高告警。即合波单板输出光功率高于上限时上报该告警。
3. 设备类型: WDM 4. 网管告警级别:二级告警
5. 影响业务情况:对系统业务存在影响。可能导致下游站单板输入光功率过高,
引起业务出现误码,甚至中断,并可能损坏下游站OTU单板接收模块。 6. 告警产生原因:
1) 接入的光信号功率过高,没有加适量的衰减; 2)单板内部衰减调节错误; 3)单板硬件故障。
7. 预处理要求:
1) 根据预处理步骤进行预处理,把预处理结果填写到EOMS工单,手工派发给相关处理部门;
2) 短信\\电话通知相关部门。 8. 预处理步骤:
1)通过U2000查询本单板输入光口的光功率是否在正常范围内,如果光功率不在正常范围内,通过固定或者可调衰减器增加适量衰减;
2)如果告警没有清除,通过U2000查询单板(只针对V40)各个通道的衰减值,如果通道衰减值过小,通过U2000调节相应通道的衰减值到合适值; 3) 如果告警没有清除,更换故障单板。 9. 预处理输出:
告警时间、故障网元名称、告警名称、故障初步判断原因、对端网元名称(线缆故障)/板卡名称(设备故障)。 10. 闪断告警处理 :
如果告警频繁出现,则立即派单,并在预处理内容中写明告警闪断。
【指标名称:SUM_OUTPWR_LOW】
1. 告警名称:SUM_OUTPWR_LOW
2. 告警解释:合路输出光功率过低告警。即单板输出光功率低于下限时上报该告警。
3. 设备类型: WDM 4. 网管告警级别:二级告警
5. 影响业务情况:可能导致下游接收单板输入光功率过低,引起业务出现误码,甚至中断。
6. 告警产生原因:
1) 原因1:单板(只针对V40)内部衰减值过大; 2)原因2:光纤连接错误;
3)原因3:单板输入的光信号功率过低; 4) 原因4:上报此告警的单板故障。
7. 预处理要求:
1) 根据预处理步骤进行预处理,把预处理结果填写到EOMS工单,手工派发给相关处理部门;
2) 短信\\电话通知相关部门。 8. 预处理步骤:
1)在U2000上查询该告警,记录上报告警的光口号和通道号。 2)原因1:单板(只针对V40)内部衰减值过大。
通过U2000查询单板(只针对V40)各个通道的衰减值,检查通道衰减值是否过大,如果是,通过U2000调节相应通道的衰减值到合适值。 3) 原因2:光纤连接错误。
如果告警没有清除,对照工程连纤图确认光纤连接是否正确,不同波长的输入光信号应该接入单板相应的输入光口。如果连纤不正确,按照连纤图正确连接。
4) 原因3:单板输入的光信号功率过低。
如果告警没有清除,使用光功率计测量本站单板的输出光功率,对比本站单板上报的光功率性能是否一致,具体单板光功率指标参见《产品描述》“技术指标”。如果一致,使用光功率计测量单板的输入光口的输入光功率和对端站单板的输出光功率。
如果本站单板输入光功率过低而对端站单板输出光功率在正常范围内,检查尾纤、光纤连接器,如果有污损,清洁或更换尾纤、光纤连接器。 如果对端站单板输出光功率过低,对端站单板将上报相关告警,通过U2000查询相关告警,按照相应告警的处理方法进行处理。 5) 原因4:上报此告警的单板故障。
如果告警没有清除,可能为本站单板故障,更换故障单板 9. 预处理输出:
告警时间、故障网元名称、告警名称、故障初步判断原因、对端网元名称(线缆故障)/板卡名称(设备故障)。 10. 闪断告警处理 :
如果告警频繁出现,则立即派单,并在预处理内容中写明告警闪断。
【指标名称:TEMP_OVER】
1. 告警名称:TEMP_OVER
2. 告警解释:工作温度越限告警。当系统检测到单板的工作温度超过的温度上限值或低于的温度下限值时,就会上报该告警。 3. 设备类型: WDM 4. 网管告警级别:二级告警
5. 影响业务情况:单板工作温度过高(低),致使系统处于高危状态。在此状态下长期运行,有可能引起误码,业务中断等问题,应及时处理。
6. 告警产生原因:
原因1:风扇板转速设置过低。 原因2:风扇板故障。
原因3:制冷(热)设备故障,导致环境温度过高(低)。 原因4:风扇板不在位。 原因5:上报此告警的单板故障。 原因6:防尘网积累灰尘太多。 7. 预处理要求:
1) 根据预处理步骤进行预处理,把预处理结果填写到EOMS工单,手工派发给相关处理部门;
2) 短信\\电话通知相关部门。 8. 预处理步骤:
原因1:风扇板转速设置过低。
通过网管检查风扇单板的调速模式和转速,若为“可调模式”,且转速设置为“低速率”或者“中速率”,请将转速调为“高速率”或者修改调速模式为“自动模式”。
查询告警是否消除。若告警未消除,转原因2。
原因2:风扇板故障。
如果告警没有清除,检查风扇是否存在FAN_FAIL或FAN_FAULT告警。若存在,优先处理该告警。
查询告警是否消除。若告警未消除,转原因3。
原因3:制冷(热)设备故障,导致环境温度过高(低)。
如果告警没有清除,检测机房环境温度。如果高于45℃或者低于0℃,则使用制冷(热)设备降低或者提高环境温度。 查询告警是否消除。若告警未消除,转原因5。 原因4:风扇板不在位。
如果告警没有清除,查询网元是否上报风扇板BD_STATUS告警或者通过U2000检查风扇板是否在位。若风扇板状态为不在位状态,重新插紧风扇盒。 查询告警是否消除。若告警未消除,转原因6。 原因5:上报此告警的单板故障。
如果告警没有清除,更换产生告警的单板。具体操作参见更换单板。 原因6:防尘网积累灰尘太多。
如果告警没有清除,检查防尘网上积累的灰尘是否过多而导致散热不及时。可将手置于风扇出风处感觉出风的温度和出风是否顺畅。 若因防尘网被堵塞而影响散热效果,取出并清洁防尘网。 查询告警是否消除。若告警未消除,转原因4。 9. 预处理输出:
告警时间、故障网元名称、告警名称、故障初步判断原因、对端网元名称(线缆故障)/板卡名称(设备故障)。 10. 闪断告警处理 :
如果告警频繁出现,则立即派单,并在预处理内容中写明告警闪断。
1.1.1 厂家:华为
1.1.2.1
PTN指标
【指标名称:TEMP_OVER】
1. 告警名称:TEMP_OVER
2. 告警解释:TEMP_OVER为单板工作温度越限告警。当系统检测到单板的工作温度超过所设置的温度上限值或低于所设置的温度下限值时,就会上报该告警。
3. 设备类型: PTN 4. 网管告警级别:二级告警
5. 影响业务情况:单板工作温度过高(低),致使系统处于高危状态。在此状态下长期运行,有可能引起误码,业务中断等问题,应及时处理。
清除TEMP_OVER告警时,为了防止告警抖动,在单板温度降(升)到温度上(下)限5摄氏度后告警才会消失。
6. 告警产生原因:
原因1:制冷(热)设备故障,导致环境温度过高(低)。 原因2:温度告警上下限设置不符合实际情况。 原因3:风扇停止工作或防尘板积累灰尘太多。 原因4:单板故障。 7. 预处理要求:
1) 根据预处理步骤进行预处理,把预处理结果填写到EOMS工单,手工派发给相关处理部门;
2) 短信\\电话通知相关部门。 8. 预处理步骤:
原因1:制冷(热)设备故障,导致环境温度过高(低)。 检测环境温度是否高于45℃或者低于0℃。
若温度异常,检查制冷(热)设备是否能正常调节环境温度,优先处理制冷(热)设备故障。
原因2:温度告警上下限设置不符合实际情况。
查询单板当前工作温度和温度上下限设置,根据实际情况判断温度上下限值是否合理。若温度上下限设置不合理,重新设置上下限的数值。
原因3:风扇停止工作或防尘板积累灰尘太多。
检查风扇是否存在FAN_FAIL告警。若存在,优先处理该告警。 检查防尘网上积累的灰尘是否过多而导致散热不及时。可将手置于风扇出风处感觉出风的温度和出风是否顺畅。
若因防尘网被堵塞而影响散热效果,取出并清洁防尘网。 原因4:单板故障。
查看上报告警的单板是否还存在其它硬件类的告警,如HARD_BAD。 若存在,更换上报告警的单板。 9. 预处理输出:
告警时间、故障网元名称、告警名称、故障初步判断原因、对端网元名称(线缆故障)/板卡名称(设备故障)。
10. 闪断告警处理 :
如果告警频繁出现,则立即派单,并在预处理内容中写明告警闪断。
【指标名称:TEM_HA】
1. 告警名称:TEM_HA
2. 告警解释:TEM_HA告警表示激光器温度过高。 3. 设备类型: PTN 4. 网管告警级别:二级告警
5. 影响业务情况:该告警若长时间不清除,会造成激光器异常,激光器故障后会导致业务中断。
6. 告警产生原因:
原因1:工作环境温度过高。 原因2:光模块故障。 7. 预处理要求:
1) 根据预处理步骤进行预处理,把预处理结果填写到EOMS工单,手工派发给相关处理部门;
2) 短信\\电话通知相关部门。 8. 预处理步骤:
原因1:工作环境温度过高。 检查环境温度是否高于45℃。
若是,降低环境温度至0℃~45℃范围内,查看告警是否消除。 原因2:光模块故障。
更换上报告警的端口的光模块,查看告警是否清除。具体操作请参见更换可插拔光模块。
检查是否存在HARD_BAD或TEMP_OVER等硬件类告警。消除这些告警后,查看TEM_HA告警是否消除。
若告警未清除,更换上报告警的单板 9. 预处理输出:
告警时间、故障网元名称、告警名称、故障初步判断原因、对端网元名称(线缆故障)/板卡名称(设备故障)。
10. 闪断告警处理 :
如果告警频繁出现,则立即派单,并在预处理内容中写明告警闪断。
【指标名称:TEM_LA】
1. 告警名称:TEM_LA
2. 告警解释:TEM_LA告警表示激光器温度过低。 3. 设备类型: PTN 4. 网管告警级别:二级告警
5. 影响业务情况:该告警若长时间不清除,会造成激光器异常,激光器故障后会导致业务中断。
6. 告警产生原因:
原因1:工作环境温度过低。 原因2:光模块故障。 7. 预处理要求:
1) 根据预处理步骤进行预处理,把预处理结果填写到EOMS工单,手工派发给相关处理部门;
2) 短信\\电话通知相关部门。 8. 预处理步骤:
原因1:工作环境温度过低。 检查环境温度是否高于0℃。
若是,降低环境温度至0℃~45℃范围内,查看告警是否消除。 原因2:光模块故障。
更换上报告警的端口的光模块,查看告警是否清除。 若告警未清除,更换上报告警的单板 9. 预处理输出:
告警时间、故障网元名称、告警名称、故障初步判断原因、对端网元名称(线缆故障)/板卡名称(设备故障)。
10. 闪断告警处理 :
如果告警频繁出现,则立即派单,并在预处理内容中写明告警闪断。
【指标名称:B1_SD】
1. 告警名称:B1_SD
2. 告警解释:B1_SD告警表示接收的信号中再生段B1信号劣化。
每800ms检测一次误码率,当单板通过检测B1字节发现再生段信号的误码率超过设置的门限(缺省值为1×10–6)时,即上报此告警。
每800ms检测一次误码率,当误码率在10s内每次都低于设置的门限,则告警消失。
3. 设备类型: PTN 4. 网管告警级别:二级告警
5. 影响业务情况:该告警产生时表明所传送业务的质量劣化。 产生该告警后,若在网管已配置AIS下插使能时,系统自动下插AU_AIS。若配置AIS下插未使能,则产生B1_SD告警时,不下插AIS类告警,也不回告RDI类告警。默认情况下AIS下插未使能。配置AIS下插使能路径为网元管理器的功能树中选择“告警 > 服务质量告警 > AIS插入开关设置”。
B1_EXC告警将抑制B1_SD告警的上报。 6. 告警产生原因: 原因1:环境温度过高。 原因2:光功率不正常。
原因3:光纤连接器松动或未插好。 原因4:光纤头表面不清洁。 原因5:单板故障。7. 预处理要求:
1) 根据预处理步骤进行预处理,把预处理结果填写到EOMS工单,手工派发给相关处理部门;
2) 短信\\电话通知相关部门。 8. 预处理步骤: 原因1:环境温度过高。 检查环境温度是否高于45℃。
若是,降低环境温度至0℃~45℃范围内,查看告警是否清除。 原因2:光功率不正常。
在网管上查询上报告警的端口的接收光功率和对端网元的发送光功率是否低于正常范围。
若对端网元的发送光功率低于正常范围,请按以下步骤操作:
更换端口的光模块,查看告警是否清除。具体操作请参见更换可插拔光模块。
检查法兰盘和光衰减器是否连接正确,光衰减器的衰减值是否过大。正确使用法兰盘或光衰减器。
检查对端网元处理板和交叉板是否存在TEMP_OVER告警,检查温度告
警上下限设置和风扇是否存在问题,若无问题,更换上报告警的单板;检查对端网元处理板和交叉板是否存在HARD_BAD硬件类告警,若存在,更换上报告警的单板。
若本端网元的接收光功率低于正常范围,请按以下步骤操作:
检查光纤连接器是否插紧。若未插紧,重新插好后,查看告警是否清除。 确认光衰减器的衰减值是否合适,若不合适,将光衰减器调整至合适值,查看告警是否清除。
清洁光纤头表面和单板的接收光口,查看告警是否清除。具体操作请参见检查及清洁光纤连接器。
原因3:光纤连接器松动或未插好。 检查光纤连接器是否插紧。
若未插紧,重新插好后,查看告警是否清除。 原因4:光纤头表面不清洁。
清洁光纤头表面和处理板接收光口。具体操作请参见检查及清洁光纤连接器。
原因5:单板故障。
检查本端网元上报告警的单板和交叉板是否存在HARD_BAD或TEMP_OVER等硬件类告警。
若存在,检查温度告警上下限设置和风扇是否存在问题,若无问题,更换存在硬件类告警的单板。具体操作请参见部件更换。
9. 预处理输出:
告警时间、故障网元名称、告警名称、故障初步判断原因、对端网元名称(线缆故障)/板卡名称(设备故障)。
10. 闪断告警处理 :
如果告警频繁出现,则立即派单,并在预处理内容中写明告警闪断。
【指标名称:B2_SD】
1. 告警名称:B2_SD
2. 告警解释:B2_SD表示告警线路接收的信号中复用段B2信号劣化。
每800ms检测一次误码率,当线路板通过检测B2字节发现复用段信号
的误码率在3s内每次超过设置的门限(缺省值为1×10–6)时,即上报此告警。
每800ms检测一次误码率,当误码率在另一个10s内每次都低于设置的门限,则告警消失。
3. 设备类型: PTN 4. 网管告警级别:二级告警
5. 影响业务情况:该告警产生时表明所传送业务的质量劣化。 产生B2_SD告警时,所传送的业务质量劣化。
产生该告警后,若在网管已配置AIS下插使能时,系统自动下插AU_AIS。若配置AIS下插未使能,则产生B2_SD告警时,不下插AIS类告警,也不回告RDI类告警。默认情况下AIS下插未使能。配置AIS下插使能路径为网元管理器的功能树中选择“告警 > 服务质量告警 > AIS插入开关设置”。
B2_EXC告警将抑制B2_SD告警的上报。 6. 告警产生原因: 原因1:环境温度过高。 原因2:光功率不正常。
原因3:光纤连接器松动或未插好。 原因4:光纤头表面不清洁。 原因5:单板故障。 7. 预处理要求:
1) 根据预处理步骤进行预处理,把预处理结果填写到EOMS工单,手工派发给相关处理部门;
2) 短信\\电话通知相关部门。 8. 预处理步骤: 原因1:环境温度过高。 检查环境温度是否高于45℃。
若是,降低环境温度至0℃~45℃范围内,查看告警是否清除。 原因2:光功率不正常。
在网管上查询上报告警的端口的接收光功率和对端网元的发送光功率是否低于正常范围。
若对端网元的发送光功率低于正常范围,请按以下步骤操作:
更换端口的光模块,查看告警是否清除。具体操作请参见更换可插拔光
模块。
检查法兰盘和光衰减器是否连接正确,光衰减器的衰减值是否过大。正确使用法兰盘或光衰减器。
检查对端网元处理板和交叉板是否存在TEMP_OVER告警,检查温度告警上下限设置和风扇是否存在问题,若无问题,更换上报告警的单板;检查对端网元处理板和交叉板是否存在HARD_BAD硬件类告警,若存在,更换上报告警的单板。
若本端网元的接收光功率低于正常范围,请按以下步骤操作:
检查光纤连接器是否插紧。若未插紧,重新插好后,查看告警是否清除。 确认光衰减器的衰减值是否合适,若不合适,将光衰减器调整至合适值,查看告警是否清除。
清洁光纤头表面和单板的接收光口,查看告警是否清除。具体操作请参见检查及清洁光纤连接器。
原因3:光纤连接器松动或未插好。 检查光纤连接器是否插紧。
若未插紧,重新插好后,查看告警是否清除。 原因4:光纤头表面不清洁。
清洁光纤头表面和处理板接收光口。具体操作请参见检查及清洁光纤连接器。
原因5:单板故障。
检查本端网元上报告警的单板和交叉板是否存在HARD_BAD或TEMP_OVER等硬件类告警。
若存在,检查温度告警上下限设置和风扇是否存在问题,若无问题,更换存在硬件类告警的单板。具体操作请参见部件更换。
9. 预处理输出:
告警时间、故障网元名称、告警名称、故障初步判断原因、对端网元名称(线缆故障)/板卡名称(设备故障)。
10. 闪断告警处理 :
如果告警频繁出现,则立即派单,并在预处理内容中写明告警闪断。
【指标名称:SYN_BAD】
1. 告警名称:SYN_BAD
2. 告警解释:SYN_BAD为同步时钟源信号劣化告警。当设备所跟踪的同步时钟源质量变坏时,即产生该告警。
3. 设备类型: PTN 4. 网管告警级别:二级告警
5. 影响业务情况:时钟源信号劣化时,跟踪该时钟源有可能会造成业务有误码。
6. 告警产生原因:
原因1:所跟踪的时钟源质量变坏。 原因2:上报告警的时钟板硬件故障。 7. 预处理要求:
1) 根据预处理步骤进行预处理,把预处理结果填写到EOMS工单,手工派发给相关处理部门;
2) 短信\\电话通知相关部门。 8. 预处理步骤:
1)在网管上查看是否存在B1_EXC、B2_EXC或B3_EXC等表示误码增多的告警,如存在,优先清除这些告警后,查看本告警是否清除。
2)如果所跟踪的时钟源为外部时钟源,请检查时钟信号是否正常,若不正常,请更换所跟踪的外部时钟源。
3)检查时钟的配置是否正确,如输入输出模式是否匹配,修改错误的配置后,查看告警是否消除。
4)如果所跟踪的是线路时钟源或者是支路时钟源,查看直连的网元是否支持物理层时钟同步,若不支持,更换上游网元或者链路;若支持,排查上游网元是否存在时钟相关的告警,若存在,则消除告警。
5)若告警仍未消除,则可能时钟板硬件故障,请更换时钟板。 9. 预处理输出:
告警时间、故障网元名称、告警名称、故障初步判断原因、对端网元名称(线缆故障)/板卡名称(设备故障)。
10. 闪断告警处理 :
如果告警频繁出现,则立即派单,并在预处理内容中写明告警闪断。
【指标名称:BIP_SD】
1. 告警名称:BIP_SD
2. 告警解释:BIP_SD告警表示BIP信号劣化(BIP signal degraded)。
每800ms检测一次误码率,一次检测一块VC12单板,当检测到V5字节中的BIP2误码率在3s内每次都超过设置的门限(缺省值为1×10–6)时,即上报此告警。
每800ms检测一次误码率,一次检测一块VC12单板,当误码率在另一个10s内每次都低于设置的门限,则告警消失。
3. 设备类型: PTN 4. 网管告警级别:三级告警
5. 影响业务情况:该告警产生时,VC12通道级别业务质量劣化。 BIP_EXC等告警将抑制BIP_SD告警的上报。 6. 告警产生原因:
原因1:对端网元存在B1_EXC、B2_EXC或B3_EXC等高级别告警,衍生出低级别告警。
原因2:单板故障导致BIP2误码量过大。 7. 预处理要求:
1) 根据预处理步骤进行预处理,把预处理结果填写到EOMS工单,手工派发给相关处理部门;
2) 短信\\电话通知相关部门。 8. 预处理步骤:
原因1:对端网元存在B1_EXC、B2_EXC或B3_EXC等高级别告警,衍生出低级别告警。
在网管上查看对端网元是否有高级别的B1_EXC、B2_EXC和B3_EXC告警。
若存在,优先清除这些高级别告警后,查看BIP_SD告警是否清除。 原因2:单板故障导致BIP2误码量过大。 硬复位上报告警的单板。
若告警未消除,更换上报告警的单板。 9. 预处理输出:
告警时间、故障网元名称、告警名称、故障初步判断原因、对端网元名称(线缆故障)/板卡名称(设备故障)。
10. 闪断告警处理 :
如果告警频繁出现,则立即派单,并在预处理内容中写明告警闪断。
【指标名称:FLOW_OVER】
1. 告警名称:FLOW_OVER
2. 告警解释:FLOW_OVER为端口接收流量超限告警。该告警表示以太网端口接收流量超出预期流量。当PORT_RX_BW_UTILIZATION性能越限时,会上报FLOW_OVER告警。
3. 设备类型: PTN 4. 网管告警级别:三级告警
5. 影响业务情况:在数据传输时,如果配置的带宽低于实际端口流量,出现此告警可能出现丢包现象。
如果所配置的带宽高于实际端口流量,出现此告警对系统和业务均无影响。
6. 告警产生原因:
原因1:接收带宽利用率大于带宽利用率门限。 原因2:业务形成环路,产生广播风暴。 7. 预处理要求:
1) 根据预处理步骤进行预处理,把预处理结果填写到EOMS工单,手工派发给相关处理部门;
2) 短信\\电话通知相关部门。 8. 预处理步骤:
原因1:接收带宽利用率大于带宽利用率门限。
在网管上查看告警信息,确定产生FLOW_OVER告警的单板。 查看接收带宽利用率是否超过了带宽利用率门限。若超过,则修改带宽利用率门限使之大于接收带宽利用率,查看告警是否消除。
若带宽利用率门限已为最大值,端口已没有空余流量,减少对端网元发送的数据流量来避免业务丢包现象,查看告警是否清除。
原因2:业务形成环路,产生广播风暴。 断开物理环路。
在网管上,使能各以太网端口的“环路检测”和“环路端口关断”功能。 重新恢复物理环路的连接。 9. 预处理输出:
告警时间、故障网元名称、告警名称、故障初步判断原因、对端网元名称(线缆故障)/板卡名称(设备故障)。
10. 闪断告警处理 :
如果告警频繁出现,则立即派单,并在预处理内容中写明告警闪断。
【指标名称:CES_LOSPKT_EXC】
1. 告警名称:CES_LOSPKT_EXC
2. 告警解释:CES_LOSPKT_EXC为单位时间内CES业务的报文丢包数超过阈值告警。
CES_LOSPKT_EXC告警的产生与CES_LOSPKTS性能事件相关。告警的阈值就是性能事件的门限。
当单板检测到一定周期内(2.5s),平均每秒报文丢包数超出上限阈值(缺省为5)时,产生CES_LOSPKTS性能事件,然后上报CES_LOSPKT_EXC告警。
如果在另外一个周期内(10s),平均每秒报文丢包数低于下限阈值(缺省为0),CES_LOSPKTS性能事件消除,该CES_LOSPKT_EXC告警自动清除。 3. 设备类型: PTN 4. 网管告警级别:二级告警
5. 影响业务情况:当丢包率超过门限时会下插全1使得业务中断。 CES_LOSPKT_EXC告警将抑制CES_JTROVR_EXC、CES_JTRUDR_EXC、CES_MALPKT_EXC、CES_MISORDERPKT_EXC和CES_STRAYPKT_EXC告警的上报。6. 告警产生原因:
原因1:时钟未同步。
原因2:CES业务两端网元参数配置不一致。 原因3:Tunnel或PW带宽配置过低,链路拥塞。
原因4:电缆、光纤或光模块故障导致链路信号变差或中断。 7. 预处理要求:
1) 根据预处理步骤进行预处理,把预处理结果填写到EOMS工单,手工派发给相关处理部门;
2) 短信\\电话通知相关部门。 8. 预处理步骤:
原因1:时钟未同步。
在网管上查询是否存在LTI告警或其它时钟相关告警,导致时钟没有同
步,缓冲区入与出速率不一致。
若存在,优先清除LTI告警和时钟相关告警后,查看本告警是否清除。 原因2:CES业务两端网元参数配置不一致。
在网管上查看CES业务两端网元参数配置是否一致,例如“64K时隙”等。
若不一致,修改配置参数,使两端一致。
原因3:Tunnel或PW带宽配置过低,链路拥塞。 在网管上查看业务所在Tunnel或PW的带宽配置是否过低。
如果是,重新为该Tunnel或PW配置较大的带宽,查看告警是否清除。 原因4:电缆、光纤或光模块故障导致链路信号变差。 检查并确认电缆或光纤与接口良好连接。 可选:清洁光纤或光模块后,查看告警是否清除。 若告警未清除,更换相应的电缆、光纤或光模块 9. 预处理输出:
告警时间、故障网元名称、告警名称、故障初步判断原因、对端网元名称(线缆故障)/板卡名称(设备故障)。
10. 闪断告警处理 :
如果告警频繁出现,则立即派单,并在预处理内容中写明告警闪断。
【指标名称:CES_STRAYPKT_EXC】
1. 告警名称:CES_STRAYPKT_EXC
2. 告警解释:CES_STRAYPKT_EXC为单位时间内CES报文的错连包数超过阈值告警。
CES_STRAYPKT_EXC告警的产生与CES_STRAYPKTS性能事件相关。告警的阈值就是性能事件的门限。
当单板检测到一定周期内(2.5s),平均每秒错连包数超出上限阈值(缺省为5)时,产生CES_STRAYPKTS性能事件,然后上报CES_STRAYPKT_EXC告警。
如果在另外一个周期内(10s),平均每秒错连包数低于下限阈值(缺省为0),CES_STRAYPKTS性能事件消除,该CES_STRAYPKT_EXC告警自动清除。 3. 设备类型: PTN
4. 网管告警级别:二级告警
5. 影响业务情况:错连包检测到时将被丢弃,使丢包率过大。 CES_LOSPKT_EXC告警将抑制CES_STRAYPKT_EXC告警的上报。 CES_STRAYPKT_EXC6. 告警产生原因:
原因1:CES业务两端网元参数配置不一致。 原因2:光纤或电缆连接错误。 7. 预处理要求:
1) 根据预处理步骤进行预处理,把预处理结果填写到EOMS工单,手工派发给相关处理部门;
2) 短信\\电话通知相关部门。 8. 预处理步骤:
原因1:CES业务两端网元参数配置不一致。
在网管上查看CES业务两端网元参数配置是否一致,例如“RTP头”。 若不一致,修改配置参数,使两端一致。 原因2:光纤或电缆连接错误。 查看光纤或电缆是否存在连接错误。
若存在,恢复正确的连接后,查看告警是否清除。 9. 预处理输出:
告警时间、故障网元名称、告警名称、故障初步判断原因、对端网元名称(线缆故障)/板卡名称(设备故障)。
10. 闪断告警处理 :
如果告警频繁出现,则立即派单,并在预处理内容中写明告警闪断。
告
警
将
抑
制
CES_MALPKT_EXC
和
CES_MISORDERPKT_EXC告警的上报。
【指标名称:MPLS_TUNNEL_SD】
1. 告警名称:MPLS_TUNNEL_SD
2. 告警解释:MPLS_TUNNEL_SD为Tunnel信号劣化告警。该告警表示在连通性检测的周期内,Tunnel OAM连通性报文的丢包率不小于SD门限。
例如当SD门限设为10时,每1s检测一次丢包率,如果丢失的Tunnel OAM连通性报文数的百分比连续3次大于等于10%,就会上报
MPLS_TUNNEL_SD告警。如果丢失的Tunnel OAM连通性检测报文数的百分比连续10次小于10%,MPLS_TUNNEL_SD告警消失。
3. 设备类型: PTN 4. 网管告警级别:二级告警
5. 影响业务情况:该告警出现时,业务质量劣化,出现丢包,但程度较轻。6. 告警产生原因: 原因1:业务误码过量。 原因2:Tunnel带宽占用已满。 原因3:其它承载层故障。 7. 预处理要求:
1) 根据预处理步骤进行预处理,把预处理结果填写到EOMS工单,手工派发给相关处理部门;
2) 短信\\电话通知相关部门。 8. 预处理步骤:
原因1:业务误码过量。
在网管上检查是否存在MAC_FCS_EXC告警。具体操作请参见查询网元当前告警。若存在,优先清除MAC_FCS_EXC告警后,查看本告警是否清除。
查看端口纤缆是否松脱。如果松脱,重新安装纤缆。 原因2:Tunnel带宽占用已满。
在网管上查看Tunnel的带宽占用是否已满。
若已满,对Tunnel进行扩容或消除非法发送大量数据的根源,查看告警是否清除。
原因3:其它承载层故障。
在网管上查看其它承载层是否存在故障。
若存在,消除配置不一致或协议运行不正常的问题后,查看本告警是否清除。
9. 预处理输出:
告警时间、故障网元名称、告警名称、故障初步判断原因、对端网元名称(线缆故障)/板卡名称(设备故障)。
10. 闪断告警处理 :
如果告警频繁出现,则立即派单,并在预处理内容中写明告警闪断。
【指标名称:PW_DROPPKT_EXC】
1. 告警名称:PW_DROPPKT_EXC
2. 告警解释:PW_DROPPKT_EXC为PW丢包越限告警。 3. 设备类型: PTN 4. 网管告警级别:二级告警
5. 影响业务情况:该告警产生时,业务丢包程度较轻,对业务实时性有一定影响。
6. 告警产生原因: PW上存在少量丢包。 7. 预处理要求:
1) 根据预处理步骤进行预处理,把预处理结果填写到EOMS工单,手工派发给相关处理部门;
2) 短信\\电话通知相关部门。 8. 预处理步骤:
原因:PW上存在少量丢包。
在网管上查看PW的带宽配置是否过低。若是,重新为该PW配置较大的带宽,查看告警是否清除。 9. 预处理输出:
告警时间、故障网元名称、告警名称、故障初步判断原因、对端网元名称(线缆故障)/板卡名称(设备故障)。 10. 闪断告警处理 :
如果告警频繁出现,则立即派单,并在预处理内容中写明告警闪断。
【指标名称:PW_EXC_TRAFFIC】
1. 告警名称:PW_EXC_TRAFFIC
2. 告警解释:PW_EXC_TRAFFIC为PW上的业务流量越限告警。 3. 设备类型: PTN 4. 网管告警级别:三级告警
5. 影响业务情况:该告警产生时,PW上的业务流量偏高,导致拥塞。 6. 告警产生原因:
告警PW_EXC_TRAFFIC产生的原因如下:
L2VPN业务的PW的入方向的带宽利用率大于带宽利用率门限。 7. 预处理要求:
1) 根据预处理步骤进行预处理,把预处理结果填写到EOMS工单,手工派发给相关处理部门;
2) 短信\\电话通知相关部门。 8. 预处理步骤:
在网管上查看告警信息,确定产生PW_EXC_TRAFFIC告警的单板。 查看接收带宽利用率是否超过了带宽利用率门限。若超过,则修改带宽利用率门限使之大于接收带宽利用率,查看告警是否消除。
若带宽利用率门限已为最大值,PW上已没有空余流量,则进行扩容增大带宽,或减少对端网元发送的数据流量来避免业务丢包现象,查看告警是否清除。
9. 预处理输出:
告警时间、故障网元名称、告警名称、故障初步判断原因、对端网元名称(线缆故障)/板卡名称(设备故障)。 10. 闪断告警处理 :
如果告警频繁出现,则立即派单,并在预处理内容中写明告警闪断。
【指标名称:MPLS_PW_SD】
1. 告警名称:MPLS_PW_SD
2. 告警解释:MPLS_PW_SD为PW信号劣化告警。该告警表示在连通性检测的周期内,PW OAM连通性报文的丢包率不小于SD门限。 3. 设备类型: PTN 4. 网管告警级别:二级告警
5. 影响业务情况:该告警出现时,业务质量劣化,出现丢包,但程度较轻。
6. 告警产生原因:
原因1:物理端口存在误码或丢包。 原因2:光纤或光模块表面不清洁。 原因3:PW带宽占用已满。 7. 预处理要求:
1) 根据预处理步骤进行预处理,把预处理结果填写到EOMS工单,手工派发给相关处理部门;
2) 短信\\电话通知相关部门。
8. 预处理步骤:
原因1:物理端口存在误码或丢包。
在网管上检查是否存在MAC_FCS_EXC告警。若存在,优先清除MAC_FCS_EXC告警后,查看本告警是否清除。
查看端口纤缆是否松脱。如果松脱,重新安装纤缆。 原因2:光纤或光模块表面不清洁。 清洁光纤和光模块。
原因3:PW带宽占用已满。
在网管上查看PW的带宽占用是否已满。
若已满,对PW进行扩容或消除非法发送大量数据的根源,查看告警是否清除。
9. 预处理输出:
告警时间、故障网元名称、告警名称、故障初步判断原因、对端网元名称(线缆故障)/板卡名称(设备故障)。 10. 闪断告警处理 :
如果告警频繁出现,则立即派单,并在预处理内容中写明告警闪断。
【指标名称:POS_TX_FLOW_OVER】
1. 告警名称:POS_TX_FLOW_OVER
2. 告警解释:POS_TX_FLOW_OVER为POS端口发送流量超限告警。 3. 设备类型: PTN 4. 网管告警级别:三级告警
5. 影响业务情况: 在数据传输时,如果配置的带宽低于实际端口流量,当POS_TX_FLOW_OVER告警存在时,会出现丢包现象。
在数据传输时,如果所配置的带宽高于或等于实际端口流量,有POS_TX_FLOW_OVER告警存在时,对系统和业务均无影响。
6. 告警产生原因:
发送带宽利用率大于带宽利用率门限。
7. 预处理要求:
1) 根据预处理步骤进行预处理,把预处理结果填写到EOMS工单,手工派发给相关处理部门;
2) 短信\\电话通知相关部门。 8. 预处理步骤:
1)在网管上查看告警信息,确定产生POS_TX_FLOW_OVER告警的单板。
2)查看发送带宽利用率是否超过了带宽利用率门限。若超过,则修改带宽利用率门限使之大于发送带宽利用率,查看告警是否消除。
3)若带宽利用率门限已为最大值,端口已没有空余流量,减少对端网元发送的数据流量来避免业务丢包现象,查看告警是否清除。
9. 预处理输出:
告警时间、故障网元名称、告警名称、故障初步判断原因、对端网元名称(线缆故障)/板卡名称(设备故障)。 10. 闪断告警处理 :
如果告警频繁出现,则立即派单,并在预处理内容中写明告警闪断。
【指标名称:BWUTILIZATION_OVER】
1. 告警名称:BWUTILIZATION_OVER
2. 告警解释:BWUTILIZATION_OVER表示带宽利用率越限告警。该告警表示某对象因流量过大导致相应利用率超过预期,流量包括:流分类、VUNI、VUNI Group等 3. 设备类型: PTN 4. 网管告警级别:四级告警
5. 影响业务情况:上报该告警时,业务流量偏高,可能会导致网络导致拥塞。
6. 告警产生原因:
网络内的流量过大。
7. 预处理要求:
1) 根据预处理步骤进行预处理,把预处理结果填写到EOMS工单,手工派发给相关处理部门;
2) 短信\\电话通知相关部门。 8. 预处理步骤:
1)查看带宽限制的配置是否过低,如果是,则需要增加设备的配置容量或者进行网络扩容。
2)查看网络内是否存在网络风暴导致流量过大,如果是,则需要排查并消除网络风暴的根源。
9. 预处理输出:
告警时间、故障网元名称、告警名称、故障初步判断原因、对端网元名称(线缆故障)/板卡名称(设备故障)。 10. 闪断告警处理 :
如果告警频繁出现,则立即派单,并在预处理内容中写明告警闪断。
【指标名称:ETH_R_FLOW_OVER_SRS】
1. 告警名称:ETH_R_FLOW_OVER_SRS
2. 告警解释:ETH_R_FLOW_OVER_SRS表示以太网端口接收流量严重超出预期流量。
3. 设备类型: PTN 4. 网管告警级别:二级告警
5. 影响业务情况:在数据传输时,如果配置的带宽低于实际端口流量,ETH_R_FLOW_OVER_SRS告警存在时,会出现丢包现象。
在数据传输时,如果所配置的带宽高于或等于实际端口流量,ETH_R_FLOW_OVER_SRS告警存在时,对系统和业务均无影响。
6. 告警产生原因:
原因1:接收带宽利用率大于带宽利用率严重性门限。 原因2:业务形成环路,产生广播风暴。
7. 预处理要求:
1) 根据预处理步骤进行预处理,把预处理结果填写到EOMS工单,手工派发给相关处理部门;
2) 短信\\电话通知相关部门。
8. 预处理步骤:
原因1:接收带宽利用率大于带宽利用率严重性门限。
在网管上查看告警信息,确定产生ETH_R_FLOW_OVER_SRS告警的单板。 查看接收带宽利用率是否超过了带宽利用率严重性门限。若超过,则修改带宽利用率严重性门限使之大于接收带宽利用率,查看告警是否消除。
若带宽利用率严重性门限已为最大值,端口已没有空余流量,减少对端网元发送的数据流量来避免业务丢包现象,查看告警是否清除。
原因2:业务形成环路,产生广播风暴。 断开物理环路。
在网管上,使能各以太网端口的“环路检测”和“环路端口关断”功能。 可选:对以太网专网业务,在各网元配置水平分割组,并使能各UNI端口的广播报文抑制功能。重新恢复物理环路的连接。
9. 预处理输出:
告警时间、故障网元名称、告警名称、故障初步判断原因、对端网元名称(线缆故障)/板卡名称(设备故障)。 10. 闪断告警处理 :
如果告警频繁出现,则立即派单,并在预处理内容中写明告警闪断。
【指标名称:ETH_T_FLOW_OVER_SRS】
1. 告警名称:ETH_T_FLOW_OVER_SRS
2. 告警解释:ETH_T_FLOW_OVER_SRS表示以太网端口发送流量严重超出预期流量。
3. 设备类型: PTN 4. 网管告警级别:二级告警
5. 影响业务情况:在数据传输时,如果配置的带宽低于实际端口流量,ETH_T_FLOW_OVER_SRS告警存在时,会出现丢包现象。
在数据传输时,如果所配置的带宽高于或等于实际端口流量,ETH_T_FLOW_OVER_SRS告警存在时,对系统和业务均无影响。
6. 告警产生原因:
原因1:发送带宽利用率大于带宽利用率严重性门限。 原因2:业务形成环路,产生广播风暴。
7. 预处理要求:
1) 根据预处理步骤进行预处理,把预处理结果填写到EOMS工单,手工派发给相关处理部门;
2) 短信\\电话通知相关部门。 8. 预处理步骤:
原因1:发送带宽利用率大于带宽利用率严重性门限。
在网管上查看告警信息,确定产生ETH_T_FLOW_OVER_SRS告警的单板。 查看发送带宽利用率是否超过了带宽利用率严重性门限。若超过,则修改带宽利用率严重性门限使之大于发送带宽利用率,查看告警是否消除。
若带宽利用率严重性门限已为最大值,端口已没有空余流量,减少对端网元发送的数据流量来避免业务丢包现象,查看告警是否清除。
原因2:业务形成环路,产生广播风暴。 断开物理环路。
在网管上,使能各以太网端口的“环路检测”和“环路端口关断”功能。 可选:对以太网专网业务,在各网元配置水平分割组,并使能各UNI端口的广播报文抑制功能。重新恢复物理环路的连接。
9. 预处理输出:
告警时间、故障网元名称、告警名称、故障初步判断原因、对端网元名称(线缆故障)/板卡名称(设备故障)。 10. 闪断告警处理 :
如果告警频繁出现,则立即派单,并在预处理内容中写明告警闪断。
【指标名称:TNL_EXC_TRAFFIC】
1. 告警名称:TNL_EXC_TRAFFIC
2. 告警解释:TNL_EXC_TRAFFIC是Tunnel流量越限告警。当带宽利用率超过上限时,上报该告警,表示Tunnel流量超过阈值。 3. 设备类型: PTN 4. 网管告警级别:二级告警
5. 影响业务情况:该告警产生时,当前流量超过设定带宽,可能导致网络
拥塞。
6. 告警产生原因:
Tunnel流量超过带宽设置上限。
7. 预处理要求:
1) 根据预处理步骤进行预处理,把预处理结果填写到EOMS工单,手工派发给相关处理部门;
2) 短信\\电话通知相关部门。 8. 预处理步骤:
检查上报告警的Tunnel流量占用情况,如果流量已经超过上限,请进行扩容或者消除非法发送大数据量的根源。
9. 预处理输出:
告警时间、故障网元名称、告警名称、故障初步判断原因、对端网元名称(线缆故障)/板卡名称(设备故障)。 10. 闪断告警处理 :
如果告警频繁出现,则立即派单,并在预处理内容中写明告警闪断。
【指标名称:SERVICE_OUTAGE】
1. 告警名称:SERVICE_OUTAGE
2. 告警解释:业务级告警是指当有严重到影响业务通断的告警定位到路径后,路径自动判断业务的通断情况,如果业务已断,则需要自动产生业务级告警提醒网络维护人员关注。该告警是网管上的告警,显示在重要告警中,支持告警同步、确认,不支持删除。该告警是网管服务告警,不是设备类告警,是设备相关告警。 3. 设备类型: PTN 4. 网管告警级别:二级告警
5. 影响业务情况:该告警产生时表明所传送业务的已经中断,需要立即处理。
6. 告警产生原因:
1)设备上产生了级别为“紧急”或者“重要”的告警,并且这些告警被定位到了网管的路径上。
2)网管上的路径对主机下发业务通断查询,如果主机认为业务已经中断,则网管产生业务级告警。
3)对于其他级别的路径,所有主机判断为严重到影响业务通断的告警都会触发业务级告警
7. 预处理要求:
1) 根据预处理步骤进行预处理,把预处理结果填写到EOMS工单,手工派发给相关处理部门;
2) 短信\\电话通知相关部门。 8. 预处理步骤:
1)右键点击业务级告警,对于PTN设备在弹出菜单中选择“告警影响的路径 > PWE3业务”。
2)告警定位到路径后,在路径管理界面中选中受影响的路径,右键单击,选择“告警 > 当前告警”,查看其所有当前告警。
3)根据路径相关的其他告警,进一步采取相应的处理措施。例如:处理R_LOS等告警。
9. 预处理输出:
告警时间、故障网元名称、告警名称、故障初步判断原因、对端网元名称(线缆故障)/板卡名称(设备故障)。 10. 闪断告警处理 :
如果告警频繁出现,则立即派单,并在预处理内容中写明告警闪断。
【指标名称:CPU_BUSY】
1. 告警名称:CPU_BUSY
2. 告警解释:CPU_BUSY为CPU占用率过高告警。当主控板检测到CPU占用率超过上门限时,即上报此告警。 3. 设备类型: PTN 4. 网管告警级别:二级告警
5. 影响业务情况:当CPU占用率达到100%时,一些报文将可能因为得不到及时处理而被丢弃,导致网元脱管、业务中断。
若CPU_BUSY告警持续半小时以上,主控板将自动软复位。
6. 告警产生原因:
原因1:网元配置了大量的业务,并启动大量的告警监控和性能统计任务,导致CPU负荷过大。
原因2:网络中出现DCN风暴。
7. 预处理要求:
1) 根据预处理步骤进行预处理,把预处理结果填写到EOMS工单,手工派发给相关处理部门;
2) 短信\\电话通知相关部门。 8. 预处理步骤:
原因1:网元配置了大量的业务,并启动大量的告警监控和性能统计任务,导致CPU负荷过大。
关闭部分告警监控和性能统计任务,或将性能统计的周期从15分钟延长到24小时,以降低CPU的负荷。查看告警是否清除。
原因2:网络中出现DCN风暴。
检查主备主控板的ETH口电缆连接情况,确保只有一个ETH端口直接或者间接连接到网管。
若ETH端口与网管之间穿越了第三方设备组成的网络,需要确认第三方设备中未出现环回。
9. 预处理输出:
告警时间、故障网元名称、告警名称、故障初步判断原因、对端网元名称(线缆故障)/板卡名称(设备故障)。 10. 闪断告警处理 :
如果告警频繁出现,则立即派单,并在预处理内容中写明告警闪断。
【指标名称:MEM_OVER】
1. 告警名称:MEM_OVER
2. 告警解释:MEM_OVER为内存使用率过高告警。当单板检测到内存使用率超过上门限时,即上报此告警。 3. 设备类型: PTN 4. 网管告警级别:二级告警
5. 影响业务情况:该告警产生时,动态协议和动态业务可能会中断,单板可能会自动软复位。
6. 告警产生原因:
单板配置了大量业务,并同时启动大量的告警监控和性能统计任务,导致内存使用率过高。
7. 预处理要求:
1) 根据预处理步骤进行预处理,把预处理结果填写到EOMS工单,手工派发给相关处理部门;
2) 短信\\电话通知相关部门。 8. 预处理步骤:
1)关闭部分告警监控和性能统计任务,或将性能统计的周期从15分钟延长到24小时,以降低内存使用率。查看告警是否清除。
2)若告警未清除,查看网元上是否存在冗余的业务。若存在,删除冗余的业务后,查看告警是否清除。
3)若告警仍未清除,重新规划业务,修改网元规划表,将业务分散到其它单板或网元上。
9. 预处理输出:
告警时间、故障网元名称、告警名称、故障初步判断原因、对端网元名称(线缆故障)/板卡名称(设备故障)。 10. 闪断告警处理 :
如果告警频繁出现,则立即派单,并在预处理内容中写明告警闪断。
因篇幅问题不能全部显示,请点此查看更多更全内容