交换机丢包问题定位

华为交换机故障处理案例分析

诊断工具

  • display工具
    二层转发丢包故障
  • 定位思路
  • 定位步骤
    三层单播转发丢包故障
  • 定位思路
  • 定位步骤

诊断工具

display命令行
交换机丢包问题定位

二层转发丢包故障

定位思路
交换机丢包问题定位

第一步:判定丢包设备

1.根据流量转发路径,在流量的入接口和出接口分别配置流量统计。
交换机丢包问题定位
2.查看入接口和出接口的流量统计,以确认是否在本设备产生丢包。如果出接口流量统计值与入接口流量统计值相等,则说明非本设备丢包;如果出接口流量统计值小于入接口流量统计值,则本设备丢包。
交换机丢包问题定位

第二步:检查VLAN与MAC

1.如果确认为本设备丢包,因二层转发只依赖于VLAN+MAC,所以需要进一步确认本设备VLAN、MAC信息。确认流量的出入端口是否在同一个VLAN内,并确认流量的目的MAC地址是否正确学习在出接口(同时需要关注是否存在MAC地址在多个端口产生漂移的情况。
交换机丢包问题定位

第三步:检查端口和链路

1.检查出入端口状态、速率、双工模式是否正确,相互连接的两个设备的端口工作模式必须完全一致,且链路无CRC错误报文计数。
交换机丢包问题定位
2.如果设备使用了诸如STP、RRPP等破环协议,还需要检查接口在环路中所处的状态(阻塞或转发状态)。

第四步:检查出端口是否存在拥塞

查看端口出方向是否存在Discard计数持续增加情况,如果有则说明该接口存在流量突发拥塞情况。
交换机丢包问题定位
若通过上述步骤仍然无法确认问题原因,请联系华为技术支持处理。

三层单播转发丢包故障

定位思路
交换机丢包问题定位

第一步:确认丢包点
确认是否交换机产生丢包,依然采用流量统计的方法,参见“二层转发丢包”流量统计相关部分,此处不再赘述。
第二步:检查路由与ARP
1.检查设备上是否存在到目的地址的正确路由。
交换机丢包问题定位
2.检查路由对应的下一跳是否可达,可以通过简单的ping测试确认。
3.如果ping不通的双方或一方处于交换机直连网段,还需要检查这些设备的ARP是否已经在交换机上正确学习。
交换机丢包问题定位
注:检查路由与ARP时,建议多查询几次,以确认设备是否存在ARP或路由漂移的情况。

  • 第三步:检查端口和链路
  • 第四步:检查出端口是否存在拥塞
    第三步、第四步与“二层转发丢包”相关部分一致,此处不再赘述。

交换机启动常见问题定位

启动信息说明

  • 盒式交换机启动信息说明
  • 框式交换机启动信息说明
    定位思路
  • 盒式交换机无法启动定位思路
  • 框式交换机无法启动定位思路
    典型故障解决
  • 串口无输出
  • 配置恢复前设备复位
  • 配置恢复阶段设备复位
  • 框式交换机电源故障
  • 框式交换机主控板无法上电
    信息收集

盒式交换机启动信息

交换机丢包问题定位

  • 不同形态设备启动信息略有不同,但各阶段的关键打印信息相同。
  • 定位启动故障时,必须首先明确系统在哪一阶段复位,然后再采取相应措施。

框式交换机启动信息

交换机丢包问题定位

盒式交换机无法启动定位思路

交换机丢包问题定位

框式交换机无法启动定位思路

交换机丢包问题定位

配置恢复阶段前复位(盒式)

问题现象:
设备不断重启,每次在配置恢复阶段(未输出“Recover configuration…”)之前就发生复位。

解决方法:

1、在交换机启动时按照提示信息,输入Ctrl-B进入bootrom菜单。
交换机丢包问题定位
2、在bootrom菜单中,将系统大包文件传入设备,并设置为启动文件,重启设备。
3、若仍然无法解决,则需要继续更新bootrom。
4、仍然不能解决请联系华为技术支持处理。

配置恢复阶段前复位(框式)

问题现象:
设备不断重启,每次在配置恢复阶段(未输出“Recover configuration…” )之前就发生复位。

解决方法:
1、在交换机启动时按照提示信息,输入Ctrl-B进入Boot菜单。
交换机丢包问题定位
2、按照boot菜单中重新上传系统大包,并设置为启动文件,然后重启。框式交换机存在CF卡和Flash两个存储设备,建议使用CF卡存储启动大包文件。
3、若仍然无法解决,请联系华为技术支持处理。

配置恢复阶段复位

问题现象:
设备每次启动到配置恢复阶段( 已输出“Recover configuration…” )就发生复位。

解决方法:
1、在交换机启动时按照提示信息,输入Ctrl-B进入bootrom菜单。
2、在PC上新建一个空配置文件(以cfg为后缀名的空文件),并通过在bootrom菜单的选项将该文件上传至设备上。
3、在bootrom菜单中指定以该空配置文件启动,并重新启动设备。
4、如果仍然无法解决,请联系华为技术支持处理。
框式交换机电源模块故障处理
问题现象:
框式交换机电源模块指示灯状态不正常,电源模块失效。

解决方法:
1、结合电源模块指示灯的状态,判断电源模块可能的故障。
2、如果条件允许,建议采用替代测试的方法处理。
3、确认属电源模块故障后,请联系华为技术支持处理。
交换机丢包问题定位

框式—单板无法上电

问题现象:
框式交换机设备整机供电正常,但是单板无法启动,单板上的RUN/ALM指示灯始终为红色。

解决方法:
1、检查单板卡扣是否卡紧,避免单板“虚插” 。
2、拔出故障单板,并检查单板高速连接器及其背板卡槽上是否存在“倒针”现象。
交换机丢包问题定位
3、若仍然无法解决请联系华为技术支持处理。

需要收集的信息

当设备无法启动需要联系华为技术支持处理时,为确保问题可以尽快得到解决,请协助采集如下信息:

盒式交换机:

交换机丢包问题定位
注:电源模块条码仅涉及含电源模块的盒式交换机。

框式交换机:
交换机丢包问题定位
注:

单板高速连接器和背板的拍照部位请参考之前的图片。
串口打印信息请务必采集完整。

参考链接 :

交换机启动常见问题定位 :https://mp.weixin.qq.com/s/s77FGlifKRSWpEGQShBIUw

交换机丢包问题定位 :https://mp.weixin.qq.com/s/lhPn8lwTLdYdoo4cfqMFGg