2号线多站点DTS通信中断故障抢修预案
2016年1月26日2号线东延伸DTS通信中断故障,凌空路站61网段交换机宕机,造成凌空路、远东大道和浦东国际机场三站的61网段的交换机、NVLE和终端服务器(既有线无终端服务器)通信中断,经过重启凌空路61网段交换机后,设备恢复正常。
针对1月26日的故障现象,现制定2号线多站点DTS通信中断故障抢修预案,详细预案如下:
2号线东延伸60网段交换机逻辑连接示意图如下(ZJS为master交换机,4-1端口为逻辑断点):
2号线东延伸61网段交换机逻辑连接示意图如下(PDA为master交换机,4-1端口为逻辑断点):
2号线西环网60网段交换机逻辑连接示意图如下(XJD为master交换机,4-2端口为逻辑断点):
2号线西环网61网段交换机逻辑连接示意图如下(XJD为master交换机,4-2端口为逻辑断点):
u驻勤人员:
1.通知ATS值班人员、轨旁班组抢修人员及班组长、维护部值班领导和专业工程师等。
2.及时将H3C故障告警信息、CSM通信告警日志和信号系统工况情况以图片等形式传至维护一部群,以方便专业工程师和技术骨干分析故障现象。
3.若故障影响范围过大,及时通知就近轨旁值班点人员、站点范围附近技术骨干抢修人员救援,尽量确保每个故障集中站机房有人。
uATS人员:
1.查看H3C系统中的告警信息,若发现面板上多站交换机、NVLE和终端服务器(既有线无终端服务器)不可达,ATS人员根据以上告警信息,初步判断故障范围。如下图:
根据图上告警信息,可初步判断PDA、YDA和LKR的61网段交换机、NVLE和终端服务器均不可达。根据东环网61网段逻辑连接示意图,故障点为故障范围内与非故障站最近的站点,初步判断为LKR 61网交换机故障。
2.查看CSM面板上的通讯告警日志,进一步确定是否为交换机故障。如下图,LKR东西侧通信故障,光纤告警;YDA西侧通信故障,光纤告警;CSS东侧通信故障,光纤告警(注:既有线的光纤告警还有可能为邻站联锁通信的媒体转换器光纤告警)。结合H3C系统告警信息,NVLE和终端服务器均为交换机后的二级连接设备,结合交换机连接示意图判断共用部分LKR 61网段交换机故障。
3.将H3C网络检测系统和CSM通讯告警日志以图片形式上传至维护一部群,并将故障影响范围告知驻勤,方便驻勤通知轨旁抢修人员赶赴故障影响范围内所有集中站机房。
4.ATS人员确定NVLE功能,查看故障站NVLE进程是否正常,并且排列进路,若道岔操到位有表示且进路正常则说明NVLE功能正常。
5.ATS人员用笔记本(必须先人工配置笔记本IP地址,且IP地址不得与网内其它信号设备相同)插入MOXA环网交换机网口连接交换机,打开MOXA PT7828专用软件,点击Boardcast Search按钮,查看界面中的信息,若环内一个或多个交换机并未在显示菜单中,则初步判断交换机逻辑连接示意图中离中央最近站点交换机可能存在故障。
u轨旁人员:
1.轨旁值班人员到机房查看交换机、NVLE和终端服务器(既有线无此设备)通信状态和灯位。
2.抢修人员将故障范围内及邻站每个机房RS530A/B切换器切换到正常网段。
3.值班人员用笔记本(必须先人工配置笔记本IP地址,且IP地址不得与网内其它信号设备相同)插入交换机M1-4插口连接交换机,打开MOXA PT7828专用软件,点击Boardcast Search按钮,查看界面中的信息,若环内一个或多个交换机并未在显示菜单中,则初步判断交换机逻辑连接示意图中离本站最近站点交换机可能存在故障,与维护部值班领导或专业工程师确认后对故障网段交换机进行重启。
4.若无笔记本站点,机房内抢修人员通过NVLE按照2号线DTS交换机逻辑连接示意图使用ping命令排查大致故障点,当离本站最近的逻辑站点交换机无法ping通,基本可以判断该站交换机故障。
5.重启该站交换机:
既有线通过插拔交换机后的220V插座进行重启(两个插座):抢修人员需要穿戴好劳防用品、电工鞋和手套将交换机后两个电源插座均拔掉后,检查交换机前面板是否失电,确定后再重新将插座插好后观察交换机是否有电以确定重启成功,并确认无告警且各连接端口通信正常。
延伸线对交换机电源模块断线进行重启:抢修人员将交换机背面靠右连接线的螺丝松掉(断线前拍照留档,恢复时应确认电源连接线后再次上电),查看交换机前面板是否失电,确定失电后将螺丝紧固,则交换机完成重启,并确认无告警且各连接端口通信正常。作业时同样需要注意劳防用品、电工鞋得穿戴,确保自身安全。
未发生故障时
1.ATS人员在平时加强巡检力度,通过H3C进行查看相关集中站各网段站联终端服务器端口的数据收发情况,以及面板上的告警信息并记录。发现问题及时汇报和处理。
2.轨旁人员在平时巡检时多加强各站交换机和终端服务器设备运行工况,在平时多观察设备与图纸,对与图纸相对应的设备的具体位置做到大致熟悉,这样可以在抢修故障时提高抢修效率。
领取专属 10元无门槛券
私享最新 技术干货