Advertisement
Advertisement

新足迹

 找回密码
 注册
新足迹 门户 IT专业论坛 查看内容

不懂就问,Optus这次故障的判断、检测、诊断、排除和预防的思路和方法如何?

2023-11-9 12:19| 发布者: scoopy | 查看: 3479| 原文链接

我对这种超大规模且去中心化的网络没具体概念,想请教各位大神,如果发生这类没遇到过且影响和后果巨大的故障,如何能争取尽可能地迅速、正确判断故障方向、检测、诊断、排除故障?

我管的网络规模很小,且都有中心点,最坏的情况就是从最上面的路由器开始,拔出所有网线,一步一步地向下排查故障的所在,查到故障节点所在后,断开故障节点,恢复其他节点的网络和服务。然后继续在故障节点下面继续寻找直到找到故障所在的设备或设置,然后就是查日志,恢复备份、更换设备什么的排除故障,确认故障设备正常后,再连入网络恢复服务。最后就是查找出现故障的原因和预防的故障的方法,该升级就升级,该更新就更新,该淘汰就淘汰,避免同样的故障的再次发生。


像Optus这种又成千上万的路由器且没有中心的超大规模的网络垮掉的故障,请问各位大神们,大致的故障的判断、检测、诊断、排除和预防的思路和方法如何?

不需要也不可能让各位写论文,只要是相关思路和方法,哪怕只言片语或案例或链接什么的都可以,我自己学习。

谢谢指教,回帖必加分。
Advertisement
Advertisement


Advertisement
Advertisement
返回顶部