故障定位的基本思路
在排除比较复杂网络的故障时,常常要从多种角度来测试和分析故障的现象,准确确定故障点,在实际应用中通常采用的分析模型和方法如下。
(1)7层的网络结构分析模型方法。从网络的7层结构的定义和功能上逐一进行分析和排查,这是传统的且最基础的分析和测试方法。这里有自下而上和自上而下两种思路。自下而上是从物理层的链路开始检测直到应用,白上而下是从应用协议中捕捉数据包,分析数据包统计和流量统计信息,以获得有价值的资料。
(2)网络连接结构的分析方法。从网络的连接构成来看,大致可以分成客户端、网络链路、服务器端3个模块。
客户端具备网络的7层结构,也会出现从硬件到软件、从驱动到应用程序、从设置错误到病毒等的故障问题。所以在分析和测试客户端的过程中要有大量的背景知识,有时PC发烧友的经验也会有所帮助,也可以在实际测试过程中询问客户端的用户,分析他们反映的问题是个性的还是共性的,这将有助于自己对客户端的进一步检测作出决定。
来自网络链路的问题通常需要网管、现场测试仪,甚至需要用协议分析仪来帮助确定问题的性质和原因。对于这方面的问题分析需要有坚实的网络知识和实践经验,有时实践经验会决定排除故障的时间。
在分析服务器端的情况时更需要有网络应用方面的丰富知识,要了解服务器的硬件性能及配置情况、系统性能及配置情况、网络应用及对服务器的影响情况。
工具型分析方法。有强大的各种测试工具和软件,它们的自动分析能快速地给出网络的各种参数甚至是故障的分析结果,这对解决常见网络故障非常有效。1
故障定位功能故障定位功能的目的是确定设备中故障的位置。为确定故障根源,常常需要将诊断、测试及性能监测获得的数据结合起来进行分析。故障定位的手段主要有诊断、试运行及软件检查。
1.诊断
故障诊断一般利用专门的诊断程序进行。诊断常常是打扰性的,即在诊断进行期间,被诊断的设备不能运行正常的用户业务。
2.试运行
试运行是将一部分网络设备隔离,利用设备正常的输入输出端口和测试器,系统地测试被隔离网络设备的所有服务特性。
3.软件检查
利用软件进行的检查有核查、校验和运行测试、程序跟踪等。2
定位及排除方法告警性能分析法通过网管获取告警和性能信息进行故障定位。例如,某一供电局使用了BTTA网管,可以对全局的网络设备进行管理,平时多观察各设备CPU负载率和各线路的流量,当有人反映不能连接至网络或网速很慢时,可通过网管观察计算机与交换机的连接情况,是否有时断时通的现象,交换机CPU负载率是否很高,线路流量是否很大,通过观察设备端口状态,分析和观察交换机哪个端口所接的计算机发包量不太正常。
替换法替换法就是使用一个工作正常的物体去替换一个工作不正常的物体,从而达到定位故障、排除故障的目的,这里的物件可以是一段线缆、一个设备和一块模块。
配置数据分析法查询、分析当前设备的配置数据,通过分析以上的配置数据是否正常来定位故障,若配置的数据有错误,需进行重新配置。