IT运维手册之企业网络故障预防与评估
能不能期望我们每一位设备管理软件员都能够解决网络运行中出现的所有问题呢?通过多年设备管理系统的总结我认为,如果预先采取一定的措施,并且使用正确的故障诊断方法,那么回答是肯定的。下面给出了一个较为完整的过程,敬请各位同行批评指正。
及时更新网络图 首先应该绘制一个网络方框图。这个文档的作用是为从事故障诊断的人员提供一个关于网络布局和配置的全部信息的单一来源。网络图上包含的主要内容有: *路由器的连接图; *设备的序号、型号及端口情况; *使用的路由协议(如RIP、OSPF等); *IOS版本(用于具有何种性能查找和判别); *已安装的模块; *访问控制列表; *地址(网络地址和序号,MAC地址更好); *交换机(型号); *集线器(Hub型号); *所有配置的拷贝。 当网络使用发生变化时,要及时更新网络图。如果没有更新网络图,那么您的网络图的用处就要大打折扣,这将是非常危险的。如果出现这种情况,您必须马上绘制一幅新的网络图,而不是依赖那个不能反映实际情况的老的网络图。 当网络以通常方式运行时,必须符合网络性能的基线。基线用来记录网络在低、中和高使用量时的信息量。它建立了一个网络运行性能的记录,该记录可以用来进行比较,以确定是否出现问题。网络运行性能基线中包含以下主要内容: *网络上运行了哪些协议; *每个协议使用的带宽百分比; *每个协议的峰值使用量和平均使用量; *数据包的大小以及每种大小数据包的百分比; *循环冗余校验(Cyclical Redundancy Check,CRC)发现的错误的峰值和平均值; *网段每秒钟传输的信息帧的峰值和平均值; *是否存在超长的数据包; *冲突域每秒产生的冲突的峰值和平均值; *网段运行的峰值和平均值。 故障诊断方法与步骤 正确地确定问题是解决问题的关键。下面我们按照顺序介绍故障诊断方法、步骤。应该注意的是这些步骤往往是相互重叠的,而且解决问题的方法实质上是循环式的。 ⑴确定网络问题的性质; ⑵收集有关的情况并对问题进行分析; ⑶分析问题产生的原因; ⑷设计一个解决问题计划; ⑸实现这个解决问题计划; ⑹评估该解决问题计划产生的结果; ⑺重复上面的操作,直到问题得到解决; ⑻将解决方案记入文档资料。 确定网络问题的性质实际上就是要提出问题。即“谁出了问题,是什么问题,何时产生和出现在何处”这样的形式。这些问题可能会多次出现,您可以向用户、设备管理软件员、以及遇到或者了解问题的其他人详细提问:谁受到了问题的影响?是单个用户还是存在共性的一组用户,甚至是整个网络中的所有用户呢? 若是单个用户可能出现下列若干问题中之一: *物理层问题,包括发生故障的网络电缆。可用Ping来测试; *在特定主机上的硬件故障。用Ping 127.0.0.1或Ping本机地址来检测; *软件加载不正确或者崩溃了,尤其是网络协议出了问题。可重装软件或删除网络协议后重新加载网络协议; *主机地址或者子网掩码设置不正确。可修正主机地址和子网掩码; *默认网关配置不正确。可用Tracert检测,重新修正默认网关。 拥有公共属性或者遇到问题的一组用户可能出现下列若干问题: *网络设备(比如集线器或者交换机)发生了故障; *路由器接口发生故障; *服务器发生故障; *访问列表设置错误; *VLAN配置错误。 在我们知道“谁出了问题”后,就要集中精力解决:这个问题有何表现?是没有连接还是只有部分连接的问题,或者是根本没有连接的问题呢?如果是没有连接的问题,那它就属于: *硬件故障; *远程通信服务故障; *路由协议故障。 如果是部分连接的问题,那它属于; *访问列表问题; *子网掩码不正确; *路由协议不兼容。 这个问题何时发生呢?是间歇性出现还是经常发生的问题,或者是刚刚发生的问题呢? 如是间歇性发生的问题,其原因可能是: *远程通信服务故障; *信息拥挤; *路由循环。 如是经常发生的问题,那么原因是信息拥挤。出现新问题的原因是: *访问列表发生变化; *新的硬件故障; *路由协议发生变化; *新增加的路由。 正确确定网络问题的性质,是我们判断是广域线路问题还是局域网中的问题的基础。【推荐阅读】
◆设备管理软件软件专区
◆巧用泛普BTNM智能分析设备管理软件软件解决网络故障
◆奇怪的排障:企业设备管理系统要突破惯有思维
◆如何解决设备管理软件跟有线网络不兼容问题
◆设备管理系统运维管理专区
本文来自互联网,仅供参考- 1怎样用数据库做一个设备管理系统?
- 2云计算时代的IT运维走向何方?
- 3系统管理员如何面对分工专业化
- 4如何用大数据帮助中小型企业了解客户
- 5数据中心管理框架应包含的七个管理领域
- 6高手自述:运维工程师的13种技能
- 7虚拟化环境下的存储管理工作分析
- 8IT运维管理发展之路回顾
- 9虚拟化应用的7大趋势
- 10设备管理系统一般都包括以下部分
- 11IT运维人员如何应对虚拟化安全?
- 12数据中心运维管理十大黄金经验
- 13好用的设备管理系统是怎样的?
- 14网络攻击常用术语释疑
- 15网络虚拟化六大基本概念释疑
- 16计算机设备管理系统维护系统体系结构详解
- 17IT运维管理安全五大错误解析
- 18盘点2012年安全领域热门技术趋势
- 19IT运维服务商如何枯木逢春
- 20IT运维手册之企业网络故障预防与评估
- 21CIO必须了解的7条法则
- 22企业网络安全管理:IP网络安全管理的主要问题
- 23如何加强设备管理系统的实用性?
- 24设备管理系统能为企业带来什么?
- 25云计算环境下的网络虚拟化如何解决端到端问题?
- 26设备管理器哪里有?
- 272013云管理将实现混合云和云安全
- 282012伦敦奥运会给CIO及设备管理系统的经验教训
- 29智能设备管理系统的核心功能?
- 30数据中心避免故障的部门分工与协作