ping丢包故障处理方法
一、Ping丢包故障定位思路故障分析
Ping丢包是指Ping报文在网络中传输,由于各种原因(如线路过长、网络拥塞等)而产生部分Ping报文丢弃的现象。在使用Ping命令,出现Ping丢包的现象时,第一步需要确定Ping丢包的网络位置,其次是确定Ping丢包的故障原因,然后依据定位的故障原因再进行解决。
2.确认Ping丢包的网络位置时一般采用逐段Ping的方法,可以将Ping丢包故障最终确定在直连网段之间。 确认Ping丢包的故障原因一般采用流量统计的方法,通过流量统计可以知道丢弃报文的具体位置、判断故障原因。
3.导致Ping丢包的原因非常多,也非常复杂,实际故障定位中需要综合考虑各种因素。本文档针对常见Ping丢包故障分析,总结出以下几种常见故障:
二、物理环境故障;网络环路;ARP问题;ICMP问题。
需要注意并不是Ping丢包就一定表示网络质量差,某些情况下虽然Ping丢包,但是业务是正常的。分析Ping丢包时注意以下两点:
当设备对报文进行硬件转发,速度非常快,就不会丢包。例如,Ping设备端口下挂的电脑。当报文需要CPU进行处理时,CPU繁忙就会丢包。例如:Ping设备上的IP地址。
2.为了防止网络攻击对设备造成影响,设备具有CPU保护功能,对于超过CPCAR(Control Plane Committed Access Rate)值的ARP、ICMP等报文进行丢弃,造成Ping丢包现象。此种现象不影响业务的正常运行。
三、Ping丢包故障定位
图1 Ping测试组网图
如上图1所示,以一个Ping丢包实例,介绍Ping丢包故障定位。
3、Ping丢包故障现象
C:\Users> ping -n 100 192.168.4.41
2.正在 Ping 192.168.4.41 具有 32 字节的数据:
3.来自 192.168.4.41 的回复: 字节=32 时间<1ms TTL=128
4.来自 192.168.4.41 的回复: 字节=32 时间<1ms TTL=128
5.192.168.4.41 的 Ping 统计信息:
6.数据包: 已发送 = 100,已接收 = 80,丢失 = 20 (20% 丢失),
7.往返行程的估计时间(以毫秒为单位):
8.最短 = 0ms,最长 = 0ms,平均 = 0ms
四、Ping丢包故障定位
依据故障发生的可能原因进行故障定位,故障定位方法如下:
1、配置Ping多包。
为了持续复现丢包现象,以便于故障处理,需要持续发送Ping报文。可以配置Ping的-c count参数,发送多个Ping报文。
2、缩小故障范围。
当在PC上直接Ping IP地址192.168.4.41丢包时,直接判定故障出现的原因将非常的困难。此时可以先缩小故障范围,在PC上分别Ping SwitchA、SwitchB、SwitchC和SwitchD,通过Ping结果可以判断出哪一段网络出现故障。本例假设PC上Ping SwitchB时也出现丢包,则可以初步判断丢包发生在SwitchA和SwitchB直连网段之间。
3、配置流量统计。
通过缩小故障范围最终将故障定位在SwitchA和SwitchB之间,为了进一步确认故障点,需要在SwitchA和SwitchB上配置流量统计功能,观察丢包情况。具体理论统计配置方法请参考各设备的说明手册。
4、分析统计结果。
在SwitchA上持续Ping SwitchB。如果离开SwitchA的报文数目多余进入SwitchB的报文数目,说明传输链路上存在丢包,请依照后面介绍的物理链路故障引起ping丢包进行处理。
方法:
1、首先,使用键盘键入windows + R键,打开“运行”窗口。
2、在“运行”窗口中输入“cmd”指令。
3、输入指令后,点击“确定”按钮。
4、点击“确认”按钮后,即可进入命令提示符窗口(即cmd窗口)。
5、进入命令提示符窗口(即cmd窗口)后,在光标闪烁处输入指令"ping",然后输入空格。
6、在空格之后输入需要进行丢包率检测的网站网址,输入网址格式为,“www.***.com”或"www.***.cn",其中“***”代表具体的网站名。以360官网首页为例,则输入"www.360.cn"。
7、输入网址之后单击回车键(即enter键),即可查看网络丢包率。
使用Ping测量丢包的最佳方法是向一个IP地址发送大量的Ping命令,然后检查没有应答的那些Ping命令。如果快速地发出了50次Ping命令,可以检查没有没有应答的次数,并把没有应答的次数作为丢包。没有应答的次数超过5%可能就值得担心了。
在一台Windows计算机上,在命令提示符后面输入如下命令就可以完成这个任务:Ping -n
50(IP地址或者域名,如www.website.com)这个命令中的“-n”开关告诉发送ping命令的次数,“50”是发送的次数。
然后,将得到一个测试总结。这个总结将包括丢失的数量和百分比:
199.181.132.250地址Ping的统计结果:包:
发送 = 6, 接收 = 6, 丢失 = 0 (0%)大约往返时间以毫秒(ms)显示:最小 = 26ms, 最大
= 29ms, 平均 = 27ms
如果看到平均往返时间较高(超过100ms),这也会降低你的网络下载速度。设法消除某些引起丢包的网络某些部分的故障的一种方法是在通道的各个部分进行ping测试。首先开始进行测试的地方是本地的“缺省网关”。这是所有的数据传输到网络上经过的第一个路由器。如果在这一部分的丢包率很高,那么问题就在服务提供商的网络上。
在Windows命令提示符后面输入“ipconfig”命令就可以发现缺省路由器的IP地址。这个结果显示如下:
以太网接口本地区域连接:
具体连接的DNS后缀:domainname.com
IP地址.
. . . . . : 192.168.2.189
子网掩码 . . . . . :
255.255.252.0
缺省网关 . . . :
10.10.0.1
这里要查看的是缺省网关的IP地址。在上述例子中就10.10.0.1。
使用跟踪路由
在Windows命令提示符后面使用跟踪路由命令就可以实施跟踪路由。在Windows
XPZH中这个命令是:tracert
(IP地址或者主机名)
虽然结果不能显示丢包,但是,可以显示在路径中路由器反应速度减慢的情况。这个输出结果将显示所有的路由器的反应时间。下面是一个例子:
5
ms 2 ms 3 ms malibu.domain.com [10.10.0.1]
10 ms 6 ms 7 ms
10.60.0.6
9 ms 7 ms 7 ms 10.20.0.1
6 ms 7 ms 7 ms
x130.cd9e68.sj.concentric.net [205.158.104.130]
7 ms 7 ms 8 ms
ge9-0.dcr2.dc-fremont-ca.us.xo.net [205.158.60.169]
7 ms 7 ms 7 ms
ge2-0.dcr1.dc-fremont-ca.us.xo.net [65.106.2.205]
10 ms 7 ms 8 ms
p5-1-0-2.rar2.sanjose-ca.us.xo.net [65.106.2.153]
10 ms 9 ms 11 ms
p1-0.ir1.paloalto-ca.us.xo.net [65.106.5.178]
9 ms 10 ms 15 ms
206.111.12.114.ptr.us.xo.net [206.111.12.114]
9 ms 10 ms 10 ms
svl-core-03.inet.qwest.net [205.171.205.29]
29 ms 28 ms 29 ms
stl-core-02.inet.qwest.net [205.171.5.85]
30 ms 29 ms 29 ms
sea-edge-03.inet.qwest.net [205.171.26.42]
* * * Request timed
out.
* * * Request timed out.
28 ms 28 ms 29 ms
sam.abcnews.go.com
[199.181.132.250]
如果看到在路径中跟踪路由往返时间有超过100ms(十分之一秒)的,这就可能引起网络上传输的时间减慢。
从上述例子中,可以看到数据在很多不同的网络(XO,
Qwest, ABC)上传输。这是互联网美妙的一部分。不利的方面是一个用户无法解决反应时间减慢的问题。最佳的出发点就是确认服务提供商之间没有出现丢包。
你具体是哪一步弄不起来呢?如果问题出在最后一步的话,建议在ping和IP地址之间加一个空格先:)