Wi-Fi和终端那点事 | 无线网络卡顿分析中篇

2022-11-08 373

前言


上文探讨了这么多,不难发现,无线是一件三方的事情(无线终端&AP&无线环境),任何一方有纰漏,都会导致终端的使用体验不好,所以接下来本文也会分别从三方面进行探讨:



   


无线终端篇


无线网卡性能


众所周知,无线网卡也是在不断地更新迭代中,最开始的无线网卡只支持802.11b协议,到现在最新的无线网卡支持802.11ax协议,无线网卡的性能也是参差不齐的,人们常说好马配好鞍,法拉利配上一颗拖拉机的发动机,它也快不了呀。


无线网卡驱动


 


上图是从因特尔官方网站截取的一张图,图中明显的看到,在Wi-Fi 6网络中,部分因特尔无线网卡是无法扫描到支持Wi-Fi 6协议的无线信号(SSID)的,这就直接导致终端无SSID可连,连无线卡顿都不给机会。



又如上图,在微软论坛里反馈出一个问题,部分Windows版本用户网络使用正常,但是无线图标显示为地球模样,并且显示无Internet,但是此时无线网络是可以正常使用的,最后发现根因为微软修改了部分系统中的注册表的返回值,需要修改部分注册表的返回值,网络连接即可恢复正常。


无线网卡过滤无线频段/信道


众所周知,我们日常使用的无线是可以工作在2.4G频段或者5G频段的,然后针对这两个频段,分别有不同的信道,有些无线终端(Windows系统)是可以选择无线网卡工作在哪个频段的。


所以当无线终端网卡工作在2.4G频段,但是AP(无线接入点)工作在5G频段,或者无线终端网卡工作在5G频段,但是AP(无线接入点)工作在2.4G频段,那么无线终端是搜索不到无线信号(SSID)的。


如下图,对Windows无线网卡工作频段进行设置


 


部分终端甚至是可以设置无线终端网卡只搜索2.4G频段/5G频段中的部分信道。


如下图,该终端在5G频段只会搜索36,40,44,48这四个信道,如果你的AP释放的SSID工作在其他信道,那么同样的,该无线终端也是搜索不到你的AP释放的无线信号(SSID)的。



无线终端网卡漫游阈值设置不合理


部分无线终端是可以设置漫游的阈值的,如果无线漫游阈值设置的过低/过高,则会导致终端不停的漫游/不漫游,所以无线漫游阈值也需要设置到一个较为合理的区间,如下图为终端设置无线漫游阈值的界面:


   
   


苹果终端提示“Wi-Fi网络似乎未接入互联网”


 


部分看官在使用iPhone终端过程中弹出“Wi-Fi网络似乎未接入互联网”,这个时候点击弹窗下方的“继续尝试使用无线局域网”选项,网络可正常继续使用,且现象是偶然性的,随机出现。


   


环境篇


无线Wi-Fi干扰


如下图,可以看出,在2.4G频段工作着很多的SSID,这个时候估计各位看官一看就会说这无线干扰这么多,无线环境这么差,使用体验肯定好不了,这里需要纠正一个小误区,就是别的(不是自己AP释放出的)无线信号多,不一定代表无线环境不好,如果这些别的SSID只是放出信号,但是并没有终端进行连接和跑流量,那么其实是不能给出无线环境不好这个结论的,不够严谨。


 


那么要怎么才能给出无线环境好不好的结论呢?


证明无线环境是否“干净”,最有说服力的数据就是信道利用率,众所周知,AP(无线接入点)每张射频卡是工作在具体的信道上的,如果现网中所有的AP的信道或者绝大部分信道利用率很高,就可以判断该无线环境较为糟糕。


如何查看AP的信道利用率呢?三种方法:


1. 如果该网络中使用的是锐捷AC+AP组网的模式,那么可以将AC接入到锐捷WIS(Wireless Intelligent System),然后就可以在WIS平台上查看该AC所管理的所有AP的射频卡的信道利用率,如下图:


 


上图是看全局的AP信道利用率,WIS上也可以进入单个具体的AP进行信道利用率使用情况的查看。


 


2. AC在接入到WIS平台后,也可以直接在AC上进行查看,命令为show wis radio-link-quality(锐捷VAC(虚拟化AC)目前暂不支持该命令,实际排查过程中需要注意哦)。


 


3. 通过登录到具体的AP上进行信道利用率的查看


拿锐捷AP来举例,如果您是7系列或者之前的AP,您远程到AP上可以通过命令debug sdk link X(1/2/3/4),这里给各位看官解释下括号后面跟的数字代表的是AP的射频卡,1代表第一张射频卡,2代表第二张射频卡,依次类推,锐捷AP第一张射频卡一般为2.4G射频卡,第二张&第三张一般为5G射频卡。


 


可以看出,该AP的射频卡2工作在161信道,161信道利用率为72%。


如果您是锐捷8系列的AP,查看过程会稍微复杂一些:


方法一:


1、查看当前radio 1/2/3的信道:


如下图:show dot11 wireless 1/0 show dot11 wireless 2/0 show dot11 wireless 3/0


 


2、然后进入debug support模式下,查看当前VAP(bssX.0)对应的信道。从判断VAP当前是属于哪个radio


debug support


 execute diagnose-cmd sh wl -i bss0.0 chanspec


 execute diagnose-cmd sh wl -i bss1.0 chanspec


 execute diagnose-cmd sh wl -i bss2.0 chanspec


 


3、继续在debug模式下输入命令查看当前各个radio的信道空闲率,以idle表示:


debug support


 execute diagnose-cmd sh wl -i bss0.0 chanim_stats


 execute diagnose-cmd sh wl -i bss1.0 chanim_stats


 execute diagnose-cmd sh wl -i bss2.0 chanim_stats


信道使用率 =100-信道空闲率(idle)


 


是不是有点复杂?(手动狗头)


接着往下看,方法二来了:


在AP上show devmng dump radio 2,一下就可以找到对应关系了


 


1. 继续在debug模式下输入命令查看当前各个radio的信道空闲率,以idle表示:

2. 

3. debug support

4. 

5.  execute diagnose-cmd sh wl -i bss0.0 chanim_stats

6. 

7.  execute diagnose-cmd sh wl -i bss1.0 chanim_stats

8. 

9.  execute diagnose-cmd sh wl -i bss2.0 chanim_stats

10. 

11. 信道使用率 =  100-信道空闲率(idle)


 


上述方法是在AC/AP上来进行AP的信道利用率,这里小编给各位看官拓展下,通过omnipeek抓包分析也可以对现场无线环境进行比较给力的佐证(omnipeek是一款强大的可以实现无线空口抓包的软件,具体如何安装如何抓包,小编在这里不多赘述,各位看官自行问度娘,毕竟,内事不决问百度,外事不决问谷歌)


这边小编有一份报文,如下图:


 


通过omnipeek的分析功能,可以看出来该份报文中被识别成IEEE 802.11类型的数据包占了整份报文的93%,可以看出这份报文中绝大多数的数据包是空口包,所以也从侧面说明,空口中非Wi-Fi报文总数较少,非Wi-Fi干扰的情况基本不存在。


好,那我们将报文展开看看。如下图:


 


这张图大家不难看出,在整个报文中,beacon报文占据了70.5%,很明显该无线环境中的beacon帧过多了,同样的,beacon多了之后也会占用空口资源,也会导致无线用户使用体验不佳,一般这种情况,要么是环境中无线路由器太多了,不停地在向外发出beacon帧,要么是部分路由器的beacon帧发送的间隔太短了,才会导致在抓包时间内beacon帧的大量聚集。


众所知周,beacon帧属于广播帧,所以当无线网中有大量无线终端互访需求时,在不知道对方地址时,此时就会发出广播帧,在无线空口中进行泛洪,同样的也是会占用大量空口资源。


此外,我们还可以通过这份数据包看到目前环境中的私设Wi-Fi,以及各个SSID传输的数据包个数,这些数据都可以让我们对现网环境有一个准确的研判。


 


非Wi-Fi干扰


一般的非Wi-Fi干扰源主要有:


微波治疗仪:


很多微波治疗仪工作频段为2.4Ghz,会对2.4G频段无线产生干扰。


微波炉:

 
 


可以看出微波炉工作的频率为2.4Ghz,同样的也会对2.4G频段无线产生干扰。


蓝牙收发器:


 


可以看出蓝牙工作的频率为2.4Ghz,同样的也会对2.4G频段无线产生干扰。


上述是告诉了各位看官常见的非Wi-Fi干扰源有哪些,主要还是通过肉眼去进行判别,但是总会有一些肉眼判别不出来的非Wi-Fi的干扰,那么这个时候这个环境中有非Wi-Fi干扰么?是不是不知道该如何回答了?


莫慌!这里小编给各位看官拓展下,通过omnipeek抓包可以对现场是否存在非Wi-Fi干扰提供一份强有力的佐证。


这边小编有一份报文,如下图:


 


从上图可以看出,该份报文中被识别成IEEE 802.11类型的数据包只占了整份报文的23%,那么也就意味着剩下的77%的报文未能被识别成IEEE802.11类型的报文,这种情况下基本就可以判定该无线环境中存在非Wi-Fi的干扰了。


   


AP(无线接入点)篇


AP版本


市面上一些AP型号版本经过多方验证确实存在某些已知bug,导致终端无法连接到AP,或者出现连接到AP上不稳定等等情况,这时候就有看官说了,我也不知道我这个版本有没有bug呀,这里小编教给大家一个判断的方法,一般无线厂商都会有自己的官网,拿锐捷举例,打开锐捷官网www.ruijie.com.cn,找到服务与支持里面的版本下载。


 


然后找到现有的无线AP的型号,点击进去


 


然后就能够看到AP的具体的版本了,点击下载


 
 


下载完成后,查看该版本的发行说明,其中说明解决了的bug,是否和现场无线问题有吻合的地方,有的话,升级即可,没有的话,可升级可不升级。


 


AP功率/信道


AP出厂部署之后,射频卡会被分配在一些默认的信道上,功率都是100%,如果不进行调整,很容易造成同频干扰。


AP性能瓶颈


有可能现网使用的AP年代久远,吞吐率/连接数满足不了现网终端的需求,这时候又有看官说了,我哪知道有没有达到AP的性能瓶颈了呢,小编早就想到了,拿锐捷举例:


首先在官网上查询一下AP的性能参数:


 
 
 


从官网上可以看到该型号AP整机5.8G的传输速率为867Mb/s。


然后打开wis,看下该AP的流量情况,这里需要注意的是,wis采集数据的颗粒度是五分钟,所以下图的意思是五分钟的时间,如下图:该射频卡的流量达到了1343MB,也就是1343000Mb,除以300,得到的值是4476Mb/s=4.4Gb/s,可以很明显的看出该型号的AP的吞吐量达不到现网使用中的需求,达到了AP的性能瓶颈。


 


当然您可以进入到AP下去看AP物理接口下的瞬时流量,但是很明显不如WIS上的折线图看起来清晰和可视化,所以小编还是推荐在WIS上进行流量的查看呢。


AP间负载不均衡


举例说明,锐捷推出的高密AP的型号基本都是三张射频卡,其中一张2.4G,两张5G,有时候终端会全部连接到其中一张5G射频卡上,导致一张5G射频卡上的终端数众多,但是另外一张射频卡上的终端寥寥无几,终端连接到那张终端数多的的射频卡上,使用体验不佳。


无线反制


现网中存在流氓AP,正常Wi-Fi被反制,导致正常Wi-Fi使用体验差。


那这点事如何巧妙地解决,让Wi-Fi发挥真正实力,无线网络卡顿分析下篇,敬请期待!

最新回复 (0)
返回