无线常见故障排查手册 - 图文

更新时间:2023-11-18 23:49:01 阅读量: 教育文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

无线故障排查手册

一、 AP无法上线故障 ................................................................................................ 2

1.1 应用场景 ........................................................................................................ 2 1.2 capwap工作原理 ............................................................................................ 2

1.2.1 AP发现AC ............................................................................................ 3 1.2.2 开始隧道建立 ..................................................................................... 3 1.2.3 AP版本下载 ......................................................................................... 3 1.2.4 配置下发 ............................................................................................. 3 1.2.5 隧道保护 ............................................................................................. 4 1.3 AP AC登录和抓包 ........................................................................................... 4

1.3.1 AP AC登录 ............................................................................................ 4 1.3.2 AP AC抓包 ............................................................................................ 4 1.4 故障分析 ........................................................................................................ 7

1.4.1 AP获取地址检查 ................................................................................. 7 1.4.2 AP与AC连通性检查 ........................................................................... 7 1.4.3 细节检查 ............................................................................................. 8

二、 终端用户无法上网或上网卡顿故障.................................................................. 8

2.1 终端用户无法上网故障 ................................................................................ 8

2.1.1 确认终端用户是否正常获取地址 ..................................................... 8 2.2 终端用户上网卡顿故障 ........................................................................ 9

三、 云平台故障.......................................................................................................... 9

3.1 应用场景 ........................................................................................................ 9 3.2 portal认证原理 ............................................................................................. 10 3.3 无线用户无法弹出认证界面(无云平台登录地址链接) ...................... 11

3.3.1确认AC上开启portal认证并且配置正常 ...................................... 11 3.3.2 SSH登录确认信息 ............................................................................. 11 3.4 无线用户无法弹出认证界面(有云平台登录地址链接) ...................... 12 3.5 微信认证报错“无法连接网络”故障 ...................................................... 12 3.6 手机终端认证时无法自动弹界面故障(瘦AP) ..................................... 13 3.7 认证界面异常报错信息 .............................................................................. 13 四、 wifidog故障....................................................................................................... 14

4.1 应用场景 ...................................................................................................... 14 4.2 wifidog 工作原理.......................................................................................... 14 4.3 AP(胖)或7300(网关版)wifidog注册 ................................................. 16 4.4 wifidog认证时无法自动弹界面故障........................................................... 17 4.5 7300(网关)wifidog进行portal认证时不支持三层组网 ....................... 17 五、 故障排查常用命令............................................................................................ 18

5.1 AC排查命令 .................................................................................................. 18 5.2 AP排查命令 .................................................................................................. 18 5.3 wifidog命令................................................................................................... 19

一、AP无法上线故障 1.1 应用场景

AP工作模式有两种方式:胖模式和瘦模式。其中瘦模式为AP集中管理,需要AC控制器来进行统一管理AP。在该模式中AP需要在AC上上线,只有上线后AC才能对AP进行配置下发,状态监控等。瘦AP模式网络结构又分为两种分别为本地转发和集中转发模型。具体的网络拓扑如下:

本地转发:业务数据由AP进行转发,然后到达上行有线网络。只要capwap协议的控制报文走CAPWAP隧道由AP集中转发到AC。

集中转发:业务数据由AP集中从capwap转发到AC,再由AC转发到有线网络上。

具体的业务数据流如下图:

1.2 capwap工作原理

AP与AC之间capwap交互过程分为如下几个过程:

1.2.1 AP发现AC

? AP静态配置AC的IP地址 (常用) ? Dhcp option 43选项 (常用) ? 广播、组播报文发现 ? DHCP+DNS解析

Discovery request:AP与AP建立连接之前,用于AP发现AC。

Discovery response:AC收到正确的Discovery request报文后,回复该报文。

1.2.2 开始隧道建立

建立过程有两种报文交互,具体如下:

Join request:AP完成AC选择之后通过此报文请求AC提供服务。

Join response:AC收到Join request报文后,检查是否可以提供AP请求的服务,并通过join response报文中的result code字段返回检查结果,完成隧道建立过程。

1.2.3 AP版本下载

在AP加入AC后,AC首先需要检测AP版本是否与自己匹配,否则不能正常上线。(AP AC版本不能上下完美兼容,则在进行上线时,首先确定AP AC版本号正常。)具体上线过程如下:

Image data request(AP to AC):AP请求AC发送image文件

Image data response(AC to AP):AC对请求报文的回复,其中携带image文件的大小

Image data requset(AC to AP):AC开始发送image片段的报文,其中包括data type字段,标志该片段是否为最后一个。 Image data response (AP to AC):对image片段报文的回复,表示成功接收到片段。

1.2.4 配置下发

AP AC版本同步后,隧道工作已经OK,AP会请求AC下发配置。交换报文如下: Configuration status request:AP向AC请求下发配置。

Configuration status response:AC向AP发送,回应下发配置请求,并携带配置信

息。

1.2.5 隧道保护

隧道成功建立后,AP会在控制隧道中无报文时,定期发送心跳报文。

Echo request:AP在run状态,且echointerval定时器超时的情况下,发送此报文 Echo response:AC处于run状态,且收到echo request报文后发送。

1.3 AP AC登录和抓包

1.3.1 AP AC登录

WEB登录

AP:默认地址:192.168.1.1 用户名/密码:admin/admin

(登录时需要使用无线连接默认ssid BD_XXXXXX xxxxxx为AP MAC地址后6位 无线网卡手动制定一个IP地址,与192.168.1.0/24在同一个网段)

AC:默认地址:192.168.0.1 用户名/密码:admin/admin (默认地址在ge0口)

SSH2登录

AP:默认地址:192.168.1.1 用户名/密码:root/bdinside AC:默认地址:192.168.0.1 用户名/密码:root/bdinside

Console登录

AP AC可以使用控制线进行登录,登录时注意波特率为115200,其他与登录交换机正常。默认不需要用户名和密码认证。

1.3.2 AP AC抓包

在排查故障时会经常需要在AP AC上进行抓包操作,具体情况如下:

AC抓包如下: 1、SSH2登录AC

2、在命令行输入命令:tcpdump -i eth1 -w /tmp/eth1.pcap (抓取eth1口报文并保存在AC的/tmp文件夹下,报文文件名为eth1.pcap) 3、抓包完成后使用ctrl+c结束抓包过程 4、通过WinSCP软件把数据包文件取出来 打开WinSCP软件如下:

协议:选择SCP

主机名:AC管理地址

用户名/密码:root/bdinside 端口号:默认22

点击“登录”,登录后界面如下:

在右边为AC的根目录,双击打开“根目录”如下:

即可找到tmp文件夹,然后打开找到相应的数据包文件。

然后选择该数据包文件,点击“下载”按钮,则数据包文件就会下载到左边路径文件夹下。

AP抓包如下:

AP本身默认不支持抓包,首先需要把三个文件导入到AP相应目录下,然后才能支持抓包,抓包过程和下载抓包文件和AC操作一样。具体过程如下: 1、首先打开WinSCP软件登录AP

2、上传“tcpdump”文件到AP的/usr/sbin目录,操作如下:

左边为电脑文件路径,则选中需要上传到AP的“tcpdump”,右边为AP文件路径,路径需要停留在AP的/usr/sbin路径下。然后点击左边的“上传”按钮即可。 3、同理把tcpdump-mini_4.5.1-4_ar71xx.ipk、libpcap_1.5.3-2_ar71xx.ipk到/tmp目录

4、文件导入完成后,SSH2登录AP命令行界面,输入如下命令 chmod a+x /usr/sbin/tcpdump

opkg install /tmp/libpcap_1.5.3-2_ar71xx.ipk

opkg install /tmp/tcpdump-mini_4.5.1-4_ar71xx.ipk 执行完成后AP即可支持tcpdump抓包命令

5、按照上述AC的抓包命令和取抓包文件过程即可完成AP抓包。

1.4 故障分析

1.4.1 AP获取地址检查

AP上线过程首先是AP能够自动拿到一个内网IP地址(AP动态获得地址网络环境)。

如果AP没有拿到一个地址,则排查手法如下:

1、把AP更换成电脑,看是否能够获取地址,如果不能则手动配置一个IP地址,测试是否能够与网关通信 ,如果不能,则检测AP到DHCP服务器之间的网络通信问题

2、把AP更换成电脑可以获取地址,再次更换AP后无法获取地址,则按照如下排查:

1)首先WEB登录AP查看WAN口是否为动态获取地址 2)如果AP是动态获取,但是没有拿到地址,则需要在AP上进行抓包,查看DHCP报文,到底哪一块出问题了。 3)抓包的同时,如果AP的DHCP在AC上,则在AC的命令行界面出入如下命令: cd /tmp/log

cat message | grep dhcpd

查看一下AC上dhcp报文信息,配合AP上的抓包信息,基本可以定位。 3、如果上述两个方法还是无法判断原因,则可联系service。

1.4.2 AP与AC连通性检查

AP拿到规划好的管理地址后确保AP与AC的LAN口地址能够通信。该过程主要注意有线网络的连通性配置即可。

1.4.3 细节检查

1、检查AC上是否开启了模版并配置正确 2、检查AC AP版本是否对应

3、检查AP拿到地址后是否有获取到AC的LAN口地址。检查方法如下: 1)在AP的dhcp服务器上查看配置,是否配置了option 43字段 2)在AP上使用命令debug info capwap state查看

如果上述排查都无法定位,则联系service。

二、终端用户无法上网或上网卡顿故障 2.1 终端用户无法上网故障

2.1.1 确认终端用户是否正常获取地址

如果终端用户无法正常获取地址,首先可以手动配置一个地址,然后测试与网关的连通性,如果不通,则排查终端用户vlan与终端用户dhcp服务器之间的数据连通性配置问题即可。如果是终端用户拿到地址了,但是无法上网,则需要注意一下几点:

1、如果是本地转发,终端业务数据不走AC,则只需要在有线网络把终端业务vlan数据打通即可。

2、如果是集中转发AC lan口用于上线,AC wan口用于数据转发,则终端数据从AC lan口进行NAT转换后才从WAN口进行路由出去。这点需要注意,即从ACwan口出去的数据源地址都是AC wan口地址,在出口做NAT时需要注意。 其中需要的命令如下:

1)AC上查看路由表 route

2)AC上手动添加路由表:route add -net 192.168.1.0 netmask 255.255.255.0 gw 192.168.1.2

3)AC上手动删除路由表:route del -net 192.168.1.0 netmask 255.255.255.0 gw 192.168.1.2

2.2 终端用户上网卡顿故障

无线用户上网卡顿故障排查思路与有线网络基本一致。

1、首先需要检查终端的信号强度,看是否由于信号差,导致的上网卡顿现象。 2、如果信号较强,则需要查看终端在关联上无线后协商的速率是不是太低导致。 3、检查AC或者出口是否开启了流控策略,由于限速导致用户网络卡顿

4、如果排查上述三项则可以按照有线网络的卡顿故障排查(通过ping测试首先定位出卡顿点在哪,然后在逐步分析即可)

三、云平台故障 3.1 应用场景

现网无线网络中需要使用短信/微信/用户名密码等方式实现portal认证功能。 具体的网络架构如下图:

3.2 portal认证原理

1、用户打开浏览器,访问某个网站,发起HTTP请求

2、AC截获用户的HTTP请求,由于用户未认证,强制重定向到云WiFi管理平台的Portal服务器

3、Portal服务器向用户终端推送WEB认证页面。

4、用户在认证页面输入帐号、密码等信息(点击微信连wifi也是提交用户名密码),提交到Portal服务器

5、Portal服务器接收到用户信息,向Radius服务器发出用户信息查询请求

6、Radius服务器验证用户密码、查询用户信息,并向Portal服务器返回查询结果及系统配置的单次连接最大时长、用户套餐剩余时长信息 7、如查询成功,Portal服务器按照CHAP流程向AC请求Challenge;如查询失败,Portal服务器直接返回提示信息给用户,流程结束 8、AC返回Challenge ID

9、Portal服务器将密码(可选)和Challenge ID(可选)及Challenge-Password,和帐号一起提交到AC,发起认证

10、AC将Challenge ID、Challenge-Password、Called-Station-ID和一起送到云平台RADIUS服务器,由RADIUS服务器进行认证

11、RADIUS服务器根据用户信息判断用户是否合法,如认证成功,则RADIUS服务器向AC返回认证成功报文,并携带协议参数,以及用户的相关业务属性给用户授权;如果认证失败,RADIUS向AC返回认证失败报文

12、AC返回认证结果给Portal服务器。报文类型为ACK_AUTH。如果认证成功,errcode为0;如果认证失败,errcode为1;如果已经建立此链接,errcode为2 13、Portal服务器根据认证结果,推送认证结果页面

14、如果认证成功,Portal服务器回应AC收到认证结果报文AFF_ACK_AUTH;如果认证失败,则流程结束

3.3 无线用户无法弹出认证界面(无云平台登录地址链接)

3.3.1确认AC上开启portal认证并且配置正常

Portal认证:确认为开启

认证vlan:确认业务vlan id添加到认证vlan id中 AC名称:需要向李毅申请,申请信息收集如: ip:172.17.1.80

型号:WSC6100-X32B sn:32013000276

mac:84:79:73:5d:3d:a4

3.3.2 SSH登录确认信息

1、首先SSH登录AC,使用命令portal -s 查看PORTAL进程是否开启 2、尝试手动重启portal进程命令如下: root@BDCOM:/etc/init.d# ./portald stop root@BDCOM:/etc/init.d# ./portald start

3、如果上述都无法定位故障,则登录AC下的AP,在AP上抓取eth0接口报文

反馈到service

3.4 无线用户无法弹出认证界面(有云平台登录地址链接)

如果在浏览器的URL已经出现了云平台地址链接http://139.196.25.90,具体如图:

则说明AC portal认证已经生效,且AP已经对终端用户的HTTP数据进行了重定向,定向到云平台链接。则目前来看主要有如下两个点需要检查一下:

1、首先确认在AC上关闭portal认证,终端是否能够正常上网(打开网页) 2、确定终端DNS获取正常

3、如果上述都正确,则一般为“终端发送了请求认证界面链接”--“终端正常接收云平台返回的portal界面”之间出现故障,则请在AC的WAN口抓取报文并反馈service。

3.5 微信认证报错“无法连接网络”故障

1、故障现象如图:

2、故障原因:该故障一般为AC与云平台交互或者云平台与微信服务器之间交互故障。首先需要了解AC与云平台几个重要交互过程。 1)云平台向AC发起请求认证,报文格式为UDP 2000端口报文,其中标识是data字段的值前4位为0103.

2)2)AC返回响应认证,报文格式为UDP 2000端口报文,其中标识是data字段的值前4位为0104。具体数据包如上。

3)云平台会返回ACK报文给AC。报文格式为UDP 2000端口报文,其中标识是data字段的值前4位为0107。

4)云平台与AC之间的保活报文为UDP 2000端口报文,其中标识是data字段的值前4位为0164。

3、排查步骤

1)首先确认配置正常。

2)如果配置发现不了问题,则在AC上抓取WAN口数据报文,查看是否有AC到云平台的上述的几个报文交互,如果没有,则可以断定是AC还是云平台问题。后续请联系service即可。

3.6 手机终端认证时无法自动弹界面故障(瘦AP)

手机终端自动弹界面功能主要取决于手机终端本身的系统,如果出现该故障请先确认如下几点:

1、收集无法弹界面手机终端型号和系统版本 2、如果系统版本过老,建议先升级系统版本

3.7 认证界面异常报错信息

在进行portal认证时会出现各种异常的错误提示,现收录进行整理 1、微信认证

1)

该报错信息为微信服务器异常,反馈给云平台信息,与无线网络和云平台无关

2)

该报错信息为云平台后台数据库故障,请提供商铺的用户名和密码发邮件到service即可。立即解决。

四、wifidog故障 4.1 应用场景

wifidog是搭建无线热点认证系统的解决方案之一,主要使用在无线AP工作在胖AP模式下,但是需要进行认证的网络环境。现场不需要AC控制器。

4.2 wifidog 工作原理

Wifidog是一个系统,有客户端和服务器。具体的工作流程如下:

1、PC打开浏览器,访问www.sina.com.cn,AP检测到HTTP报文后会进行重定向报文发送。重定向报文为HTTP 302报文。

2、终端收到重定向报文后会根据报文内容向云平台请求认证界面

3、云平台收到终端HTTP请求报文后返还认证界面给终端

4、终端接收到后,认证界面正常弹出。

5、终端用户在认证界面提交用户名密码信息(如微信认证的“微信连wifi”)

6、Server收到信息后需要进行认证,认证成功后返回code=200的值,并且包含一个token值(token值为云平台根据终端提交的用户名密码信息进行一个算法后得到的一串字符)

7、终端接收到云平台反馈回来的结果后,提取token值,并发送报文到AP进行。 8、AP收到终端的token值后向云平台发送认证请求,验证token值是否正常。 9、云平台收到AP的认证请求后,提取token进行验证,并返还验证结果。 10、AP接收到云平台的认证结果后会发送HTTP 302报文给终端用户 11、终端用户会根据AP发送的HTTP 302报文内容请求认证成功界面 12、云平台响应终端的认证成功界面请求。

13、终端收到云平台返还的认证成功界面则认证完成。

4.3 AP(胖)或7300(网关版)wifidog注册

注册页面如下:

首先开启wifidog认证,然后点击“提交”,然后点击“跳转到注册页面”

网关名称:任意填写

SSID名称:AP广播的SSID 安装位置:根据实际情况填写 商铺编号:云平台商铺的编号

商铺管理员:云平台商铺登录用户名 密码:云平台商铺登录密码

然后点击“提交”如果注册成功,则有如下界面

4.4 wifidog认证时无法自动弹界面故障

AP(胖)或7300(网关)在使用wifidog协议与云平台对接实现portal认证时,出现网络刚建立时,苹果手机偶尔有手机能够自动弹界面,但是网络运行几天后基本全部不能自动弹界面。该现象为正常现象。具体故障原因如下: 1、苹果手机在关联上wifi后,会自动请求苹果内部的几个网址链接

2、Ap或7300在进行认证时会针对苹果自动请求的链接进行IP地址解析并把解析的IP地址加入目的白名单。

3、随着终端关联的次数上升,ap或者7300针对苹果终端特殊链接的目的白名单也就越多,直到全部解析完成。则苹果终端就不会在自动跳转了。

4.5 7300(网关)wifidog进行portal认证时不支持三层组网

故障现象:7300与云平台注册成功,但是终端无法弹出认证界面,无法跳转到

云平台链接

故障原因:7300与云平台对接实现portal认证时,7300设备上必须有无线终端用户的ARP信息,则无线终端与7300之间必须是二层组网 解决方案:无

五、故障排查常用命令 5.1 AC排查命令

1、查看在线AP debug info capwap wtp

2、查看AP上下线时间及原因的历史记录 cat /tmp/log/wtp.log.txt.nbr 3、查看在线VAP debug info hostapd vap all 4、查看在线终端 debug info hostapd sta all

5、查看down掉的端口 ip link | grep \6、查看端口信息 查看端口信息 7、查看AC所有接口信息 ifconfig 8、查看portal信息 portal -s

9、重启web进程 ./etc/init.d/uhttpd reload

10、恢复出厂设置 killall dropbear uhttpd; sleep 1; mtd -r erase rootfs_data 11、查看在线AP数 debug info hostapd ap all

12、抓eth1的包,并保存生成tmp目录下 tcpdump -i eth1 -w /tmp/eth1.pcap 13、查看AC内存分区和大小 df -h 14、查看内置flash大小 fdisk -l 15、查看具体文件大小 ls -lh

16、查看AC上license情况 debug info capwap global | grep number 17、手动停止portal进程和开启portal进程 root@BDCOM:/etc/init.d# ./portald stop root@BDCOM:/etc/init.d# ./portald start

5.2 AP排查命令

1、查看ap上的capwap状态 debug info capwap state 2、查看在线终端 debug info hostapd sta all 3、查看AP射频特性信息 iw dev 4、胖瘦模式切换 fit2fat fat2fit

5、查看连接AP的无线终端信息 iwinfo wlan0 assoclist 6、查看分配的DHCP客户端IP cat /tmp/dhcp.leases 7、使用AP自身扫描AP iwinfo wlan0 scan 8、查看AP自身DHCP报文信息 cd /tmp/log

cat messages | grep dhcpd

9、查看桥接口和物理接口之间的关系 brctl show 10、绑定物理接口与桥接口 brctl addif br-wan wlan0

11、查询设备型号 cat /tmp/sysinfo/board_name

12、恢复出厂设置 killall dropbear uhttpd; sleep 1; mtd -r erase rootfs_data

5.3 wifidog命令

1、查看AP发送给云平台的心跳报文 wdctl show 1

2、查看wifidog认证成功在线用户详细信息 wdctl show 2 3、查看wifidog状态 wdctl status

本文来源:https://www.bwwdw.com/article/m55v.html

Top