ap 显示在线却没流量的原因是什么?

你知道吗?最近遇到了一个奇葩的网络问题,让我彻底无语。事情是这样的:移动营业厅里面的很多AP设备显示在线,可是流量数据就是上不去。别说,用户正常上网完全没问题,就是数据好像凭空消失了一样。这下可好了,接收到这个告警之后,我们运维团队二话不说,立刻行动起来排查这个问题。这个拓扑结构真是个老大难的问题,让我们头疼不已。咱们先排除一些可能性:比如说用户是不是真的关联上了呢?工程师们登录到每个AC上,用命令查看一下就知道了。结果发现,用户确实在关联列表中呢,AP也没有卡死或者上报错误。那接下来就得试试别的方法了。咱们用MG-Soft软件轮询一下无线侧流量节点,看看有没有什么猫腻。结果发现,两个节点的数值纹丝不动,跟开了假车似的。也就是说,数据压根就没走到SNMP层面。这下问题更严重了,得深入排查原因才行。咱们先检查一下SNMP进程有没有异常吧。结果发现日志里面没报错啊,运行时间也对得上号。可是那个162端口的队列长度竟然高达116640条!这意味着端口已经被彻底堵死了。那咱们再用命令确认一下堵塞情况吧。结果显示队列长度封顶,数据包根本没法被SNMP代理消费。这也就是为什么AP显示在线却没流量的原因了。 那么问题出在哪里呢?原来AC管理平台上的snmpd进程看起来挺正常的,实则是沉默不语。尽管日志里没有异常报警信息,也没重启过进程呢,可那个162端口却被堆积的待处理消息撑爆了!怎么办呢?咱们赶紧采取措施吧! 首先咱们可以重启一下snmpd进程疏通一下队列。杀掉这个进程后,阻塞队列瞬间清零,流量数据开始滚动了!业务一下子就恢复了!不过为了防止类似问题再次发生,还得升级一下版本才行。接下来就要执行snmpd软件升级至最新稳定版了。还有调整配置文件中的重传策略和队列长度参数呢。这样就可以彻底消除端口爆满的风险啦!