报文arp断网攻击

arp断网攻击  时间:2021-05-24  阅读:()
知wlan接入ARP余晨2015-12-15发表某局点ARP刷新异常导致AP掉线的经验案例2015年11月10日23点57分左右,该局点园区1号楼AC发生与AP不通并随后AP大面积掉线的情况,导致无线用户短时无法上网,40秒左右后自动恢复.
在此过程中,1号楼AC的出现过CPU100%的告警.
无线网络中的其他7台AC没有出现问题.
一、对一、对AC设备的分析设备的分析1号楼的AC上注册有502台AP,其中有426台发生掉线.
但此时该AC与备AC的热备链路并未断开,与另外7台AC的漫游组隧道也没有断开,说明此时AC的数据平面和控制平面均能工作正常.
从AC驱动的收报统计看此时也没有控制报文丢包的情况,所有的接收到的控制报文均送CPU进行处理了,驱动底层也未见硬件收发包异常的情况.
5724lwapp_ctrl23:57:2811/10/20157383766200(该列表示丢包数)121755724iactp23:57:2811/10/20156266165509215724lwapp_data23:57:2811/10/201582207522806785AC驱动每分钟会统计一次从以太口接收的网络报文数量,如下图.
记录时间是每分钟的28秒,以23:56:28的统计为例,它记录的是从23:55:28到23:56:28这一分钟之内的AC以太口接收到的网络报文总数.
从图中可以明显看出在23:56:28之前的收包统计基本上处于1400万~1500万这个范围(我们可以认定这是一个正常值的范围).
而在23:57:28秒记录的收包统计值只有300多万,与正常值相比明显少了太多.
通过分析所有掉线AP的log可以明确以下几点:以该AC为主AC的AP掉线时间是从23:57:01开始,持续到23:57:09;掉线的AP从23:57:10开始恢复上线;期间没有掉线的AP(以故障AC为主AC的AP)为63台.
AP心跳默认超时时间为30秒,以此推算,AP与AC之间的心跳报文从23:56:31开始丢失.
23:56:28到23:57:28这一分钟可以分成如下几个时间段:其中:t1(23:56:28-23:56:31):3秒,AC与AP之间通信正常,心跳正常;t2及t3(23:56:31-23:57:10):39秒,AC与AP之间心跳不通,AP在t3时间段内大量掉线;t4(23:56:10-23:56:28):18秒,AC与AP之间通信恢复,AP开始重新上线;t1和t4两段时间内产生的流量估计大概有100~200万个.
减掉这部分流量,在t2及t3两段时间内,AC上接收到的网络报文量只有200万左右,明显少于正常水平.
另外,故障期间有63台AP始终没有掉线,恰好有一台无线客户连在其中的一个AP上并持续对网关设备、AC及外网服务器做ping操作.
故障发生的过程中,所有的ping都不通,如下:pingAC同网段地址ping外网服务器www.
163.
comping网关依据上面的分析,我们推断在t2及t3时间内(即23:56:31到23:57:10之间)AC与AP之间的通信出现了中断,需要排查从AC到AP之间的上下行通路.
二、对二、对AC-AP间通路的分析间通路的分析1、对有线设备1、对有线设备LOGLOG的分析的分析故障恢复后,除收集AC侧相关信息后同时针对有线侧设备也进行了初步排查,包括对S36V2、S75E、S95E设备上的诊断信息、diaglog、logfile等信息的收集.
通过对收集信息的分析,未发现关于硬件芯片复位、端口up/down、路由震荡、MAC漂移等可能影响流量转发的相关信息.
2、对AC-AP间上下行通路的分析2、对AC-AP间上下行通路的分析无线网络拓扑如下图所示:其中红色通路是SSID为inc无线用户访问公网流量,无线终端网关在S95E上黄色通路是SSID为guest无线用户访问公网流量,访客无线终端网关在WX5004上绿色通路为有线终端通过接入交换机上联至S75E并最终到公网的流量.
无线终端流量上送时由于S75E和各AC板卡都在vlan800内,所以S75E转发到AC板卡的流量是通过ARP进行转发.
从AC侧下行流量是通过AC侧默认路由指向S95E,再通过S95E上的默认路由指回S75E,该通路也是在vlan800内.
由于故障期间,所有有线终端的网络访问正常,因此可以首先排除从接入交换机S36到S75E之间的问题.
那么造成AP与AC之间通信中断的原因,集中在S75E—S95E—AC这三点之间.
AP发送给AC的上行LWAPP隧道报文是在S75E上查询ARP表项后通过vlan800的二层转发到达AC的,因此如果上行通路发生终端,那么最大的可能是S75E上查询不到AC的ARP或者AC的ARP表项错误.
AC发送给AP的下行LWAPP隧道报文是在AC通过默认路由发送给S95E,然后S95E再通过默认路由发送给S75E.
这里涉及到两次ARP表项的查询:(1)AC通过默认路由发送给S95E:AC上要查询默认网关(S95E)的ARP表项,然后通过vlan800将报文发送S95E;(2)S95E通过默认路由发送给S75E:S95E上要查询默认网关(S75E)的ARP表项,然后通过vlan800将报文发送S75E;上述查询ARP表项的操作同样有可能存在查询不到ARP或者ARP表项错误的情况.
由于S95E到S75E是所有AC下行公用的通道,因此可以排除上述(2)中ARP出问题的情况,(1)中出现ARP问题的可能是存在的.
由于vlan800属于核心网络设备间的vlan,不存在收到攻击的情况,也没有排查到有环路的存在,因此可以排除ARP表项错误的原因,仅有的可能就是ARP表项丢失(ARP老化并长时间无法学习到).
S75E上未见针对此AC的丢包.
AC上在故障点附近收集到了ARP报文的丢包统计,如下:从中可以看出在23点57分故障发生的1分钟时间里有约1200个的ARP丢包,这可能会引起AC上ARP表项的丢失.
三、实验室模拟复现分析在研发实验室对该局点无线网络搭建了一比一的模拟复现环境.
通过在此环境上上模拟仿真,发现当AC上的网关ARP(即S95E的ARP)删除掉后,模拟大量无线客户端持续向外网发送流量会导致AC上数据核向控制核上报消息的队列持续拥塞并丢包,同时引起AC长时间学习不到网关的ARP,最终AP掉线.
复现过程如下:1、AC上初始条件下正确学习到网关的ARP(10.
64.
200.
42),并模拟大量无线客户端持续打流:2、删除AC上的网关的ARP:3、此时查看上送控制CPU的报文队列,可以看到default会有大量的溢出,同时ARP也持续有丢包,网关ARP始终学习不到;4、只到AP掉线以后,网关的ARP可以再次学习到,之后AP重新关联上线.
通过分析,产生上述现象的原因如下:1、当AC上由于ARP老化等原因删除ARP时会同步删除与该ARP相关的所有快转表项.
由于实验中删除的是网关的ARP,因此AC上的全部快转表项均会被删除.
注:快转表项是数据核上用来实现同VLAN内二个终端间的二层报文快速转发的cache表项.
2、当有要发往无线客户端的下行流量时,由于1中已经删除了所有快转表,因此报文会在数据核上走普通转发流程,并重新创建快转表.
快转表的创建是数据核通过核间消息上报给控制核的,消息上报走的是default队列.
控制核在收到消息并创建快转表的过程会由于查寻不到下一跳网关的ARP而失败.
数据核上的下行数据报文也会因为没有ARP表项而发送失败被丢弃.
由于下行持续有流量,就会有持续的学习快转表项的核间消息,从而造成default队列的持续拥塞.
3、AC定期会向AP发送LWAPP控制报文,该报文的发送过程由于查不到网关ARP表项触发ARP学习.
网关回应的ARP报文首先由AC的数据核接收并通过核间消息队列上报给控制核.
由于ARP报文上报所采用的硬件队列与default队列是同一个,并且ARP报文的数量远小于2中default队列的报文数量,因此ARP报文很容易被丢弃掉,导致网关ARP一直学习不到.
4、当AP由于长时间收不到心跳回应而大量掉线后,发往无线客户端的LWAPP下行流量会明显减少,通过defualt队列通知控制核建立快转表项的消息相应地减少,ARP报文的丢失概率也会降低.
当有一个网关ARP回应通过核间通道被送到控制核后,AC上重新学习到网关的ARP,同时下发数据核转发表项,并删除控制核上的ARP黑洞.
此时,AC到AP的下行通路恢复,掉线的AP重新上线.
上述实验室复现过程与该局点11月10日晚间的故障现象一致,因此可以确定导致10日晚间1号楼AC故障的原因就是AC上的网关ARP丢失.
至于网关ARP丢失的原因,根据已有的现象推测是网关ARP表项在老化前(默认为该ARP表项学到后的第19分钟)向S95E网关发送单播ARP请求进行老化刷新时,S95E回应的ARP报文在AC上由于受到冲击而被丢掉(AC上23:57的ARP统计显示这一分钟内有大约1200个ARP丢包),导致刷新失败、ARP表项被老化.
从现场11月11日00:03:29收集的诊断信息里显示,AC上S95E网关ARP表项的老化时间是14分钟(如下),说明该ARP表项是在11月10日23:57左右学习到或刷新的,时间上与前面的推断吻合.
四、对ACCPU高的分析有关故障期间ACCPU出现100%的情况,通过分析现场11月11日03:29收集到的ACCPU历史记录可知,第一次100%高峰发生在59:29秒左右,此时正是前期掉线的AP重新上线的过程,同时伴有大量的无线客户端重新认证上线,CPU高是正常的.
=====CPUusageinfo(no:0idx:18)=====CPUUsageStat.
Cycle:60(Second)CPUUsage:100%CPUUsageStat.
Time:2015-11-1023:59:54CPUUsageStat.
Tick:0x13a52(CPUTickHigh)0x1ea9d94f(CPUTickLow)ActualStat.
Cycle:0x0(CPUTickHigh)0xee6b9ec7(CPUTickLow)TaskNameCPURuntime(CPUTickHigh/CPUTickLow)INFO16%0/26362da8DT1X4%0/994f62fRDS10%0/1957376fPSEC14%0/229d5017WMAC27%0/422d1c3b问题结论(1)根据研发实验室模拟仿真结果及分析,确定本次1号楼AC故障是由AC上的网关ARP表项老化导致.
(2)现网AC版本软件处理不合理,导致网关ARP老化后长时间学习不到,最终AP大面积掉线.
(3)故障期间出现ACCPU达到100%的情况,是由于AP及无线客户端重新上线导致,属正常现象.
(1)为了避免AC上再次出现由于网关ARP老化导致AP大量掉线的问题,建议在所有的AC板卡上通过静态ARP的方式将网关ARP绑定.
另外,建议同时在S75E将所有AC板卡的ARP表配置为静态,避免由于AC上的ARP冲击导致S75E无法学习到AC的ARP的问题.
(2)升级B109最新版本R2509P46,此版本中包含以下几部分修改:·调整ARP报文上送控制核的优先级,调整后优先级高于default队列的优先级;·针对上送CPU的协议报文,尤其是default队列中的报文,增加协议报文类型的细分识别;·增加按协议类型对上送CPU的报文进行限速的功能;·新增在CPU高时收集记录各种统计信息的功能,有助于后续的维护及问题定位,也可以为未来做进一步优化提供依据.

RAKsmart(年79元),云服务器年付套餐汇总 - 香港 美国 日本云服务器

RAKsmart 商家从原本只有专注于独立服务器后看到产品线比较单薄,后来陆续有增加站群服务器、高防服务器、VPS主机,以及现在也有在新增云服务器、裸机云服务器等等。机房也有增加到拥有洛杉矶、圣何塞、日本、韩国、中国香港等多个机房。在年前也有介绍到RAKsmart商家有提供年付129元的云服务器套餐,年后我们看到居然再次刷新年付云服务器低价格。我们看到云服务器低至年79元,如果有需要便宜云服务器的...

wordpress通用企业主题 wordpress高级企业自适应主题

wordpress高级企业自适应主题,通用型企业展示平台 + 流行宽屏设计,自适应PC+移动端屏幕设备,完美企业站功能体验+高效的自定义设置平台。一套完美自适应多终端移动屏幕设备的WordPress高级企业自适应主题, 主题设置模块包括:基本设置、首页设置、社会化网络设置、底部设置、SEO设置; 可以自定义设置网站通用功能模块、相关栏目、在线客服及更多网站功能。点击进入:wordpress高级企业...

易探云服务器怎么过户/转让?云服务器PUSH实操步骤

易探云服务器怎么过户/转让?易探云支持云服务器PUSH功能,该功能可将云服务器过户给指定用户。可带价PUSH,收到PUSH请求的用户在接收云服务器的同时,系统会扣除接收方的款项,同时扣除相关手续费,然后将款项打到发送方的账户下。易探云“PUSH服务器”的这一功能,可以让用户将闲置云服务器转让给更多需要购买的用户!易探云服务器怎么过户/PUSH?1.PUSH双方必须为认证用户:2.买家未接收前,卖家...

arp断网攻击为你推荐
杭州市西湖区翠苑第四幼儿园智慧校园采购项目支持ipad支持ipad支持ipad支持ipad模块iphone特斯拉苹果5win10445端口windows server2008怎么开放4443端口tcpip上的netbiostcp 协议里的 netbios . 在哪,找不到重庆电信网速测试如何测量网速
网站域名 西安域名注册 免费主机 la域名 服务器cpu性能排行 北京主机 魔兽世界台湾服务器 合肥鹏博士 卡巴斯基试用版 免费phpmysql空间 东莞idc shuang12 英国伦敦 西安主机 中国联通宽带测速 宿迁服务器 云销售系统 国外免费网盘 免费赚q币 百度新闻源申请 更多