子网小心DNS故障引发子网流量异常

dns故障  时间:2021-03-15  阅读:()

小心DNS故障引发子网流量异常

这是笔者最近亲历的一起网络故障故障比较典型排错思路比较可取。我把这个过程写下来和大家分享希望能够帮助到你。

1、症状描述

客户来电报告中心主网络则基本正常而一个子网突然变慢。这是本地铁通网络服务公司该公司为普通用户提供Web服务和Internet接入服务。前几天其服务的一个片区的用户反映网络速度很慢发Emai l也需要等待超过60秒以上的时间才能联通。这个片区被划分为一个子网从主机房的网管系统上观察发现除了该片区(子网)路由器流量很高以外(测试为97%) 中心网络的路由器与其它子网的交互流量均为40%以下。此外没有其它特别现象。

2、诊断过程

铁通的维护人员自行进行了网络排错可惜没有找到故障所在 由于不能断开网络停止用户服务来进行检查于是求助于我们本人被派出诊。应该说从症状上看这个故障比较简单只要查出子网的路由流量来源就可以很快确定故障方向进一步则立即可以查出流量源。

从网络拓扑图上看故障子网与中心网络为E1链路。故障子网下面有一个营业厅一般只与中心网络交互一些业务数据应该不会有太大的流量。此外该子网下的Web服务器数量为45台 中心的网管系统报告97%的流量肯定是过高的。

笔者考虑只有一种情况可以比较多地占用E1通道的有效流量那就是故障子网下的网站与中心网络的网站或服务器之间有多媒体文档的传输或者下载业务才会造成这种情况。不过询问管理人员得知中心网络并不提供诸如多媒体视频的播放和下载服务那只能借助工具进行检测了。

由于故障网络规模比较小中心网络的网管系统只支持到路由器一级的管理交换机和服务器等采用的是廉价的桌面交换机所以无法支持网络管理。将网络测试仪接入交换机进行测试启动便携网管功能可以看到路由器的流量和网管系统观测的到的流量是相同的均为97%左右。

查看中心网络处与此相连的路由器流量也是997%左右这说明路由器通道链路性能基本正常。不过这样高的通道流量必然导致路由器拥塞和丢包所以从流量的角度看又是不正常的。现在需要了解的是如此高的路由流量是从哪里来的 以及数据包到达路由器以后的去向等。这样就可以很快定位导致如此之高的通道流量的数据源和拥塞源。

将网络流量分析仪接入网络的路由器通道进行监测和分析结果显示95%流量流向了业务数据服务器且多数为HTTP和Email方面应用。其中 Internet访问流量占88%本地流量占7%。查看流量分析仪指示的流量来源分布图没有发现集中的流量应用 IP地址分布比较均衡最高的流量只占0.5%。这些数据表明用户的应用比例均衡故障原因应该在应用过程中而不是某个集中的用户“轰击”比如黑客等。也就是说应该是应用的过程和通道出了问题。其原因是这些流量按通道设计不应该到达营业厅网络的业务服务器而是应该直接从中心网络的Internet主路由器进入互联网。那么这些流量是如何被引导到营业厅服务器方向上来的呢?

下面我们进行进一步的分析大家知道IP数据包在传输过程中会在路由器中作地址解析(ARP)或是在本地DNS中进行域名分析。如果这些分析路径出问题则IP数据包的传输和交换就会出问题。根据流量分析仪的指示笔

者任意选择了10个IP地址做路由追踪测试用网络测试仪追踪的结果是他们都要经过一个DNS服务器。而模仿营业厅网络成员分别对已知的本地和外地用户做ICMP监测和路由追踪测试结果发现ICMP监测中重定向数据包占82% 目标不可达数据包数量占13%。这表明只有约2%的用户能一次性出入正常路由到达目标站点其余95%的IP数据包都要经过路由竞争或重新发送才能有部分机会到达目的地。

由此可以重点检查主路由器的路由表和DNS的转换表。 由于多数Internet访问流量被引导到了营业厅业务服务器所以可以重点检查DN S服务器。用网络测试仪对DNS服务器做查询观察查询结果发现DNS转换表有相当大的比例指向了营业厅子网中的业务服务器。笔者怀疑是DNS服务器出了问题!

于是通知中心网络的网管人员将DNS服务器重新启动并快速设置一次稍后网络管理人员报告网络业务恢复正常。用网络测试仪的Internet工具包查询DNS服务器可以看到指向营业厅业务服务器的数据已经全部消失这表明网络已经完全恢复了正常工作。但好景不长约3分钟后故障重新出现仍有97%的通道流量被指向了子网。

由于DNS服务器只设置了一台没有备份或备用服务器于是不得不立即来到中心网络机房对DNS服务器及其周围设备进行检查。测试服务器网卡和与路由器的电缆正常。为了不中断服务笔者让网管人员在另一台备用服务器上临时安装设置了DN S服务器。经过短暂的业务中断后更换上的新DN S服务器开始投入适用。只见子网路由器的流量立刻降低到了1.5%。经过30分钟的稳定工作后所有用户均恢复到正常工作状态故障消除。

3、故障原因

大家知道 DN S服务器用于将用户域名转换为IP地址一般来说不会出现什么问题。但由于某些原因造成了类似本例的中转换地址统统指向了营业厅子网的业务服务器。业务服务器不具备路由处理功能对发送来的IP数据包要么拒收并置之不理要么返回目标不可达或需要重定向的报告数据包。这就是我们在I CMP监测时经常观察到的现象。

本地铁通的用户数量并不多而且与上级网络的链路带宽为155M的AT M链路大有富余所以上Internet的用户其上网速度主要受子网带宽的影响。因为许多的用户要经过拥挤的无效E1链路造成路由重定向和严重的时延。大量的IP数据包拥向只有2M带宽的子网路由器流量达到了97%造成子网工作速度突然变慢路由器出现严重拥塞等现象。

4、两点建议

(1).DNS服务器要定期“体检”

基为了防止DNS服务不稳定造成业务中断或出错不少网管人员在设置DNS服务器时都安装了备用DNS服务器亦即安装不只一台DN S服务器。但这样做也会带来一个潜在的危险 即主DNS服务器出问题备用自动服务器投入运行这样会牺牲一定的网络带宽使得系统总体性能有所下降。危险在于性能的下降常常是在不知不觉中来到的。所以为了保证网络经常处于良好的工作状态 网络管理人员需要定期检查DN S服务器的转换表。本故障中的DN S指向错误导致用户的IP数据包对准了子网服务器但如果对准的不是服务器而是中心网络本地网段中的某台机器则故障强度会减弱用户不会感到非常明显的速度变慢。这样可能不会感到明显的“身体不适”从而使得网络长期带病运行。就象人一样定期的体检对及时发现疾病及其隐患是非常必要的。而如何及时发现路由优化方面的问题也是网络定期项目测试中的内容之一对大型网络则更有必要必须坚持定期维护和测试。

(2).网络状况的实时监控

许多网络设备如路由器、交换机、只能集线器等都支持SN MP网管功能但为了全面监测网络通道功能还需要网络设备支持全面的RMON和RMO N2。用这样的设备组建起来的网络其管理和故障诊断功能是很不错的。但现实的问题是这样的网络设备价格是普通网络设备的610倍左右用户难以接受。因此为了随时监测网络的服务应用流量及其比例、来源工作记录以及必要时进行解包分析建议用户在重要的服务器通道或路由通道上安装监测接口。 以便必要时可以随时将流量分析仪、 网络测试仪接入通道进行监测和分析。这样本故障的查找时间可以缩短到20分钟左右。当然如果资金允许也可以将流量分析仪长期接入通道对多个重要的网络设备进行全速率透明流量监测这样可以把故障定位时间缩短到1分钟以内。

这次“出诊”总的来说还算顺利其实每次出诊就是一次学习和提高的机会。也许上述案例只是个案你可能不会遇到但排错思路还是值得大家借鉴的。另外最后的两点建议我希望能够引起大家的重视。

RAKsmart(年79元),云服务器年付套餐汇总 - 香港 美国 日本云服务器

RAKsmart 商家从原本只有专注于独立服务器后看到产品线比较单薄,后来陆续有增加站群服务器、高防服务器、VPS主机,以及现在也有在新增云服务器、裸机云服务器等等。机房也有增加到拥有洛杉矶、圣何塞、日本、韩国、中国香港等多个机房。在年前也有介绍到RAKsmart商家有提供年付129元的云服务器套餐,年后我们看到居然再次刷新年付云服务器低价格。我们看到云服务器低至年79元,如果有需要便宜云服务器的...

数脉科技:六月优惠促销,免备案香港物理服务器,E3-1230v2处理器16G内存,350元/月

数脉科技六月优惠促销发布了!数脉科技对香港自营机房的香港服务器进行超低价促销,可选择30M、50M、100Mbps的优质bgp网络。更大带宽可在选购时选择同样享受优惠,目前仅提供HKBGP、阿里云产品,香港CN2、产品优惠码续费有效,仅限新购,每个客户可使用于一个订单。新客户可以立减400元,或者选择对应的机器用相应的优惠码,有需要的朋友可以尝试一下。点击进入:数脉科技官方网站地址数脉科技是一家成...

ParkInHost - 俄罗斯VPS主机 抗投诉 55折,月付2.75欧元起

ParkInHost主机商是首次介绍到的主机商,这个商家是2013年的印度主机商,隶属于印度DiggDigital公司,主营业务有俄罗斯、荷兰、德国等机房的抗投诉虚拟主机、VPS主机和独立服务器。也看到商家的数据中心还有中国香港和美国、法国等,不过香港机房肯定不是直连的。根据曾经对于抗投诉外贸主机的了解,虽然ParkInHost以无视DMCA的抗投诉VPS和抗投诉服务器,但是,我们还是要做好数据备...

dns故障为你推荐
陈嘉垣陈浩民狼吻陈嘉恒是什么时候的事同一ip网站最近我们网站老是出现同一个IP无数次的进我们网站,而且是在同一时刻,是不是被人刷了?为什么呀?www.qq530.com谁能给我一个听歌的网站?www.vtigu.com初三了,为什么考试的数学题都那么难,我最多也就135,最后一道选择,填空啊根本没法做,最后几道大题倒www.javmoo.comjavimdb怎么看www.se222se.com原来的www站到底222eee怎么了莫非不是不能222eee在收视com了,/?求解lcoc.top日本Ni-TOP是什么意思?lcoc.toptop weenie 是什么?bbs2.99nets.com这个"风情东南亚"网站有78kg.cn做网址又用bbs.风情东南亚.cn那么多此一举啊!鹤城勿扰齐齐哈尔,又叫鹤城吗?
荷兰vps 韩国空间 长沙服务器 日本bb瘦 刀片式服务器 卡巴斯基试用版 免费测手机号 100mbps 怎么建立邮箱 空间首页登陆 服务器防火墙 114dns 空间服务器 umax 广州服务器托管 重庆联通服务器托管 镇江高防服务器 碳云 restart 美国代理服务器 更多