互联网服务质量分析与监控系统
一、项目背景
目前互联网维护工作仍然集中在设备、流量的监控上而这些并不能真正反映宽带用户的服务质量如DNS、 RADIUS系统的实际运行情况仅对设备本身的监控并不能反映城域网用户的实际感知、用户的认证情况这些重要指标却不能真正把握。
本系统通过对互联网宽带服务过程中涉及的用户异常掉线、宽带认证性能、互联网传输质量、 DNS性能、关键端口流量、用户流量、用户感知性能等多环节关键标的采集及关联分析建立起多维度的互联网服务质量指标的预警机制及评价体系。不仅能满足我公司互联网宽带运维管理的需求更是从互联网业务管理实际出发对“认证记录”、 “掉线记录”、 “疑似盗用帐号统计”、 “互联网多出口对比分析”、 “用户端口质量关联查询”、 “单用户流量成本统计”等热点问题提供了专业的解决方案。同时系统通过对网络运维数据与AAA认证数据的整合实现了从用户维度对互联网服务质量的监控管理,真正实现从“用户服务感知测量”到“网络指标监测”再到“网络优化调整”的运管流程的优化。
二、实现方案:
1. 整合对网管数据与AAA认证数据的整合实现从用户帐号维度对互联网服务
质量的监控告警与故障定位
2. 采用多线程采集及内存数据库技术应对大数据量消息采集与属性动态关联
机制
3. 实时监控企业用户关键服务指标针对异常情况可提供多渠道、多策略的告
警通知
4. 大数据量压缩与快速检索机制应对NAT、 DNS等海量数据存储与查询
系统采用标准的多层体系结构系统具有可伸缩、模块化等特点并在各个
层次上均易于与其他相关系统进行集成。
功能结构图如下所示
1
本方案充分考虑了管理规模和管理数目的差异允许用户根据网络发展和业务需要灵活选择部署方式。我们把业务逻辑层客户访问接入层数据库访问层均可以分开部署。基于流的镜像将集团、省和本地Radius服务器的流量DNS流量通过交换机端口镜像的方式镜像到流量分析服务器首先将集团、省和本地Radius服务器 DNS服务器流量汇聚到一台交换机流量分析服务器通过在此交换机上进行观测对流量数据的分析达到对关键指标的监控和分析拓扑图如下
典型的分布式部署方式如下
2
在城域网出口路由器上配置流量镜像
1、指定观察口/镜像口 说明 5槽镜像到5/1/9 6槽镜像到6/1/9interface gigabitethernet5/1/9port-observing observe-index 3interface gigabitethernet6/1/9port-observing observe-index 3
2.配置整板镜像的观测端口
[RouterB] slot 5mirror to observe-index 3
[RouterB] slot 6mirror to observe-index 3
3.定义ACL规则acl 3001rule permit udp source any dest any destination-port eq 53 //DNS上行流量rule permit udp source any source-port eq 53 dest any//DNS下行流量
3
rule permit udp source any dest 221. 176. 1. 138 //集团Radius上行流量rule permit udp source any dest 211. 138.200. 18 //省公司Radius上行流量rule permit udp source 221. 176. 1. 138 dest any //集团Radius下行流量rule permit udp source 211. 138.200. 18 dest any //省公司Radius下行流量
4.配置流分类定义基于ACL的匹配规则。traffic classifier RAD_DNSif-match acl 3001
5.定义流行为配置流镜像功能使能。traffic behavior RAD_DNS
port-mirroring enable
6.增加策略将流量策略增加到现有策略上traffic policy virclassifier RAD_DNS behavior RAD_DNStraffic policy traffic-policy-ge5/0/0classifier RAD_DNS behavior RAD_DNS
traffic policy traffic-policy-ge5/0/1classifier RAD_DNS behavior RAD_DNS
通过以上配置 Radius、 DNS关键指标流量均被分析服务器观测到分析服务器根据捕获的各种协议流量进行分析 以达到对关键指标如 Radius、 DNS等的分析和监控。
三、功能及解决的问题:
1、 Radius性能监控及故障预处理
根据捕获的Radius消息镜像分析认证成功率异常掉线原因和比率汇总认证失败原因分析和在线用户分析 同时提供Radius实时监控统计多端口用
4
户防止账号被盗用。
1) 宽带故障预处理
(1) 691原因查询
用户在拨号过程中经常遇到691错误在对Radius性能监控中专门对691错误进行监控和分析快速查询特定用户出现691错误的原因协助支撑定位故障点,而客服人员接到保障后可通过此系统对认证记录进行查询以较快的时间处理账号密码错欠费停机等问题降低故障处理时长。
(2)用户掉线原因统计
通过对Radius报文的分析统计所有用户异常掉线原因主动分析频繁掉线用户及原因快速、准确定位特定用户掉线原因及时发现并解决掉线问题提升用户满意度。
(3)在线用户查询
查询制定账号是否已经在线以及接入BRAS终端mac地址、登陆时间等信息便于客服人员处理由于账号已经在线导致用户拨号失败、以及账号被盗用的情况。
5
2) Radius实时监控
对不同Radius认证请求响应率进行监控实时显示设定阈值在响应率、认证通过率等超出某一值时主动告警通知维护人员。
3) 分析统计
(1) BAS接通率分析
分BRAS、时间对认证接通率进行统计实时监控BRAS与Radius之间认证报文的成功率对认证响应进行预警。
(2)认证响应延时统计
对Radius认证请求、响应延时进行统计定位BRAS设备与Radius服务器
6
之间的网络质量做到有目的的优化。
(3)多端口用户统计
通过对用户接入信息的分析统计出多端口用户知晓哪些用户在不同地点登陆有效维护移动公司权益。
2、 DNS性能监控及告警
1) DNS性能监控
通过镜像的DNS消息可以实现对全网中所有使用的DNS服务器进行统计对认证请求、响应情况的分析可以实时对比各个DNS服务器的健康状况起到对DNS服务器的实时监控对DNS服务器域名解析情况的统计解析失败原因的统计对全网中所有使用的DNS解析情况的统计根据这些信息可以对网络中使用的DNS进行调整。
(1) DNS实时监控
分时间段周期性对DNS请求响应情况进行统计分析实时监控DNS服务器的响应成功率和解析成功率当成功率低于某个值时可以触发告警通知维护人员进行处理。
7
(2) DNS解析失败原因分析
对DNS请求失败的报文进行分析分析各个失败原因的比率针对发生比率高的原因进行处理和优化。
(3) DNS解析统计分析
分时段5分钟、 1小时等对DNS服务器的解析情况的统计分析得出忙、闲时的DNS解析情况对比。
(4) DNS统计报表
对全网中用户使用的DNS服务器按日、月和年进行统计和分析。
8
2) 用户行为分析
用户上网过程中的DNS请求信息包括了所访问站点的域名信息回应报文中包含了站点的地址信息我们对全网中所有用户的DNS请求和响应信息进行统计和分析不仅可以实现对DNS健康度的监控也可以根据这些信息对用户行为进行分析可以得知哪些站点的访问比率较高哪些用户会倾向于访问哪些特定类型的站点有助于我们对网络进行优化。
(1) 用户浏览网站排行
对全网中所有用户的请求信息进行统计获得总的网站排行。
(2) 用户组浏览网站排行
对特定地址段的用户进行统计得出某个用户组内用户访问站点的排行。
9
mansora怎么样?mansora是一家国人商家,主要提供沪韩IEPL、沪日IEPL、深港IEPL等专线VPS。现在新推出了英国CN2 KVM VPS,线路为AS4809 AS9929,可解锁 Netflix,并有永久8折优惠。英国CN2 VPS,$18.2/月/1GB内存/10GB SSD空间/1TB流量/100Mbps端口/KVM,有需要的可以关注一下。点击进入:mansora官方网站地址m...
今天中午的时候看到群里网友在讨论新版本的Apache HTTP Server 2.4.51发布且建议更新升级,如果有服务器在使用较早版本的话可能需要升级安全,这次的版本中涉及到安全漏洞的问题。Apache HTTP 中2.4.50的修复补丁CVE-2021-41773 修复不完整,导致新的漏洞CVE-2021-42013。攻击者可以使用由类似别名的指令配置将URL映射到目录外的文件的遍历攻击。这里...
春节期间我们很多朋友都在忙着吃好喝好,当然有时候也会偶然的上网看看。对于我们站长用户来说,基本上需要等到初八之后才会开工,现在有空就看看是否有商家的促销。这里看到来自HMBcloud半月湾服务商有提供两款春节机房方案的VPS主机88折促销活动,分别是来自洛杉矶CN2 GIA和日本CN2的方案。八八折优惠码:CNY-GIA第一、洛杉矶CN2 GIA美国原生IP地址、72小时退款保障、三网回程CN2 ...