1. 用户需求分析
网络集中监测系统是为用户提供集中监测,集中维护和集中故障分析的高效系统。本方案的设计目标是全面覆盖企业的数据通信网络,为网管人员提供快速定位网络故障并解决网络问题的工具。
系统分为网络故障监测工具和业务性能监测两个部分,用户可以根据自己的需要选用全部或部分的组件。
网络监测系统主要面向用户负责网络维护的工程师进行网络数据包的分析,跟踪和统计。系统同时提供了集成的 SNMP和RMON统计功能。监测系统为用户提供以下功能:
( 1) 为网络提供集中监测系统。通过中心端对网络的各个网段进行分析和测试。从而建立快速和集中的故障分析诊断系统。
( 2) 提供所覆盖的所有网段的统计分析功能。通过公司的网络探针,可以对网络进行基于RMON的统计和分析功能。统计项目包括流量分布,协议分布,用户分布等内容。
( 3) 提供故障专家诊断系统,对网络质量作出评价,同时对网络故障的分析和排除提供建议和帮助。
( 4) 提供100%的数据捕获和存储的功能,用户可以在中心平台上对数据包进行捕获和解码分析。
( 5) 支持超过400种协议的解码和统计功能。
业务分析系统是针对用户越来越强烈的业务保障需要开发的针对 IP业务的性能测试系统。通过这个系统,运营商可以快速有效的测试,发布和存储用户业务质量。同时可以对网络进行整体和分段的质量测试,从而快速的定位和隔离网络故障。测试系统为用户提供以下功能:
( 1) 综合性网络质量测试,业务质量测试,网络协议分析的功能。彻 底解决了过去用户感知的业务质量和运营商测试的网络质量参数之间的不一致的问题。工程师在中心平台上即可以进行用户仿真测试,又可以对网络进行分段测试。
( 2) 独特的Web Agent技术提供极为方便的测试发布方式。用户只需 要登陆制定的网站,系统就可以自动对用户业务质量进行测试并将测试结果发布在 Web Server上。
( 3) 提供长期业务质量数据的集成功能,包括质量变化趋势,质量告 警和 SLA等功能。
本建议根据一个企业的网络结构作出。本监测系统包括总体方案和分布实施方案。
( 1) 本方案重点描述了总体方案的结构。总体方案包括了覆盖企业所有的网络,包括LAN,WAN,ATM。本方案配置的软件和服务器均包括了对所有以上网络环境的支持。本方案描述的功能均可以适用与所有肇庆网络的测试。
( 2) 本方案的必选配置只包括了对以太网部分的支持。作为工程的第一阶段,建议用户实施以太网的监测系统。作为第二步和第三步可以实施WAN和ATM的监测系统。
( 3) 工程的分布实施只需要扩充测试模块,不需要再增加软件平台和服务器。
2 监测系统功能配置
2.1 监测系统结构连接图
1 )NTC是故障监测中心软件,运行在网管中心,通过各个网络探针收集的RMON信息对网络进行全面的统计。同时可以对网络进行数据捕获和解码。
2)如果需要进行进行业务性能分析,需在监测中心加装Application Analyzer分析软件。

系统的总体配置如图所示,根据用户的需求,需要 7个分布式网络探针,一套故障检测中心软件和一套业务分析中心软件。本方案可以根据用户的需求近一步增加ATM和E1的测试模块,不需要在增加软件配置。
2.2 测试方案设计
测试系统执行网络故障分析的步骤:
( 1) 用户通过NTC的自动网络性能扫描(雷达图)和网络快照观察网络是否存在故障以及产生故障的时间点。
( 2) 观察网络的RMON统计数据和基线,包括协议分析,用户分析,数据包长度分布,利用率变化等。
( 3) 定位出现问题的地址(使用TOP N功能),观察特定地址的统计信息。
( 4) 启动数据捕获和解码功能,分析数据包的七层解码。
( 5) 根据专家系统给出的建议进行网络故障排除。
业务性能测试是监测系统的独特功能,测试系统执行用户测试功能的步骤如下:
( 1) 用户打开浏览器并访问管理员公布的URL地址。
( 2) 用户点击Web Agent按钮加载Web Agent。
( 3) Simulation Center自动发现已经登陆的用户,并对用户的业务性能如TCP的吞吐率,时延,抖动;FTP/HTTP的吞吐率等参数进行测试。
( 4) Simulation Center将测试结果传递集成的Sybase的数据库。数据库搜索该用户的历史记录并将最新结果加入。
( 5) 将用户的测试结果形成业务性能基线并在业务质量公告Web Server上发布。
( 6) 用户关闭浏览器,测试代理自动消失,测试结束。

测试中心的配置
3 监测系统功能配置说明
3.1 系统容量配置说明
1)系统包括7个10/100M以太网测试模块,其中是4个光纤接口的以太网测试模块。
2)使用一个故障监测中心,可以同时控制并采集所有测试模块。
3)系统允许最多20个管理员在本地或通过远程接入故障监测中心进行网络分析和统计。
4)业务测试中心可以支持同时对10个用户进行业务测试。
3.2 硬件配置说明
服务器类型 |
功能应用 |
| 用户性能监测服务器 |
提供用户的业务测试功能。控制 Web Agent,Cisco SAA和永久Agent。对终端用户提供丢包,延时,抖动,吞吐量测试,测定用户指定网站的下载速率和时延等。 |
| 故障分析服务器 |
为网管工程师提供业务故障检测功能,提供分布式的网络分析,包括 RMON,SNMP统计功能集成;数据包的捕获和解码;故障检测的专家系统等功能。 |
| 监测系统工作站 |
对各个服务器进行远程访问和控制的网管工程师工作终端 |
| 分布式测试模块 |
网络探针,为用户提供协议分析,解码,统计和 RMON代理功能。 |
3.3 软件配置说明
企业的网络监测系统软件包括以下三个部分:
用户业务质量个性化服务系统
用户通过浏览器访问运营商指定的 URL ,测试系统即会自动测试用户的业务质量。用户可以通过 Http 的方式浏览自己业务性能的即时和历史信息。
监测系统中提供的用户业务性能参数包括:
-
网络最大吞吐量
-
FTP , Http 性能参数
-
上行 TCP 延迟,抖动和吞吐量
-
下行 TCP 延迟,抖动和吞吐量
-
上行 UDP 的延迟,抖动,吞吐量和丢包率
-
下行 UDP 的延迟,抖动,吞吐量和丢包率
软件类型 |
功能应用 |
| 基本应用分析 |
FTP 上传性能测试, FTP 下载性能测试 Http 性能测试
Web Server 可用性测试 |
| 端到端性能测试 |
TCP 性能测试(吞吐量,时延,抖动) UDP 性能测试(吞吐量,丢包,时延)吞吐率测试(自动测试用户能够获得的最大吞吐量)
Ping , Traceroute 测试
分段延迟测试 |
测试选项可由 Application Analyzer 的测试列表中选出,详细信息参见 Application Analyzer 的参考手册。
网络故障监测系统
当受到投诉后,网管工程师要求用户访问特定的 URL 加载测试代理。网管工程师通过 Application Analyzer 编辑脚本对用户终端和各个网端进行性能测试。
监测系统提供的测试功能除了用户业务质量测试中已有的功能外,还包括: 1 )高级端到端测试功能,包括带宽测试, SNMP MIB 和 RMON 的集成功能。
2 )高级网络测试功能,包括 Radius , DHCP , DNS , SQL 等测试功能。
3 )流量拓扑测试功能,测试多个用户之间的交叉数据交换能力。
4 ) CISCO SAA 集成功能,使 SAA 成为测试代理的一部分。
5 )(可选)由 GPS 精确同步的长距离时延测试功能。
6 )(可选)通过分布式测试模块执行的 RMON 测试功能,协议解码和数据包捕获功能。
软件类型 |
功能应用 |
| RMON 功能 |
Top Talker 统计
协议分布统计
流量分布统计
网络健康状况统计
网络性能的快照和雷达图扫描 |
| 数据包的捕获和解码分析 |
100 %的数据包捕获
100ns 的时钟精度
超过 400 种协议解码功能
七层解码
可编程的过滤器 |
| 故障监测专家系统 |
自动的网络性能评分
网络评论员功能,指导故障监测和排除对话分析,协议统计和告警分析功能 |
| SNMP 集成 |
可设置的 SNMP 参数
读取 SNMP 参数
读取 SNMP Trap |
| 分布测试功能 |
测试模块自动发现,集中配置
测试数据间的自动关联
远程接入控制功能 |
具体可用测试项目和编程函数请参见 NTC 的手册。
3.4 使用宽带网性能监测系统
根据数据网的网络状态、拓扑结构和业务状况,建议采用以下工作流程,对通证券数据网进行全面、深入地实时健康状况监控、性能问题验证和具体故障定位。
1. 实时的网络健康状况监控: 由于企业的网络承载着重要业务 , 为了尽量减少网管业务的网络流量和对各关键网元节点的影响 , 数据网监测系统采用 HP OpenView NNM 作为网络监管平台 , 构建肇庆电力 IP 网络实时监测系统 , 采用 SNMP 协议对各关键网络节点读取其 MIB 中的相关信息 , 如:端口流量、 CPU 和 Memory 利用率、各 E1 链路状态等参数。解决方案中心还可对 OpenView NNM 进行适当的软件二次开发,将所有 E1 链路的状态信息通过一览表的形式直观地显示出来,从而便于网络维护人员一目了然地监控所有 E1 链路的情况。
2. 深入的 LAN 链路故障检测: 当 NNM 监测平台接受到相关 LAN 链路故障告警信息后 , 可通过 NNM 监测系统平台 , 启动对 LAN 链路的测试功能,对该 LAN 链路进行从物理层到应用层的详细故障诊断,分析造成告警的根本原因。
3. 网络应用层故障和性能分析: 除了网络链路的故障外,用户还经常遇到许多和网络应用(如数据下载)相关的问题(如各个用户点到中心服务器的网络应用不可用或性能下降等)。这些问题不仅受网络链路故障的影响,还同网络性能、服务器和网络应用软件本身有关系。为了进一步定位这类问题,往往需要对网络吞吐率、时延、应用服务器的响应进行主动测试。当发生此类问题时,可动态下载 AA Web 代理到远程网段 , 进行业务层主动测试 , 自上而下 (Top-Down) 地诊断和验证网络潜在问题。也可设置 AA 永久代理 , 对应用服务器的可用性和性能进行定期测试,自动产生业务性能报告,从而及早发现网络性能问题,提前做好解决对策 , 提高最终用户满意度。
4. 分布式的网络故障分析: 对于许多复杂的网络故障,往往需要同时对多个相关的网段(如 WAN 链路和 LAN 链路)进行同时监控,并进行关联性分析,才能找到问题的根本原因。 NTC 是一个分布式的网络故障检测平台,可以同时对 E1 链路和 10/100M 以太网络链路(如 Cisco 75xx 路由器和 65xx 交换机之间的链路)进行监测和分析,从而分析跨网段的复杂问题。
5. 网络专家系统的网络质量报告和建议: 网络专家系统会自动给出网络质量报告和故障检查建议。 NTC 通过 RMON 数据会给出的网络流量分析报告和健康情况快照。通过这些报告和建议对网络质量进行监测和故障检测。
6. 数据包捕获和解码分析: 如果需要对数据交互过程进行比特级的监测和分析,启动数据解码功能对网络数据进行 100 %捕获和数据解码。通过提供的过滤器可以根据特定的业务交互过程和网络地址进行数据追踪分析。
系统功能框图如图示:
4 宽带网性能监测系统特点 
4.1 RMON 测试功能和协议分析仪功能的完整结合
系统将协议分析仪的功能和 RNON 测试功能完整的结合在一起。传统的分布式测试系统是基于 RMON 探针,只能提供 RMON 的统计数据,不能提供网络的 100 %数据捕获和解码。而传统的协议分析仪只能提供数据的捕获和解码功能,不能提供分布式的 RMON 统计功能,从而缺乏全网的统计功能。在实际工作中,这两者都是十分重要的。 NTC 是目前业界唯一将两个功能完全集成的系统。
4.2 提供真正的端到端用户业务性能分析
业务分析器是业界唯一可以提供业务性能分析的工具。网管工程师经常遇见如下的问题:用户反映网络速度很慢,而测试网络参数却一切正常。这是因为网络性能参数和用户的业务性能参数存在不一致造成的。
这是可以利用 Agilent Application Analyzer(AA)提供业界领先的业务性能测试工具。AA是为在分布式网络环境中跨越网络的点到点的性能测量而设计的。AA提供了广泛的测试功能,用户可以迅速创建一个测试方案,对不同业务点间的性能进行分析。主要的输出内容包括:响应时间,间隔时间,数据包丢失率,延迟和各种业务的执行过程等。这些内容对于整体业务性能的测试非常重要。AA提供了独特的基于Web的测试代理技术,用户可以在网络维护的中心端很容易的将测试点分布到所监控的各个远端网络中去,不需要另外在远端安装软件,这为网络的“按需测试”创造了条件。用户可以通过AA提供的内置业务测试脚本迅速测量各个常用业务点之间的业务性能,从而快速分离数据帧延迟和应用业务延迟。通过AA用户可以测试以下重要的业务指标:
-
端到端的 TCP/UDP 吞吐量,时延,抖动和丢包
-
单向或双向的网络时延
-
业务性能测试, AA 内置了 Http , Ftp , Radius , DNS , mail , DHCP 等主要的网络应用协议的自动性能测试脚本
-
流量产生和网络负载能力测试
-
支持多路业务仿真和性能测试
-
基于 Web 的测试代理,可以将测试点快速分布到远端网络
-
提供基于 Web 的自动测试报告系统和测试管理系统
-
测试 E1 链路的吞吐量,丢包,时延
-
用户可以编辑自己的测试脚本
-
测试 SQL 数据库应用的交互响应时间和延迟
4.3 利用应用最广泛的HP OpenView NNM作为数据网监测系统网管平台, 可以迅速地发现和解决问题,以及主动地管理您的网络,以保证它能够随时随地正常工作.
-
自动地搜索您的网络,帮助您了解您的网络环境。
-
第三层和第二层环境 *进行问题根本原因分析;这种内置的功能可以动态地根据您网络中的变动进行调整。
-
为您的网络提供可以定制的图和子图,从而让您可以按照您所希望的方式查看网络的结构。
-
提供故障诊断工具,帮助您快速解决复杂问题 。
-
收集主要网络信息,帮助您发现问题并主动进行管理 。
-
为您提供即时可用的报告,帮助您提前为网络的扩展制定计划。
-
让网络维护人员、管理人员和客户可以通过 Web从任何地方进行远程访问 。
-
通过它的分布式体系管理大型的网络 。
-
提供有针对性的事件视图,以便迅速地发现和诊断问题 *
-
提供一个增强的 Web用户界面和一些用于动态更新设备状态的新视图
-
支持由多种平台构成的第二层 交换网络( LAN 和 WAN )
4.4 为用户提供二次开发服务
在此系统平台上可以为用户开发更多的与业务质量和网络质量相关的功能。基于此系统采集的数据,系统为运营商建立用户业务质量和网络质量的长期,详细数据仓库,能够为运营商的市场决策,用户分析和新业务引进提供有力的支持。