欢迎访问一起赢论文辅导网
本站动态
联系我们
 
 
 
 
 
 
 
 
 
 
 
QQ:3949358033

工作时间:9:00-24:00
硕士论文
当前位置:首页 > 硕士论文
基于灰色最小二乘支持向量机的网络流量预测系统设计与实现
来源:一起赢论文网     日期:2013-06-02     浏览数:3773     【 字体:

                                    摘 要

目前网络行为特征日趋复杂,随着 Internet 飞速发展,这给网络规划、网络管理带来了巨大的挑战,矛盾也日益突出,进行网络流量分析进而建立有效的网络流量模型是当前网络研究的热点问题之一。网络流量特征研究和分析是深入理解网络内在本质、了解网络运行状况的根本方法和手段,是网络性能提升、优化网络设计和实施流量工程的重要途径。本文基于灰色理论和最小二乘支持向量机(LSSVM),建立新的网络流量预测模型。根据实际网络中测量得到的网络流量数据,进行实例分析,结果证明,新模型和算法预测误差低,且具有普适性。针对网络流量预测,本文主要做了如下工作:

(1)在深入研究灰色 GM(1,1)预测模型及其改进方法的基础上,针对影响预测模型精度的原因,考虑新旧数据对预测的影响,本文提出了加权处理原始数据的方法,并给出了一种更合理更简单的重构模型中背景值的方法及对初始值的估计。

(2)在对支持向量机进行深入研究的基础上,基于网络流量数据的特点,本文提出了动态稳健 LSSVM 模型。为了验证稳健 LSSVM 算法的正确性和有效性,分别利用一般 LSSVM 模型和稳健 LSSVM 模型进行仿真实验。

(3)根据灰色模型与最小二乘支持向量机的结合方法,以及模型对数据处理的特点,本文将灰色最小二乘支持向量机分为三类:并联型、串联型和残差型。通过实验结果表明组合预测模型能有效的提高预测的精度,比单一模型具有更高的拟合精度,具有一定的应用价值。

(4)本文以灰色最小二乘支持向量机预测模型为主体结构对网络流量预测系统的主要结构进行设计。网络流量预测系统的主要功能模块可分为三个:流量的数据整理模块、流量预测模块和流量图生成模块。本文所设计的预测系统通过大量实验获得最佳预测模型,应用该系统能有效预测短期内网络流量的变化,进行信息预报,为网络规划、网络管理做出了积极有益探索。

关键词:网络流量,灰色理论,支持向量机,组合预测,预测系统

目 录

第一章 概论.................................................................................................................. 1

1.1 论文研究的目的与意义.................................................................................... 1

1.2 网络流量预测问题的研究现状........................................................................ 2

1.3 本文研究思路与内容........................................................................................ 4

第二章 灰色预测模型.................................................................................................. 6

2.1 灰色理论的基本思想........................................................................................ 6

2.2 GM(1,1)模型 ...................................................................................................... 8

2.2.1 GM(1,1)模型建模方法 ........................................................................... 8

2.2.2 GM(1,1)的精确度评价和适用范围 ....................................................... 9

2.3 GM(1,1)模型的改进 ........................................................................................ 10

2.3.1 处理初始序列 ...................................................................................... 10

2.3.2 修正 GM(1,1)模型 ............................................................................... 10

2.4 动态 GM(1,1)灰色预测模型 .......................................................................... 13

2.5 网络流量预测的重要评价指标...................................................................... 14

2.6 实例分析.......................................................................................................... 14

2.7 本章小结.......................................................................................................... 16

第三章 支持向量机预测模型.................................................................................... 17

3.1 支持向量机的理论基础.................................................................................. 17

3.1.1 机器学习的基本问题 .......................................................................... 17

3.1.2 统计学习理论的核心内容 .................................................................. 18

3.1.3 结构风险最小化 .................................................................................. 19

3.2 动态稳健最小二乘支持向量机...................................................................... 20

3.2.1 最小二乘支持向量机(LS-SVM)......................................................... 20

3.2.2 稳健最小二乘支持向量机 .................................................................. 21

3.2.3 动态最小二乘支持向量机 .................................................................. 23

3.3 实例分析.......................................................................................................... 24

3.4 本章小结.......................................................................................................... 25

第四章 组合预测模型................................................................................................ 26

4.1 组合预测概述.................................................................................................. 26

4.2 灰色最小二乘支持向量机模型...................................................................... 27

4.2.1 并联型灰色最小二乘支持向量机 ...................................................... 27

4.2.2 串联型灰色最小二乘支持向量机 ...................................................... 29

4.2.3 残差型灰色最小二乘支持向量机 ...................................................... 30

4.3 实例分析.......................................................................................................... 30

4.4 本章小结.......................................................................................................... 33

第五章 网络流量预测系统的设计与实现................................................................ 34

5.1 网络流量预测系统架构.................................................................................. 34

5.1.1 网络流量预测系统各模块功能说明 .................................................. 34

5.1.2 系统开发环境 ...................................................................................... 35

5.2 流量图生成模块的实现.................................................................................. 36

5.2.1 MRTG 的结构....................................................................................... 36

5.2.2 MRTG 的应用及配置........................................................................... 37

5.2.3 RRD 数据库 .......................................................................................... 38

5.3 流量采集功能模块.......................................................................................... 40

5.3.1 WinPcap 在网络抓包中的应用........................................................... 40

5.3.2 数据抓包流程图 .................................................................................. 40

5.3.3 流量采集模块的设计 .......................................................................... 42

5.3.4 数据包存储过程 .................................................................................. 42

5.4 网络流量的预测模块...................................................................................... 44

5.4.1 网络流量预测模型的总体设计 .......................................................... 46

5.4.2 实现采用灰色最小二乘向量机的网络流量预测模型 ...................... 49

5.5 实验与应用...................................................................................................... 54

5.6 本章小结.......................................................................................................... 55

第六章 测试与分析...................................................................................................... 56

6.1 实验环境 ................................................................................................. 56

6.2 LSSVM 性能实验与实验数据结果分析................................................ 56

6.3 预测模型结果分析 ................................................................................. 60

6.4 预测模型在网络流量预测系统中的应用 ............................................. 61

6.5 本章小结.................................................................................................. 62

第七章 总结与展望.................................................................................................... 63

致 谢............................................................................................................................ 64

参考文献........................................................................................................................ 65

                                      第一章 概论

1.1 论文研究的目的与意义

Internet 技术和应用在国民经济的迅速发展下得到了突飞猛进的飞跃,Internet技术也越来越深入人心,被更多的人的关注和应用。根据中国因特网中心 CNNIC[1]的最新的调查统计结果显示:到 2010 年的上半年为止,中国互联网用户已经超过四亿,因特网普及率持续上升达到约 32%,相比较于半年前增加了 3600 万人,因特网普及率增长到 31.8%,相比较于半年前增加了将近三个百分点因特网的数据流量特点十分复杂,因为带宽在不断增加,实时和多媒体应用不断普及并且用户规模几乎是以指数形式不断增加的。现在到处都能看到因特网的存在,像政府机关、企事业单位以及各个高校等几乎所有组织机构都进行了网络化建设。通过因特网可以很方便的解决很多事情,如协同管理、信息发布、借以降低成本、提高生产力。但是由于因特网还没有较好的管理层,导致这些机构的执行效率逐渐降低,甚至给他们增加一些头疼的问题。主要表现在以下两点:

首先,网络中滥用带宽的现象严重干扰和妨碍了用户们的合理网络需求。网络有很多在线下载工具,如 BitComet、电驴以及迅雷等,它们占据着本就有限的带宽资源,加剧了网络的拥挤状况,直接导致了网速慢而卡。此外,带宽紧张会严重妨碍那些对容量极为敏感的网络系统的正常运营,如网络视频会议、VOIP 等,宽带紧张还使根生于因特网的各种业务的效率大大减少,从而不能高效的保护网络业务。

其次,毫无监管的因特网隐藏着潜在危害。众所周知,在因特网有着许多的恶意站点,这些站点往往挂载着令人防不胜防的黑客软件、木马以及病毒等。如果不对这些恶意站点的访问、黑客工具的利用等做法加以监管,那么整个网络系统就可能存在文献,甚至严重到使网络瘫痪。

网络流量是所有影响网络特性的最主要的因素,它涵盖了用户上网的所有数据。然而采集网络流量困难,因此对网络流量的监控管理一直停滞不前,难以发展。为了让管理者随时获得各种信息设备的数据流量和运行现状,建立一整套网络测量监控体系是非常必要的。该体系主要包括以下功能:测量网络流量、分析和预测网络流量行为等,达到对现代因特网络的行为特行和性能特色具有充分的

认识和了解的目的,从而在确保和加强实际网络服务质量的基础上,推动因特网以及信息基础结构的不断前进。网络行为的指标体系、测量和预测办法、指标参数的测量以及预测结果分析与模型化、模型评级以及模型的自适应行,这些都是网络流量预测模型所要研究的内容。网络流量特性的研究里最为主要的一部莫过于网络流量的精确测量与预测。由于网络预测与测量一直遭受着高带宽、异构性和复杂性的制约,所以人们越来越重视网络测量、预测、监管等方面。为了能更好的分析网络的利用情况,使用户更加充分的使用网络资源,提高工作的效率,同时为完善网络监管、降低网络异常状况以及改善网络服务质量等一系列工作提供可靠的理论依据,这就要求获取做够多的用户的原始上网数据,并据此了解用户的用网规律及特点,从而搞清楚用户的网络行为。综上所述,该课题是有很可喜的现实应用前景,并且有很大学术价值和重大战略意义。

1.2 网络流量预测问题的研究现状

只有建立一个适当的模型,才有可能对网络流量进行精确的预测。而任何一个恰当模型的建立都是在对研究对象(网络流量)有了十分详细的了解的基础上得到的。通过调查,发现大多数文献的研究结果显示实际生活中的网络流量是一个非常复杂的问题,它具有很多的特点,如分形特性、长相关性[2][3][4]、自相似性等。

只有在了解系统的特性才能建立适当的模型,因为精确的预测模型需要包括网络流量的所有流量特性。如果所建立的预测模型不能全部或部分的体现实际网络的流量特征,那么该预测模型对现实网络的性能预测结果将会出现较大的偏差。也就是该模型对网络流量的预测过程太简单,导致结果不准确。随着网络流量特性的不断改变,国内外学者也逐渐给出了很多预测模型。一般可以按照预测时间长短以及平稳性等对当下众多的网络流量预测模型进行概括分类。它们由于构造机理的不同会有自己的特色。

早些时候,在不记录数据包的到达过程的情况下,通过对网络流量的探究发现它服从指数分布[5],从而产生了第一个预测模型:泊松模型。当利兰等人指出网络流量具有尺度特征后,泊松模型不再合适,这样就推动者网络流量预测的研究进入了一个新的时代[6]。按照平稳性来对目前的网络流量模型用于进行分类,主要有平稳型和非平稳

型两种。再对平稳型的预测模型按照预测时间长短来分类,可以分为短、长相关两类。短相关的平稳模型有:Markov 模型和自回归模型(AR)、自回归滑动平均模型(ARMA)以及自回归求和滑动平均模型(ARIMA)等;长相关的平稳模型有:分形的自回归求和滑动平均模型(F-ARIMA)等。非平稳模型主要有:神经网络模型[7-9]、小波模型等。下面主要从平稳模型和非平稳模型两个方面对网络流量的预测模型的发展历史进行简介:

1)平稳模型为了使实际网络中的非淡薄报道时间序列达到平稳化,邹柏贤[10,11]利用方差的方法处理时间序列,优化建立了 ARMA 模型。利用近年来发展迅速的灰色理论,程光、龚俭[12]从原始序列也即原始流量时间序列中分离出来趋势项,再利用趋势项对流量数据进行建模。抓住网络流量具有不同的特征这一特点,张爱萍、赵明旺[13]首先分别介绍了现有的几种典型的短相关平稳模型和长相关平稳模型,而后在此基础上分别加以分析、论述。基于此前研究中建立的 ARMA 模型,邹柏贤[14]提出新的网络流量预测方法,同时采取平稳化处理法,先对网络流量进行预处理,提高了预测的精确程度。

2)非平稳模型1987 年,国外学者拉皮德斯和法波先生率先将神经网络应用到网络流量的预测中来,神经网络预测时间序列方法从此在学术界得到重视[15-25]。基于时间相关的 BP 神经网络方法,刘杰、黄亚楼[26]建立了非线性网络流量预测模型,相对于传统的线性网络流量预测模型,新的非线性网络流量预测模型具有较高的预测精确度、自适应能力和鲁棒性。在流量分析这一问题上,王兆霞[27]等指出了利用最小二乘法来学习神经网络,最终成为复杂的网络流量的预测提供了很好的方法。冯海亮[28]等结合小波理论和 BP 神经网络理论,提出了以组合预测为特点的网络流量模型,而其不足之处是预测过程比较复杂,实现性不强。基于 FIR 神经网络发,林雪纲等[29]提出了 FIR 阶的以太网网络流量预测方法,其研究结果表明 FIR阶的选择依赖于网络的数据流的变化频率,当 Hrst 数接近一时,用 Wan 算法来研究的网络流量预测问题更恰当。在小波理论这一研究方向上,王新[30]提出了一种小波变换网络流量预测的办法。鉴于网络流量预测中的平稳模型的一些缺陷,文章[31-34]提出Elmen网络流量的预测模型,文章[35][36]给出了OIF ElmenOHF Elmen两种预测模型。尽管许多国内外专家对探究网络流量预测模型方面做了不懈努力,可是增强模型的适应能力、提高预测精确度和如何对特定系统进行动态预测等方面依旧是主要的研究任务,有待突破。

1.3 本文研究思路与内容

由上文的分析,我们知道了对网络流量进行分析、建模和预测具有非常深远大的意义,尤其体现在网络的性能评估方面。想要对网络流量进行较为准确的分析和仿真,甚至进行区域网络的和操控,就必须要建立符合实际网络流量统计特性的模型。所以文章致力于探讨灰色系统理论和最小二乘支持向量机制这两种算法对于网络流量的预测。文章首先对灰色系统(GM)和最小二乘支持向量机(LSSVM)两种预测模型的理论和建模机理进行研究,并提出了相应的改进方法。然后针对二者各自存在的缺陷,融合这两种预测方法达到优势互补的目的,提出三种有效的、可行的网络流量预测方案。主要研究内容及结构如下:

(1) 第一章,概论。介绍网络流量分析的现状,讨论网络管理中流量建模的意义,并且分析网络流量分析和预测的国内外研究现状,最后提出本文的主要工作和课题的意义。

(2) 第二章,灰色预测模型。在深入研究灰色 GM(1,1)预测模型及其改进方法的基础上,针对影响预测模型精度的原因,考虑新旧数据对预测的影响,本文提出了加权处理原始数据的方法,并给出了一种更合理更简单的重构模型中背景值的方法和对初始数值的估测。

(3) 第三章,支持向量机预测模型。在对支持向量机制进行深入研究的基础上,基于网络流量数据的特点,本文提出了动态稳健 LSSVM 模型。为了验证稳健LSSVM 算法的正确性和有效性,分别利用一般 LSSVM 模型和稳健 LSSVM 模型进行仿真实验。

(4) 第四章,组合预测模型。基于灰色模型与最小二乘法支持向量机制的结合方式,兼顾模型对序列的处理方式,文章将灰色最小二乘法支持向量机制分为以下类型:并联型、串联型、残差型。并联型:使用并联型的目的在于充分利用不同模型所提供的有用信息,防止单个模型出现丢失有用信息的情况,这样就能够互补,减少由于随机带来预测精确度的降低。

具体做法是:先分别利用 GM(1,1)模型和 LSSVM 模型进行灰色预测,在对两个的预测结果进行最优搭配,最后得到的预测结果更为准确。串联型:对同一初始时间序列,采用不同维数来得到不同的时间序列,分别对其建立模型,最终得到不同的预测结果。在对这些结果进行如下处理,以获得最为精确的值:使用最小二乘法支持向量机制可对各个预测值进行组合,使每个值都能表现出自己的优点,从而以不同的权重融入到最小二乘法支持向量机制中。残差型:对时间序列先采用 GM(1,1)模型提取具有确定性的趋势项,再采用最小二乘支持向量机模型提取具有不确定性的随机项。

    (5) 第五章,网络流量预测系统的总体设计与实现。分析网络流量预测系统的功能需求,给出了流量预测的系统结构。并简单介绍各模块的功能。如,采用 MRTG及 RRD 数据库的流量图生成模块,以及从网络中对原始数据抓取的实现等。(6) 第六章,总结与展望。文章进行了简要的总结,并对网络流量的预测方向做了一定的展望。

[返回]
上一篇:基于粒子群优化的最小二乘支持向量机天然气负荷预测方法研究
下一篇:基于改进最小二乘支持向量机的颗粒粒度软测量研究