欢迎访问一起赢论文辅导网
本站动态
联系我们
 
 
 
 
 
 
 
 
 
 
 
QQ:3949358033

工作时间:9:00-24:00
博士论文
当前位置:首页 > 博士论文
基于支持向量机的空间数据挖掘方法及其在旅游地理经济分析中的应用
来源:一起赢论文网     日期:2013-06-02     浏览数:4020     【 字体:

                                   摘 要

本论文根据旅游地理经济分析预测管理需求,就基于支持向量机的空间数据挖掘分类或回归的理论与方法以及在旅游地理经济管理中的应用展开了系统研究,建立了基于支持向量机的空间数据分类或回归挖掘模型与算法、特征选择算法,设计实现了面向旅游地理经济应用的数据挖掘软件。主要内容如下:

(1)提出了 SVM 若干算法。通过组合优化方法和最小二乘方法,以及多分类支持向量机方法,提出了 MC-COLS-SVM 分类机算法;通过组合优化方法,以及减少约束,降低问题复杂度,提出了组合优化 COLS-BSVR 回归机算法。提出了对于支持向量回归机特征选择的算法,并进行了实证分析。

   (2)构建了基于支持向量机的空间数据挖掘理论与方法体系。研究设计了基于支持向量机的空间数据挖掘工作流程与框架以及实现方法;基于MC-COLS-SVM 多分类组合优化思路,设计了空间数据分类算法;基于COLS-BSVR 组合优化最小二乘支持向量回归机思路,设计了空间数据回归算法。

   (3)提出了时政指数、景区景点分布指数,并成功应用于旅游地理经济分析之中。通过对旅游收入、游客人数、时政指数、景区景点分布指数、GDPCPI 等变量时间序列的统计描述分析及其它们对旅游地理经济影响分析,提取了旅游地理经济数据特征,设计了相应的旅游地理经济数据库。

   (4)建立了基于支持向量机的旅游地理经济预测模型。基于提出的COLS-BSVR 支持向量回归机算法,建立了基于支持向量机的旅游地理经济分析预测数学模型;设计了数据挖掘中的数据构造模式,验证了模型与模式的有效性。

   (5)建立了基于支持向量机的旅游地理经济风险管理模型。基于设计的空间数据分类算法、回归算法以及特征选择算法,结合旅游地理经济特征敏感性分析,建立了风险管理数学模型,验证了模型的有效性。

   (6)设计并实现了基于支持向量机的旅游地理经济数据挖掘软件。该数据挖掘软件分三层结构构建;各种数据采集预处理后,存入旅游地理经济数据库,通过基于支持向量回归机的算法运算,生成预测信息,供分析决策参考。

关键词:MC-COLS-SVMCOLS-BSVR;空间数据分类或回归;时政指数;景区景点分布指数;预测模型;风险管理模型;数据挖掘软件

 

目 录

摘要…………………………………………………………………………………I

图清单…………………………………………………………………………Ⅺ

表清单……………………………………………………………………………ⅪⅤ

绪论.............................................................1

1.1 引言.........................................................................................................................1

1.2 国内外研究现状.....................................................................................................2

1.3 研究意义.................................................................................................................9

1.4 研究内容.................................................................................................................9

1.5 论文的组织结构...................................................................................................12

1.6 小结.......................................................................................................................13

支持向量机理论及其算法改进......................................14

2.1 支持向量分类机基本理论...................................................................................14

2.2 支持向量分类机算法改进...................................................................................20

2.3 支持向量回归机基本理论...................................................................................25

2.4 支持向量回归机算法改进...................................................................................29

2.5 核函数与特征选择...............................................................................................31

2.6 数值实验...............................................................................................................35

2.7 小结.......................................................................................................................36

基于支持向量机的空间数据挖掘方法................................37

3.1 空间数据挖掘概述...............................................................................................37

3.2 基于支持向量机的空间数据挖掘流程与框架...................................................39

3.3 实现方法与算法设计...........................................................................................41

3.4 小结.......................................................................................................................45

基于支持向量机的旅游地理经济预测应用............................46

4.1 旅游地理经济数据库构建...................................................................................46

4.2 旅游地理经济数据指标统计分析.......................................................................53

4.3 基于支持向量机的旅游地理经济预测模型.......................................................58

4.4 小结.......................................................................................................................72

基于支持向量机的旅游地理经济风险管理 ............................73

5.1 旅游地理经济风险特性...........................................73

5.2 基于支持向量机的旅游地理经济风险管理模型.......................74

5.3 旅游地理经济风险管理策略.......................................82

5.4 小结...........................................................83

基于支持向量机的旅游地理经济数据挖掘设计与实现 ..................84

6.1 泰安市旅游地理经济特色...................................................................................84

6.2 基于支持向量机的泰安市旅游地理经济数据挖掘设计...................................85

6.3 数据挖掘软件功能实现.......................................................................................94

6.4 小结.......................................................................................................................99

结论与展望.....................................................100

7.1 主要研究成果与结论.........................................................................................100

7.2 主要创新.............................................................................................................101

7.3 研究展望.............................................................................................................102

参考文献.........................................................103

                            1 绪论

1.1 引言(Introduction

数据挖掘源于数据库技术引发的海量数据和人们利用这些数据的愿望。用数据库管理系统存储数据,用机器学习的方法分析数据、挖掘海量数据背后的知识,便促成了数据挖掘(Data Mining)的产生。概括地讲,数据挖掘的任务是从大型数据库或数据仓库中提取人们感兴趣的、事先未知的、有用的或潜在有用的信息。空间数据挖掘(Spatial Data Mining)旨在解决“空间数据海量而知识贫乏”的瓶颈问题[1]。支持向量机(Support Vector MachineSVM)是数据挖掘中的一项新技术,是借助于最优化方法解决机器学习问题的新工具[2]

从数学角度看,所研究的对象 具有的属性(特征),若有 个,即(,,,......,)1 23nX = xxxx,一般称为 维空间的一个点。当 n=1 时,称 X为直线上(一维空间)的一个点;当 n=2 时,称 为平面上(二维空间)的一个点;当 n=3 时,称 为三维空间中的一个点;当 n时,称 为 维空间中(或超空间)的一个点。

从哲学的角度、数学的角度,空间数据挖掘即是 n时的 维数据挖掘。三维空间、多维空间、高维空间映射到不同的研究领域或方向,即为不同的信息空间,如:地理信息空间、海洋测绘空间,等等,形成不同的空间数据库(或时空数据库),对其中的数据挖掘,就形成不同的研究领域或方向的数据挖掘。对于所研究的问题,从哲学、数学角度,高度抽象出来都是类似的,即为 维数据挖掘。那么对于数据挖掘的理论技术与方法,都可以扩展延伸到空间数据挖掘中来。

为了促进旅游地理经济的快速发展,需要对其做出科学的规划、预测和管理。本文主要依托前期开展的课题,并在此基础上进行深化研究,所涉及的主要内容为时政指数、景区景点分布指数等事(势)态、状态变量以及 GDPCPI、旅游收入及游客人数等经济变量对旅游地理经济的影响,旅游收入预测与管理、旅游人数预测与管理模型和旅游地理经济风险管理模型,以及旅游地理经济预测模型与数据挖掘软件设计,等等。探索研究上述问题具有较重要的理论意义和经济社会意义,国内外很多学者对此做出了很多努力,但未见成熟的成果。本课题的研究能够为政府决策部门、旅游管理部门、旅游(商业、交通、宾馆、餐饮等)服务部门等主体提供信息咨询和决策参考。

本文在相关课题支持下,在导师指导下,根据旅游地理经济自身特点以及分析预测管理需求,从空间数据挖掘的角度分析旅游景区景点空间分布状态及其对旅游地理经济的影响,提出景区景点分布指数的概念及内涵;从时间空间(势态、事态)数据挖掘的角度,分析时事政策对旅游地理经济的影响,如旅游黄金周政策、自然灾害(如地震、传染病等)等对旅游地理经济的正反两方面影响,提出时政指数概念及内涵;将景区景点分布指数、时政指数应用于旅游地理经济分析,基于空间数据挖掘中的支持向量机理论与方法,发现旅游地理经济中的特殊知识与规律,为政府及旅游服务部门提供信息咨询和决策参考。

1.2 国内外研究现状(Present Research Situation

1.2.1 支持向量机支持向量机是数据挖掘领域中的一项新技术,是借助于最优化方法解决机器学习问题的新工具。早在 1971 年,Vapnik 和 Chervonenkis 就提出了支持向量机的重要理论基础[2-4],随后又于 1982 年提出了具有划时代意义的结构风险最小化准则,这一准则成为支持向量机的基石。而支持向量分类机的思想最早是由Cortes 和 Vapnik 于 1995 年提出的[5],该分类机采用结构风险最小化准则来代替经验风险最小化,较好地解决了小样本学习的问题,从而使得该分类机在解决有限样本的数据分类问题时具有较强的推广能力,能有效解决神经网络的过学习现象;该分类机还采用核函数思想,把非线性空间的问题转换到线性空间,降低了算法的复杂度,巧妙地解决了非线性分类问题和“维数灾难”问题,使得算法复杂度与样本维数无关;该分类机将分类问题归结为一个凸二次规划问题,从理论上讲,可以得到全局最优解,解决了在神经网络方法中无法避免的局部极值问题。因为支持向量机具有较完备的理论基础和较好的学习性能,在解决有限样本、非线性及高维模式识别问题中表现出许多特有的优势,又具有简洁的数学形式和直观的几何解释,人为设定的参数少,便于理解和使用,因此,支持向量机成为继神经网络研究之后机器学习领域新的研究热点。

VapnikGolowich 和 Smola 于 1997 年介绍了基于支持向量机方法的回归算法和信号处理算法[6]。自此之后,支持向量机算法的优良性质和潜在的应用价值吸引了国内外众多学者的注意。研究者们不仅对原模型的算法作了深入的研究,而且为了简化算法的复杂度对原模型进行了改进[7-10],并且结合实际问题,提出了各种各样应用型的支持向量机算法[11-16]。随着在支持向量机理论上的深入研究,出现了许多变形支持向量机[17-19]:如 Suykens 于 1999 年提出了最小二乘支持向量机(LS-SVM[20],其模型中的优化指标采用了平方项,只有等式约束,从而简化了计算复杂性;Scholkopf 于 2000 年提出了 − SVM算法,其中的参数具有实际的意义[21];为克服标准支持向量机对噪音敏感,Tsang 等于 2003 年提出了模糊支持向量机(FSVM[22]Tsujinishi 和 ShigeoAbe 又于 2003 给出了模糊最小二乘支持向量机(FLS-SVM[23]Hsu 和 Lin 于 2002 年通过把阀值引入目标函数改造标准支持向量机的模型,提出了一种更为简单的分解算法BSVM[24]David 等于 1999 年提出了软边界球支持向量机[25-26]

另外,研究人员针对大规模数据分类问题还提出了一些有效的支持向量机训练算法和实用软件[27-30],其中著名的有 Cortes 和 Vapnik 提出的分块算法(Chunking),Osuna 提出的分解算法(Decomposing),Platt 提出的序列最小最优化方法(Sequential Minimal Optimization-SMO)、Joachins 提出的 SVMlight方法,Mangasarian 等提出的基于有效集方法(Active Set Methods)的 ASVM 算法,该算法在经过特定的模型改造后,得到的对偶问题成为只包含没有上界的简单约束( α ≥ 0)的 QP 问题,Mangasarian 等于 2000 年提出的广义支持向量机(GSVM)[31],并给出了广义支持向量机的收敛性证明。Mangasarian 等于 2001 年又提出了具有线性收敛性的算法 LSVM,在求解对偶问题时,直接利用隐含式得到 LSVM 的迭代式,算法非常方便。其中,SMO 算法是当前较为实用的支持向量机的训练算法[32-35],该算法已经成功地推广到了支持向量回归机领域,目前流行的一些支持向量回归机训练软件,如 Hsu 和 Lin 用 C++实现的 LIBSVM,都采用了这种算法。

由于支持向量机建立在严格的数学理论基础之上,并较好地解决了非线性、高维数、局部极小点等问题,与其他方法相比具有明显的优势,在实际问题中得到了广泛的应用[36-44]。支持向量机不仅在文本识别、人脸识别、三维图像识别和语音识别等方面表现出了较强的识别性能,与其他方法相比具有明显的优势,而且支持向量机还成功地应用到了回归分析、非线性回归建模、数据压缩、时间序列预测、生物信息学、工业控制、经济预测、蛋白质分类和基因序列分析等领域,得到了较好的效果。

1.2.2 空间数据挖掘方法

空间数据挖掘方法大致可分为五类:概率论与数理统计分析方法,集合论方法,人工智能与专家分析方法,计算几何与空间分析方法,其它方法等[1,45,46-56]

(1)概率论与数理统计分析方法。利用概率论或数理统计的方法对空间数据按照某一准则进行概率统计分析,挖掘发现空间数据隐含的知识与规律。基于概率论的方法。是一种通过计算不确定性属性的概率来挖掘空间知识的方法,所发现的知识通常被表示成给定条件下某一假设为真的条件概率。在用误差矩阵描述遥感分类结果的不确定性时,可以用这种条件概率作为背景知识来表示不确定性的置信度。基于数理统计分析方法。指利用空间对象的有限信息和/或不确定性信息进行统计分析,进而评估、预测空间对象属性的特征、统计规律等知识的方法。它主要运用空间自协方差结构、变异函数或与其相关的自协变量或局部变量值的相似程度实现包含不确定性的空间数据挖掘。

   (2)集合论方法。基于集合理论处理空间数据关系的不确定性、模糊性等。常用方法有粗糙集方法、模糊集方法、云理论方法、证据理论方法。粗糙集方法。一种由上近似集和下近似集来构成粗集,进而以此为基础来处理不精确、不确定和不完备信息的智能数据决策分析工具,较适于基于属性不确定性的空间数据挖掘。模糊集方法。这是一系列利用模糊集合理论描述带有不确定性的研究对象,对实际问题进行分析和处理的方法。基于模糊集合论的方法在遥感图像的模糊分类、GIS 模糊查询、空间数据不确定性表达和处理等方面得到了广泛应用。云理论方法。云理论是一种分析不确定信息的新理论,由云模型、不确定性推理和云变换三部分构成。基于云理论的空间数据挖掘方法把定性分析和定量计算结合起来,处理空间对象中融随机性和模糊性为一体的不确定性属性;可用于空间关联规则的挖掘、空间数据库的不确定性查询等。证据理论方法。证据理论是一种通过可信度函数(度量已有证据对假设支持的最低程度)和可能函数(衡量根据已有证据不能否定假设的最高程度)来处理不确定性信息的理论,可用于具有不确定属性的空间数据挖掘。

   (3)人工智能与专家分析方法。利用人工智能与专家分析或仿生的理论与方法对空间数据挖掘,有决策树方法、遗传算法、神经网络方法、支持向量机方法、关联规则挖掘方法、聚类分析方法等。决策树方法。是根据不同的特征,以树型结构表示分类或决策集合,进而产生规则和发现规律的方法。采用决策树方法进行空间数据挖掘的基本步骤如下:首先利用训练空间实体集生成测试函数;其次根据不同取值建立决策树的分支,并在每个分支子集中重复建立下层结点和分支,形成决策树;然后对决策树进行剪枝处理,把决策树转化为据以对新实体进行分类的规则。遗传算法。是一种模拟生物进化过程的算法,可对问题的解空间进行高效并行的全局搜索,能在搜索过程中自动获取和积累有关搜索空间的知识,并可通过自适应机制控制搜索过程以求得最优解。空间数据挖掘中的许多问题,如分类、聚类、预测等知识的获取,均可以用遗传算法来求解。这种方法曾被应用于遥感影像数据中的特征发现。神经网络方法。是通过大量神经元构成的网络来实现自适应非线性动态系统,并使其具有分布存储、联想记忆、大规模并行处理、自学习、自组织、自适应等功能的方法;在空间数据挖掘中可用来进行分类和聚类知识以及特征的挖掘。支持向量机方法。SVM 是数据挖掘中的一项新技术,是借助于最优化方法解决机器学习问题的新工具。利用支持向量机方法对空间数据挖掘,进行分类或回归分析,发现其中的知识与规律。聚类分析方法。是根据实体的特征对其进行聚类,进而发现数据集的整个空间分布规律和典型模式的方法。常用的聚类方法有 K-mean, K-medoids 方法、Ester等提出的基于 R—树的数据聚焦法及发现聚合亲近关系和公共特征的算法[57]、周成虎等提出的基于信息熵的时空数据分割聚类模型等[58]。关联规则挖掘方法。是在空间数据库(数据仓库)中搜索和挖掘空间对象(及其属性)之间的关联关系的算法。最著名的关联规则挖掘算法是 Agrawal 提出的Apriori 算法[59];此外还有程继华等提出的多层次关联规则的挖掘算法[60]、许龙飞等提出的广义关联规则模型挖掘方法[61]等。

   (4)计算几何与空间分析方法。基于计算几何和空间分析的方法挖掘空间数据属性特征等。具体有计算几何方法、空间分析方法、空间特征和趋势探测方法等。计算几何方法。是一种利用计算机程序来计算平面点集的 Voronoi 图,进而发现空间知识的方法。利用 Voronoi 图可以解决空间拓扑关系、数据的多尺度表达、自动综合、空间聚类、空间目标的势力范围、公共设施的选址、确定最短路径等问题。空间分析方法。是采用综合属性数据分析、拓扑分析、缓冲区分析、密度分析、距离分析、叠置分析、网络分析、地形分析、趋势面分析、预测分析等在内的分析模型和方法,用以发现目标在空间上的相连、相邻和共生等关联规则,或挖掘出目标之间的最短路径、最优路径等知识。目前常用的空间分析方法包括探测性的数据分析、空间相邻关系挖掘算法、探测性空间分析方法、探测性归纳学习方法、图像分析方法等。空间特征和趋势探侧方法。是一种基于邻域图和邻域路径概念的空间数据挖掘算法,它通过不同类型属性或对象出现的相对频率的差异来提取空间规则。

   (5)其它方法。包括数据可视化方法和空间在线数据挖掘。数据可视化方法。是一种通过可视化技术将空间数据显示出来,帮助人们利用视觉分析来寻找数据中的结构、特征、模式、趋势、异常现象或相关关系等空间知识的方法。为了确保这种方法行之有效,必须构建功能强大的可视化工具和辅助分析工具。空间在线数据挖掘。是一种基于网络的在线的进行空间数据挖掘和分析的工具。它以多维视图为基础,强调执行效率和对用户命令的及时响应,一般以空间数据仓库为直接数据源。这种方法通过数据分析与报表模块的查询和分析工具(如 OLAP、决策分析、数据挖掘等)完成对信息和知识的提取,以满足决策的需要。

1.2.3 旅游地理经济研究现状

对旅游地理经济的研究始于 20 世纪 60 年代。1960 年至今检索到的文献有630 余篇(Li GSong HWitt S F[71],其中,真正的发展期是 80 年代之后,因其中有 90%以上是发表于 80 年代后的,且近 年来又有 80 多篇(汪倩雯、魏婧、任来玲)[72-74]。在 20 世纪 90 年代之前,一般采用的是传统的定量定性研究方法,如德尔菲法、生命周期法,计量经济方法、空间引力模型、时间序列方法、等等,之后诸如粗糙集理论、遗传算法、模糊时间序列、灰色理论、神经网络模型、支持向量机等人工智能方法,也被引入旅游地理经济的预测研究。其中,人工智能方法主要有粗糙集方法、遗传算法、模糊时序灰色理论、人工神经网络和支持向量机理论。人工智能的最大优点是对数据的概率分布等信息没有严格的要求,有较好的包容性和适应能力。综合现有研究,可以看出,旅游地理经济模型与预测的研究方法可大致分为两种:统计分析方法和人工智能方法。

   (1)统计分析方法胡华(2003)将层次分析法应用到宁夏旅游业的综合评价和决策中,建立起层次结构模型,并得出了量化分析的结果[75]。宋枚枚、李海霞(2008)以泰山景点为例评价旅游景区的价值,将旅游景区价值的评价因子数量化,运用层次分析法进行定量分析[76],得到了关于旅游景区价值评价的基本模型及各影响因子的优先顺序,据此,可以比较准确地评价旅游景区的开发价值,对投资项目做出正确的决策。潘娣等(2008)将 AHP 法运用于旅游节庆评估中,通过定性与定量分析相结合的方法提高旅游节庆评估中的准确性[77]。并以武汉市国际旅游节为例详细阐述了该模式的运作过程。李光金等(2001)对四川旅游业投资环境现状,包括自然资源、经济、基础设施、社会文化以及政策等方面进行了分析[78]。在此基础上,运用层次分析法对四川旅游业投资环境作了定量分析。文斌、吴健冰(2006)以桂林旅游资源为例[79],从学术角度探讨了人文生态旅游资源概念的界定,并尝试对人文生态旅游资源的内涵做出解释,在此基础上提出了分类的依据;围绕已完成普查的桂林旅游资源,对桂林人文生态旅游资源进行分类,概括出桂林人文生态旅游资源的特点;采用了定量分析与定性分析相结合的方法,对桂林人文生态旅游资源进行了客观的评价。魏少琴、贾铁飞(2005)具体分析了杭州市旅游资源的类型特征、等级特征和空间分布,用最邻近指数 对其分布形态进行了定量分析,并运用图论学中的有关拓扑指数对其空间结构进行了定量分析[80]。针对目前杭州市旅游资源整体空间分布分散,旅游交通网络回路指数等问题,从 个方面提出了空间整合的方案,即从内容上整合、从生态关系上整合和从旅游交通线路上整合。王唏(2006)以湖北省神农架林区为例[81],对当地旅游产业经济总量结构、要素配置及区位优势进行了定量分析,并对其未来发展趋势进行了时间序列分析和线性模型拟合,试图在研究分析方法上形成一定的程式规范。李艳娜、张国智(2006)建立了旅游环境容量指标体系[82],在此基础上以九寨沟为例对其旅游环境容量进行定量评析,求得了九寨沟旅游环境容量的阀值。葛洪朋(2008)根据旅游行业特性[83],分析了旅游企业竞争力的内涵、特征以及构成要素。运用层次分析法(AHP),以资源禀赋、经营能力、发展能力、区域环境、企业竞争力 个指标构建模型,对旅游企业的竞争力进行分析评价,并抽取了部分旅游类上市公司进行实证评价研究,根据评价结果,给出了提升旅游企业竞争力的建议。陈焕炯、李翠文(2007)以旅游体验质量为总的测评目标[84],设立旅游期望、旅游者感知的质量、正感体验、负感体验 个变量进行描述。李景宜(2002)提出了旅游系统市场竞争态及市场动态发展模型[85]。该模型不仅可以定量分析旅游市场的现实竞争态特征,对同一系统的不同市场做出定量对比和分类,并揭示每一市场竞争态是不断变化的,且为“瘦狗市场—幼童市场—明星市场—现金牛市场”过程的循环。在此基础上对市场进行趋势预测。张友兰等(2000)分析了旅游引力模型、多元(逐步)回归模型和时问序列模型在预测旅游人数方面的应用[86];给出了河北省今后几年国外游客人数及美国游客人数的预测结果;对河北省旅游业的发展提出若干建议。赵哲、尹怀庭(2004)从定性和定量分析入手[87],采用引力模型、口粒子模型等方法进行预测,对公式中的变量及其参数采取类似项目比较法或专家打分等方法进行修正,最后得出了游客量的预测模型。张永庆、张冬冬(2005)构建了都市旅游发展潜力的综合评价指标体系[88]。该指标体系主要包括社会经济潜在支持力、旅游发展保障力、旅游自身发展能力三大一级指标共 24 个三级指标。根据所构建的综合评价模型,选取了国内 24 个都市旅游发展比较好的城市进行了实证研究,并据此对上海都市旅游的发展潜力进行了细致的分析。

   (2)人工智能方法张朝元、陈丽(2008)针对大理州游客流量的特点,提出了采用最小二乘支持向量机方法来建立旅游流量的时间序列预测模型[89]。实验预测结果表明该模型具有较高的预测精度,为大理州游客流量预测提供了一条新的途径。殷英、胡光华、邱宇青(2004)利用统计学习理论建立支持向量机的时间序列预测模型[90],对云南的国际国内旅游需求进行了预测和对策分析,实验表明,支持向量机理论及模型在旅游需求预测中有很大的应用潜力。朱云涛等(2007)基于 KKT 条件,通过研究支持向量分布特点[91],分析了新样本加入训练集后,支持向量集的变化情况,提出等势训练集的观点。林溯(2006)以深圳市 2002 年 月到 2005 年 12 月的旅游客流量的月度数据作为学习样本,分别选用两种不同的核函数,对学习样本进行建模和预测,并比较选取不同的两个核函数对样本进行预测的效果,得出支持向量回归用于月度旅游客流量预测的有效性[92]。杨立勋、殷书炉(2008)系统地论述诸如粗糙集理论、遗传算法、时间序列方法等,并通过比较得出人工智能方法在旅游预测方面的应用取得了较好的效果的结论[93]Kuan-Yu ChenCheng-Hua Wang2007)用结合遗传算法的支持向量回归机、人工神经网络,ARIMA 对旅游进行预测,并对这三种模型的 MAPENMSE 进行比较分析[94]。该研究得出,三种模型都有较好的预测精度,相关系数都非常高,而结合遗传算法的支持向量回归机的预测精度最好。南剑飞、李蔚(2008)利用灰色系统理论对信息不完全确知的小样本系统分析的优势,对旅游景区满意度进行评价分析,了解旅游景区游客满意度的影响因素与评价体系问题[95]。综上所述,现有的研究方法在将经济分析预测与空间数据挖掘结合方面做得不够深入,还缺乏与特定经济现象相直接联系的数据指标与模式,因而影响了模型的稳定性和样本外的推广能力。另外,现有的文献在构造旅游地理经济预测模型的数据模式方面,对旅游收入以外的影响因素挖掘不够,因而缺失了一些对模型输出有直接或间接联系的变量,未能真正地从空间数据挖掘角度进行分析。

[返回]
上一篇:基于支持向量机和贝叶斯分析技术的入侵检测方法研究
下一篇:基于支持向量机的蛋白质功能预测新方法研究