欢迎访问一起赢论文辅导网
本站动态
联系我们
 
 
 
 
 
 
 
 
 
 
 
QQ:3949358033

工作时间:9:00-24:00
经济管理论文
当前位置:首页 > 经济管理论文
股指期货市场系统风险预警指标体系研究
来源:一起赢论文网     日期:2013-08-20     浏览数:3512     【 字体:

摘要:文章首先选出了若干影响股指期货市场价格变动的关键变量,初步构造出了一个指标评价体系;然后,通过决策树算法对指标进行二次筛选,留下了对风险评判最重要的指标,最后通过遗传投影寻踪算法得出综合风险投影值,进而得到各个时期对应的风险等级。从而形成了比较科学的风险预警等级制度,能够提高系统风险预警的能力。
关键词:股指期货;系统性风险;预警;决策树算法;遗传投影寻踪算法
1 研究背景与意义
股指期货的风险是指由于股指期货市场中存在的不确定因素,使得期货交易主体遭受损失及对其他市场成员和整个社会经济环境造成危害的可能性。自2010 年4 月16 日推出股指期货以来,我国股指期货市场无论是在量上还是在质上都取得了飞速的发展。随着运行质量的大幅提高,参与的资金也越来越多,而股指期货的系统性风险也越来越大。且其本身所具有的双向交易与高杠杆性的特征,又使其风险成倍的放大。因此,建立起一套识别股指期货系统性风险的预警机制,防范股指期货市场风险积累到一定程度出现崩盘等影响我国金融安全的事件就非常有意义。
2 遗传投影寻踪方法简介
本文旨在通过建立一套完整实用的风险预警指标体系来评判股指期货市场的系统风险,由于风险指标众多,如何在尽量不损失指标信息的情况下对指标数据进行降维成为建立预警指标体系时需要考虑的问题。投影寻踪(Projection Pursuit,PP)是一种新型的对高维数据进行降维的方法,通过最大化(或最小化)投影指标函数,寻找到最佳的投影方向,将高维数据投影到低维,并在低维上对原始数据进行分析,因为在最佳投影方向上,原始数据的内部结构得到了最大的保留,所以对投影后的低维数据进行分析,也就达到了对高维数据进行研究分析的目的。由于在低维上,有着大量成熟的统计方法,将投影寻踪的思想与这些方法结合,会形成很多新的研究方法,如投影寻踪回归,投影寻踪聚类,投影寻踪神经网络等。本文主要是通过投影寻踪聚类的方法对各期的风险指标值进行降维,得到一个综合的风险值,根据此值进行风险预警分析。投影寻踪聚类一般分为三个步骤,首先进行数据无量纲化,然后构造及优化投影函数,最后根据在最优方向上得到的投影值对原始样本做综合评价。在优化投影函数时,由于投影函数的结构往往比较复杂,一般为非线性函数,传统的优化方法(如牛顿法,共轭梯度法等)容易陷入局部最优解,因此一般采取遗传算法、粒子群算法、模拟退火算法等全局优化算法来求解。本文使用遗传算法求解。
2.1 数据无量纲化量纲化的处理就是将数据进行标准化处理。在各种指标处理中,通常会有极大型指标、极小型指标和居中型指标,则必须首先对选取的指标进行一致化处理,并无量纲化。对于极小型指标,即指标数据越小越好的指标,通常采用无量纲化处理为:x'ij =xmax - xijxmax - xmin对于居中型指标x,通常令x'ij =ìíîïï ïïï ï1 -m - xijmax(m - xmin,xmax - m)xmin  x < m1 x = m1 -xij - mmax(m - xmin,xmax - m) m < x < xmax其中,m为指标x 的最优值。极大型指标的无量纲化处理采用x′ij =xij - xminxmax - xmin无量纲化处理的数学变换消除了量纲的影响,将所有指标标准化、规范化到0~1 的区间。
2.2 构造及优化投影函数股指期货市场系统风险预警指标体系研究
在对原始指标xij 进行无量纲化处理得到yij 后,则样本i的投影值zi 可以定义为:zi =Σj = 1paj yij = a ⋅ yi其中a 是投影方向向量,yi 是无量纲化后的第i 号样本的指标值向量。下面寻找最优的投影方向,即最优的a 。为了统一投影值的单位,要求为a 单位向量,即满足|a| = 1 。则寻找最优投影方向相当于在p 维单位球面寻找一个点,使得在该点指示的投影方向上,投影值能够最大限度的保留原数据的信息。直观来看,为了最大限度保留原数据的结构,则对于在高维相近的样本点,其投影值也应该相近,而对于在高维相差很大的样本点,其投影值也应该有较大差别。即在整体上,投影值应该比较分散,而对于比较相似的样本,投影值又应该比较集中,同时满足这两个要求,即为最佳的投影方向。可以使用投影值的标准差来衡量整体的分散程度,即定义类间距离如下:s(a) = sd(z) = 1n - 1Σi = 1n(zi - zˉ)2为了衡量相似样本投影值的集中程度,可以定义类内密度如下:d(a) =Σi = 1n Σj = 1n(R - rij)I(rij < R)其中rij 为投影值i 和j 之间的距离,定义为rij = |zi - zj| ,I(•)为示性函数。R 为密度窗宽,即只有两个投影点之间的距离小于R,才能认为两个投影点“比较相近”。R 的取值对于最终结果有较大的影响,选择R=0.1s(a) 。当相似样本的投影点比较集中时,类内密度较大。因此可以定义最终的评价函数T(a) = s(a)⋅ d(a) ,满足约束|a| = Σi = 1p a2i= 1 ,则寻找最佳投影方向转化为优化问题,即在约束条件下寻找使得T(a) 极大化的参数向量aopt 。由于T(a) 是非线性函数,一般的优化算法易陷入局部最优解,因此在参数寻优过程中使用遗传算法(GA)做全局最优化。遗传算法通过将问题的可行解编码成基因,然后根据生物种群的交换基因片段,基因变异以及优胜劣汰等规则,模拟在各个世代(epoch)生物进化过程,最终得到全局最优的参数向量。本文使用带精英选择的遗传算法,其过程可用图1简述。
2.3 综合预警分析在得到最优参数向量aopt 后,则可以计算出每个时期的风险投影值zi ,根据这些投影值的大小,可以对原始的n 个时期做综合风险评判,并可以进一步确定各个风险等级的阈值。
3 沪深300股指期货市场的风险预警实证分析
3.1 期货市场系统风险预警指标体系的构建
3.1.1 预警指标体系的初选与数据选择(1)宏观类指标:衡量宏观经济的变量有很多,本文选取了几组有代表性的指标。宏观经济一致指数(hgyz):一致指数是反映当前经济的基本走势,由工业生产、就业、社会需求(投资、消费、外贸)、社会收入(国家税收、企业利润、居民收入)等4 个方面合成。制造业经理人采购指数(pmi):我国被誉为“世界工厂”,制造业对我国宏观经济的影响不言而喻。制造业经理人采购指数可以很好的衡量制造业景气度,从而反映出宏观经济状况。如果采购指数上涨,制造业景气度上升,宏观经济就会向好。消费信心指数(xfxx):消费是拉动我国GDP 的三驾马车之一。在金融危机背景下,依靠国内居民消费需求拉动我国经济增长和产业结构的调整显得更为重要。消费者信心指数上升,表示消费者会更多的消费,在我国各个行业普遍产能过剩,消费不足的大背景下,宏观经济就会更加健康向好。城镇固定资产投资完成额同比增长率(ior):投资也是拉动我国GDP 增长的重要力量。本文选取城镇固定资产投资作为衡量投资变动指标。当此比例上升的时候,证明我国投资完成额相对于去年的时候是增加的,对宏观经济就会做出了正向的贡献。完成额同比变动比例=本月城镇固定资产投资额- 去年本月城镇固定资产投资额去年本月城镇固定资产投资额外贸同比增长率(ftr):本文采用进出口总额的同比增长率来表示外贸的变动,此比例的增加证明进出口总额同比增加,反映出了我国外贸总量不断增加,外贸的健康发展促进我国宏观经济的健康发展。外贸同比增长率= 本月进出口总额- 去年本月进出口总额去年本月进出口总额图1 遗传算法流程图财经纵横144统计与决策201 3 年第6 期•总第378 期政府财政收入同比增长率(govr):财政收入的增加不仅使我国的GDP 增加,也会使我国政府具有更强的调控市场的能力。提高了政府抵御期货市场风险的能力。财政收入同比增长率= 本月财政收入- 去年本月财政收入去年本月财政收入货币准货币(M2)变动率(m2r):货币准货币(M2)不仅包括M1,还包括储蓄存款(包括活期和定期储蓄存款)和政府债券。所以,M2 不仅反映现实的购买力,还反映潜在的购买力。若M2 增速较快,则投资和中间市场活跃。中央银行和各商业银行可以据此判定货币政策。M2 过高而M1 过低,表明投资过热、需求不旺,有危机风险;M1 过高M2 过低,表明需求强劲、投资不足,有涨价风险。因此M2 与期货市场的风险呈现出正向的关系。通货膨胀率(CPI):当经济体遇到温和的通货膨胀时,企业会由于商品价格的上升而获得更多的利润,使股票指数价格上涨,进而使股指期货价格上涨,当遇到恶性的通货膨胀时,经济环境会迅速恶化,股指期货的价格也会随之下跌。外商直接投资变动率(fdir):外商直接投资指一国的投资者(自然人或法人)跨国境投入资本或其他生产要素,以获取或控制相应的企业经营管理权为核心,以获得利润或稀缺生产要素为目的的投资活动。本文利用外商直接投资变动率衡量热钱流入状况。当比率变大,表示外商对我国投资的增速加快,从一个层面反映出热钱流入我国的速度加快,股指期货的风险也会越来越大。人民币兑美元汇率环比变动率(exrr):当人民币对美元升值时,由于利率平价原理,热钱会涌入利率高的国家,因此热钱会流入,进而增加股指期货的风险。
(2)期货市场类指标:股指期货的市场流动性对期货合约的价格具有很大的影响,当市场的人气比较旺时,期货的成交速度比较快,能够根据不断变化的市场行情生成比较合理的价格,而合理的期货市场价格自然是低风险的体现,同时会吸引更多的市场参与者,从而提高了市场的流动性。然而,如果股指期货市场的成交太过于活跃,投机气氛就会变浓,市场的风险就会增大。我们选取了下述三个指标,试图用这三个指标去度量成交的活跃程度。成交量环比变动率(vol_r):月度成交量环比变动率衡量了月度成交量的相对于上一个月的变动情况,当成交量环比为正表示相对于上月本月的成交量增加,表示成交相对于上月更加活跃。成交量变动率= 本月成交量- 上月成交量上月成交量成交金额变动率(mount_r):月度成交额变动率是利用成交额的环比变动情况,成交额等于每笔成交的手数与价格的乘积。判断思路同成交量变动率。成交金额变动率= 本月成交金额- 上月成交金额上月成交金额月末持仓量变动率(cclr):期货合约的流动性源于期货市场参与者的买卖,持仓量即为买卖双方尚未平仓的数量,持仓量大说明市场参与者有较多的买卖行为,也代表了市场的流动性比较大。月末持仓变动率= 本月持仓量- 上月持仓量上月持仓量
(3)现货市场类指标:作为股指期货的现货沪深300 指数很好的衡量了A股市场整体的情况。其与股指期货价格波动幅度是不同的,但由于套利的存在,两者最终趋于一致。所以,现货价格的波动一定程度上会影响期货价格波动。股票价格变动率(xjbd):此比率利用现货市场本月价格与上月价格的变动比率来反映现货市场对该股指的市场需求变动情况。股票价格变动率= 本月沪深300月收盘价- 上月沪深300月收盘价上月沪深300月收盘价现期价偏离率(xqbd):沪深300 指数与股指期货价格间存在偏离。如果偏离越大,非理性的投机力量就越大于理性的套利力量,即市场的此时所处的风险较大。期现偏离率= 沪深300现货指数- 股指期货指数股指期货指数沪深股市的平均市盈率(avg_pe):沪深股市的平均市盈率代表着股票市场整体的股指状况,市盈率越低代表着股票市场更具有投资价值,因此,股指期货更加安全。综上,初选指标如表1 所示:表1 初选指标名称及类别指标大类宏观类指标现货市场类指标期货市场类指标变量名hgyzxfxxiorftrgovrpmim2rcpiexrrfdirxjbdxqplavg_pevol_rmount_rcclr指标名宏观经济一致指数消费信心指数城镇固定资产投资完成额同比增长率外贸同比增长率财政收入同比增长率制造业经理人采购指数M2 变动率CPI人民币对美元汇率环比变动率外商直接投资同比变动率股票价格波动率现期价格偏离率平均市盈率成交量变动率成交额变动率月末持仓量变动率
3.1.2 使用决策树算法筛选重要的预警指标在指标体系构建与数据选择部分,我们共选择了16个可能与期货风险预警有关的指标,但是实际上,并不是所有的指标都是与期货风险有显著联系的,如果在综合评价指标体系中引入了不相关的评价指标,则最终的评价结果必然受到影响。而且,根据模型简洁性的原则,也有必要对输入的变量个数做适当的精简。本文使用决策树算法筛选变量。决策树是一种数据挖掘技术,主要用来进行分类和预测。决策树代表的是对象属性与对象值之间的一种映射关系,其实就是一个类似流程图的树型结构,整个决策树对应着一组表达式规则,每个叶节点代表一个类别,从根到叶节点的一条路径财经纵横145统计与决策201 3 年第6 期•总第378 期代表着某个可能的属性值。建立决策树的过程就是不断的对数据进行切分的过程,每次切分对应着一个节点。每次切分都要求切分后的组之间有最大差异。产生决策树的算法有很多种,各种决策树算法之间的主要区别就是对于切分后组之间差异度量的不同,一般使用熵来衡量差异程度。常用的算法有ID3、CART、CHAID、C4.5、C5.0 等。为了筛选出重要的指标,需要选择一个能够近似表示股票投资价值的指标。这里使用每月股指期货日收盘价的方差来代表。生成决策树使用R 软件进行,生成的决策树如图2 所示。图2 用于筛选预警指标的决策树因为出现在决策树节点上的变量,直接控制着决策树的走向(即控制着机构持股比例的大小),所以节点变量与股票投资价值有着较强的关联,本文选择所有出现在节点上的9 个变量作为最终的综合评价指标体系,如表2 所示。表2 最终的风险预警指标体系大类宏观类指标现货市场类期货市场类指标名称宏观经济一致指数,消费信心指数,外贸同比增长率,制造业经理人采购指数CPI现货价格波动率,现期价格偏离率成交量变动率,月末持仓量变动率在筛选出最终的风险预警指标后,再剔除掉含有指标缺失值的月份,使用2010 年4 月至2012 年10 月的股指期货数据,最后参评的月份为27 个月。
3.2 预警指标权重的确定本文使用R 软件完成投影寻踪的相关计算。由于R的遗传算法包只支持最小化目标函数,因此实际计算时,优化目标由之前的最大化评价函数T(a) 改为最小化-T(a) ,这实际上是一致的。在运用遗传算法时,需要对遗传算法的相关参数进行设置,此处选择遗传算法的种群大小为300,最大进化世代为200 代,精英选择的比例为20%,变异概率为1%,进化过程如图3 所示。图3 遗传算法的进化过程从图3 中可以看出,随着遗传算法的进行,评价函数-T(a) 的值在不断下降,到达第200 代时,评价函数的值基本上已经不再变化,算法收敛。最终得到的最优投影方向aopt 如表3 所示,这也就是各风险预警指标的权重。表3 最终的风险预警指标的权重指标大类宏观类指标现货市场类指标期货市场类指标指标名宏观经济一致指数消费信心指数城镇固定资产投资完成额同比增长率制造业经理人采购指数CPI股票价格波动率现期价格偏离率成交量变动率月末持仓量变动率权重0.61040.47650.48570.31410.1990.08520.09360.00120.1012从表中可以看出,宏观经济类指标的权重比较大,而现货市场和期货市场类指标的权重相对较小,得到权重之后,则可以计算出对应时期的风险投影值,并做进一步分析。图4 风险投影值的分布情况图4 显示了这27 个月风险投影值的分布情况。从图中可以看出,绝大部分风险投影值都集中在0.5~1.5 之间,由于分布两侧都是拖尾的,因此说明也有一些月份的风险值明显的偏大或者偏小。
3.3 预警结果分析根据上面计算的风险投影值的分布,我们便可以确定警限,得到警戒区间,给警戒区间划分警情,根据当前时间段或者未来风险预警指数处在的警戒区间进行警度预报。确定警限的传统方法是3σ法,该方法假定预警指数的分布应该是一个正态分布,根据指标正态分布原理,数据Z 分布在中心值附近,离中心值越近,可能性越高,越偏离中心值,可能性越低。如果偏离超过1 倍标准差,可能性只有31.74%;如果偏离超过2 倍标准差,可能性只有5%;如果偏离超过3 倍标准差,可能性不足1%。因此,可以根据偏离中心值的标准差倍数来确定警限。但是从上述27 个月的风险预警指标值数据来看,这些指标明显不服从正态分布,这可以从图4 的分布曲线中看出。使用Kolmogorov-Smirnov 检验,Jarque-Bera 检验和Anderson Darling 检验均可以在0.01 的显著性水平下拒绝服从正态分布的假设。因此,在确定警限时,如果盲目的套用正态分布下的3σ法,则可能得到的警限是有误差的。本文从数据本身的形态出发,根据数据本身,使用非参数核密度估计的方财经纵横146统计与决策201 3 年第6 期•总第378 期法,首先估计出预警指标值本身的分布密度函数f (z) 。核密度估计是在概率论中用来估计未知的密度函数,如果各样本点为y1,y2....yn ,w1,w2....wn 为各样本点的权重,满足Σi = 1nwi = 1 。在任意一点y 处的核密度估计为:f͂(y) = 1hΣi = 1nwi K( y - yih)其中K(•)为核函数,其中∫K(y)dy = 1 ,这样就保证了f͂(y) 是一个正常的密度函数,一般认为核函数的选择对最终的结果影响不大,本文中使用常用的高斯核函数。h 为带宽,带宽选择的恰当与否,对最终估计的结果有较大影响,本文中使用Silverman 提出的拇指法则来选择带宽,拇指法则指出最优的带宽应该为:hopt = ( 43n)1 5 min{σ̑,IQR/1.35}其中n 为样本数目,σ̑为样本标准差,IQR 为样本的四分位距。再根据其分布计算分位点zα ,即求解下述积分方程:∫-∞zα f (s)ds = α上述积分难以直接求解,使用蒙特卡洛方法模拟出其近似解。上述过程使用R 软件编制程序进行,最终得到的预警系统等级划分如表4 所示。则到此为止,股指期货系统风险预警指标体系完全建立,可以利用已经建成的指标体系对之前各个月份和今后的股指期货系统风险进行预警。2010 年5 月至2012 年8月的股指期货系统风险评判结果如表5 所示。从结果可知,处于黄灯较热区域的分别是2010 年4月,2010 年5 月,2010 年11 月,2011 年3 月,2011 年4 月,表示股指期货较热,而这几个月的股指期货也同样出现了较大的波动,风险较高;最近两个月股指期货均处于浅蓝灯区域运行,则表示股指期货较冷。判断的结果与事实基本相符。与此同时我们还可以从投影寻踪值的大小来判定对应区域内的风险相对状况。
4 结论
本文使用投影寻踪方法对股指期货的系统风险进行预警。结果与实际结果基本相符。在指标选择阶段,本文利用数据本身提供的信息,直接使用决策树方法筛选预警指标,是一种客观的指标筛选方法,避免了人为筛选评价指标造成的主观偏误;投影寻踪方法很好的保留了原始指标的信息,在模型求解阶段,遗传算法确保了投影方向是全局最优的,使得投影寻踪模型具有良好的综合评判效果;在确定警限时,使用核密度方法,根据风险投影值本身的分布估计警限,避免了直接套用正态分布下的结论。本文建立的模型尽量使用数据本身的信息,尽最大可能避免人为主观决策,具有数据自适应的特点。在有新的数据后,只需要重复本文过程,即可得到最新的风险预警结果,具有一定的实用性。
参考文献:[1]Kaminsky, Lizondo, Reinhart.Leading Indicators of Currency Crisis[C].International Monetary Fund Staff Paper, 1998.[2]Kaminsky, Lizondo, Reinhart.The Twin Crises: the Causes of Bankingand Balance-of-payments Problems [J]. American Economic Review,American Economic Association,1999, (2).[3]Kumar, Kwamena, Forecasting Future Market Using a Flexible Logis⁃tic Model[C]. Working paper, 2007.[4]Chen,.W.,Mike,.K.On a Threshold Heteroscedastic Model[J]. Interna⁃tional Journal of Forecasting, 2006, (22).[5]Cathy. Comparing Conditional Hedging Strategies[C].Working Paper,2007.[6]熊熊,张宇,张维,张永杰. 股指期货操纵预警的Logistic模型实证研究[J]. 系统工程理论与实践, 2011,(7).[7]段军山,龚志勇.股指期货市场价格风险测度——基于CVaR值,GARCH模型,R/S分形的实证研究[J]. 山西财经大学学报, 2011,(5).[8]邢文训等.现代优化计算方法[M].北京:清华大学出版社,1999.
 

[返回]
上一篇:区域市场分割与融合的环境效应:基于跨界污染的视角
下一篇:房地产预警指标体系及综合预警方法研究