欢迎访问一起赢论文辅导网
本站动态
联系我们
 
 
 
 
 
 
 
 
 
 
 
QQ:3949358033

工作时间:9:00-24:00
计算机论文
当前位置:首页 > 计算机论文
加入信息增益比的矿井塌方风险决策模型仿真
来源:一起赢论文网     日期:2013-07-30     浏览数:3309     【 字体:

摘要: 矿井各区域会发生结构承压改变,区域差异较大,对塌方的贡献程度也不同,不同局部对塌方的贡献很难准确量化当前的压力监测模型多是采用同一压力阀值系数进行监测,没有考虑矿井下不同区域承压给塌方风险带来的正向影响和区域之间的承压关联性,很难形成科学的决策 为解决上述问题,提出了一种加入信息增益比的矿井塌方风险监测技术,分析了矿井中不同区域承压数据的产生与处理,使用信息增益比做为决策树属性分裂的衡量指标,对传统的模型进行优化 实验证明,改进方法能够将传统矿井塌方风险监测的准确率大幅度提高,对实际的矿石开采提供有效指导
关键词: 矿井塌方风险; 信息熵; 信息增益比; 决策树
  引言
  矿井就是使用特殊的工程机械从地表到地下矿石开采区域建立通道,它是整个矿石开采中最主要的环节[]矿井塌方风险是指在矿石开采的过程中出现暴雨等恶劣天气,造成矿井塌方的可能性,这些恶劣天气的出现存在着极大的随机性 矿井塌方风险的处理如果不及时将会造成重大的损失,所以矿井塌方风险监测技术成为当前矿石开采领域中的研究热点[]上世纪 年代,一些大型的能源公司就开发了一系列的矿井技术标准与系统,这些系统的数据可以随时进行更 新,但是这些技术主要还是依靠人工的经验来监测[ ]近些年,国内一些专家提出使用人工智能技术与模式识别来进行矿井塌方风险监测,研究先进的测试测量工具对矿井塌方风险进行监测也是目前的热点[]
  目前的矿井塌方风险监测技术主要还是依赖于专家与工程师的历史经验来进行判断,当面对矿井的环境状况复杂,数据源庞大时就会出现监测的局限性与误差,矿井各区域会发生结构承压改变,区域差异较大,对塌方的贡献程度也不同,不同局部对塌方的贡献很难准确量化 当前的压力监测模型多是采用同一压力阀值系数进行监测,没有考虑矿井下不同区域承压给塌方风险带来的正向影响和区域之间的承压关联性,一些基于人工智能的矿井塌方风险监测方法也无法全面分析历史数据,对某些相关属性判别出现模糊性与随机性,使得决策模型失去科学性
  为了解决上述问题,本文提出一种加入优化信息增益比的矿井风险决策模型,将矿井勘探开采的庞大的历史数据进行分析,对属性进行数据预处理,并且根据信息增益比来进行决策树的分裂判断,这种技术可以有效避免无关属性的信息增益对分裂原则造成的负面影响 经过一定的属性分裂排序后形成决策树,对矿井塌方风险进行判断 实验数据证明这种方法能够将传统矿井塌方风险监测的准确率大幅度提高,对实际的矿石开采提供有效指导
  矿井塌方风险监测模型
  矿井承压数据采集与危险决策矿井承压的数据贯穿于矿井的整个过程,数据预处理的工作量占了整个矿井塌方风险监测的 以上 矿井承压数据的属性有好多是非数值型的,比如说某矿井所处的地质因素等属性,大量离散属性的数据为决策树监测技术提供了先天的优势,避免了使用神经网络等监测技术中数据分类产生的错误 决策过程如图 所示图 矿井塌方风险分析数据流数据预处理阶段是整个矿井塌方风险监测分析阶段最为关键的部分,数据预处理包括不规范数据的处理 数据转换数据规约等步骤 数据的不规范处理是以提高待分析数据的质量为目的,包括数据的完整性与一致性的检查,噪声数据与缺失数据的处理消除重复数据等 在矿井生产的过程中很大一部分数据是人为记录的,这样就会造成一些手误出现一些空缺值与异常值 如果一些记录属性发生了空缺值时,可以考虑使用该属性的其它数值的均方值来代替 例如矿井标识号为 的地层破裂梯度值由于人工疏忽没有进行录入,设总共有 个矿井记录点( )将 值做为丢失的矿井标号为的地层破裂梯度的代替值矿井塌方风险监测中采集到的数据在对比时可能由于实际意义有着不同的量纲和值域,如果直接将这些变量代入进行信息熵的计算可能无法获得满意的效果,比如在矿井的开采深度记录与矿井开采钻头的长度对比中一个属性的量纲为千米,而钻头的量纲可能是厘米,直接进行数学计算无法获得理想的模型效果传统的模型使用 分数对属性进行标准化,把数据标准化为一个均值为,标准差为 的一个分数( ) ,( )( )可以证明,经过上述标准化的数据绝大部分都会包含在[ , ]的区间内,这样对于区间以外的数据可以作为孤立点进行去除如果数据处在这个区间内,那么进行风险报警传统模型的缺陷分析在矿井塌方风险监测的过程中,井下压力值来自于底层破裂压力与钻井液柱压力的比较关系值 但是,一旦发生暴雨狂风等外界异常恶劣的环境时,矿井各区域会发生结构承压改变,区域差异较大,对塌方的贡献程度也不同,不同局部对塌方的贡献很难准确量化,伴随着矿井勘探的深度增加底层破裂压力计 其中为压力梯度增加,例如在暴雨下,这种压力增加非线性很强,矿井液柱的压力, 分别代表外界液体的密度与液柱的垂直距离,与的大小很难准确得知井下不同部分的压力平衡的状况一旦外界受到暴 雨 的 影 响,会大幅降低压力分布区间的情况,造成虚报警,很难准确地对塌方风险进行监测,决策模型不科学基于信息增益比的矿井塌方风险监测这里可以采用基于属性信息熵计算的决策树监测技术来进行矿井塌方决策模型的优化矿井塌方风险监测的主要数据来自矿井基本环境属性矿井历史数据矿井承压数据三个部分矿井环境属性包括该矿井的识别代码( ) 矿井的井别( ) 矿井坐标( ) 等属性,这些属性能够描述该矿井所处的环境情况矿井的历史数据包括矿井在历史的生产过程中当发生不同的塌方情况时,主要依靠人工记录的情况对矿井的属性记录,包括以下一些信息: 矿井的识别代码( ) 起始时间( ) 结束时间( ) 发生层位( ) 记录属性内容( ) 记录属性内容( ) 主要包括在矿井生产过程中发生塌方的一些相关属性记录,历史数据表明矿井的主要塌方因素包括矿井液的使用情况与地层压力的情况其中矿井液的使用情况包括顶界深度( ) 底界深度( ) 相对密度( ) 相对密度( ) ; 地层压力的数据主要包括顶 界 深 度( ) 底 界 深 度( ) 压 力 梯 度 的 最 大 值( ) 压力梯度的最小值( ) 破裂压力梯度最大值与最小值分别表示为: ( ) 与( ) 以上采集的数据有一部分是一些非数值型的数据,还需要对其进行一定的数据预处理后进入数据挖掘与决策树的构造阶段塌方监测决策树的构造决策树的构造进行属性分裂时处理的数据为离散型的数据,本文利用等宽分箱取平均值的方法对数据进行离散处理首先将数值划分为不同的区间,对落入区间的数值使用该区间数值的平均值来代替,对矿井液浓度的取值范围可以根据不同的井深段取不同的数值将其划分为[小于 ][ , ][ ][ ][大于 ]个区间有些因素的属性值无法使用数值来进行描述 ,可以根据聚类的思想将其划分为不同的集合与簇,例如裂缝的发育情况可以划分为良好一般差等三个等级对矿井异常情况分析的变量数 众 多,这些变量之间有些存在较大的相关性,比如矿井下压力的平衡指标属性与地表裂缝 液柱压力等属性相关,这些属性可以使用某一个或者几个的属性综合来表示,这样就可以将数据量庞大的属性进行规约,利用相关系数的分析来进行变量的规约是数据预处理的常用方法:( ) ( )( ) ( )( )求解每两个变量之间的相关系数,在本文中使用的相关变量中的一个作为代表变量,如果则要根据分析需要进行取舍决策树是一种类似于数据流程图的一种树结构,每一个非树叶阶段的属性值都代表了该属性的一个测试即一个分裂标准属性测试,使决策树进行属性的判别清晰明了,能够处理海量的历史数据 选择哪种属性的分裂准则是决策树监测效果的关键点,经典的决策树构造方法是根据信息熵的方法对属性进行计算作为判别能力的度量信息熵可以对整个信息源的不确定性进行度量,在矿井的开采过程中某种属性要做为监测属性,比如暴雨可能的状态本身就具有不同的发生概率,如果有 种状态分别表示为 , 每一种结果出现的概率表示为: ( ) ,( ) , ( ) 则有: ( ) 则信息的熵可以表示为:( ) ( ) ( ) ( )( ) ( )( )将信息增益作为属性判别的标准,在每一个非叶节点进行数据监测,可以求出该样本的最大的信息量,使用这种方法进行分类以后,生成的决策树的深度最小,到达叶子节点的路径最短,这样提高了矿井塌方风险监测的准确度与速度信息增益如下定义:如果矿井监测的数据集中一共有 类的样本,每一类的样本数量为 , ,, ,,某一个属性作为矿井监测决策树的根,该属性假设为 具有个值 ,, ,这些值将数据的训练样本划分为 个子集,如果某一个子集 属于类的概率为 ,可以使用,进行估计,则该子集的信息熵可以表示为:( ) ( ) ( )信息的期望为:( ) ( ) ( )设置矿井塌方风险监测的数量和监测时间分别为 ,,则这种决策树分类的信息量如下所示:( ,) ( )( ) , ( )( )则以上述属性为根的决策树的信息增益表示为:( ) ( ,) ( ) ( )对每一个监测属性进行上述信息增益的计算并且从大到小进行排列,形成属性的分裂树,进行矿井塌方风险监测的工作信息增益比的决策树构造直接根据信息增益的数量值来进行决策树构造时有些属性存在大量的可能值,比如矿井记录的日期属性( )每一天都会有记录,所以日期具有最大的信息增益,如果仅仅按照上述方法进行决策树的构造就会形成一个深度为级却异常宽的决策树,显然这不是矿井塌方风险监测的准确效果本文使用信息增益比作为属性的分裂准则来对这样的属性惩罚:( )( )( )将式( ) 与式( ) 进行比率计算:( )( )( )( )这样经过对信息增益比求解以后作为分类属性可以有效避免因为选择值不均匀而造成的决策树过宽训练性能差的缺点本文选择 条记录中的 条作为训练数据进行决策树的构造,主要考虑暴雨与不会发生暴雨两类记录的数据流程,经过属性( ) 式的信息增益比计算以后形成了如图 所示的决策树模式图 信息增益比的决策树构成经过式( ) 的计算之后形成的决策树可以有效避免某些无关属性过 宽 的 缺 点,可以根据决策树对每一条记录分析,监测矿井塌方的风险实验结果分析本文对某矿区的 个矿井历史数据进行了实验对照,从 个矿井数据中共抽取了 条历史记录,为了避免因为抽样造成的过抽样影响,本文在对各级矿井的数据抽样中使用了类型抽样,将整个样本根据环境属性进行分层,在每一个层中随机抽取样本的单位 使用 决策树构造平台对经过预处理的数据进行分析与对比,使 用数学软件对不同方法下的实验结果如图 所示图 可见经过信息增益比对属性进行分析以后,能够避图 两种方法的决策树构造时间比较免某些无关属性对决策树的构造造成影响,这样就会大大的降低了算法的运行时间 假设 代表某矿井的总记录数,为监测的结果符合实际情况的记录数,则 代表监测的准确率,两种方法的监测准确率比较如图 所示图 监测准确率比较图图 可知经过改进的信息增益比算法对 个矿井点进行监测后准确率大幅度提高,证明本算法的监测准确率较高,有很高的实用指导价值
  结束语
  本文主要研究矿井塌方风险监测的问题 因为传统的矿井开采过程中塌方风险监测主要依靠专家与工程师的人工分析,当面对暴雨时监测就有了局限性与不确定性 本文为此提出了一种加入信息增益比的矿井塌方风险监测技术,详细分析了矿井中不同区域承压数据的产生与处理,使用信息增益比做为决策树属性分裂的衡量指标,对传统的模型进行优化 实验证明,这种方法能够将传统矿井塌方风险监测的准确率大幅度提高,对实际的矿石生产提供有效指导
    参考文献:[]倪红梅,王维刚免疫神经网络在固井质量预测中的应用研究[]计算机仿真, :[]王宝毅,等基于案例推理的钻井复杂情况专家系统[]石油大学学报( 自然科学版) , ,( ) :[]刘汝山,曾义金钻井井下复杂问题预防与处理[]北京:中国石化出版社, :[]许绛垣石油钻井事故预测与安全决策支持系统研究[]中国地质大学, :[]史玉升,梁书云 钻井过程实时状态监控与事故诊断专家系统 人工智能在钻井工程中的应用之一[]地 质 与 勘 察,,( ) :[]孙中 昌 钻井异常预测技术[]北 京: 石油工业出版社,:

[返回]
上一篇:一种基于内容的数据分发网络及算法
下一篇:试论基于数据加密的网络通信系统的设计与应用