欢迎访问一起赢论文辅导网
本站动态
联系我们
 
 
 
 
 
 
 
 
 
 
 
QQ:3949358033

工作时间:9:00-24:00
机械论文
当前位置:首页 > 机械论文
用于SAR图像海面溢油自动识别的决策树分类器系统
来源:一起赢论文网     日期:2019-08-09     浏览数:1953     【 字体:

 涛,等:用于SAR 图像海面溢油自动识别的 Bagging-AdaBoost决策树分类器系统分类器内核。同时,在 AdaBoost-DT 分类器系统(DT-A)和 Bagging-DT 分类器系统(DT-B)的基础上,本研究提出使用 Bagging算法组合多个 AdaBoost-DT 分类器系统(DT-A)构成 Bagging-AdaBoost-决策树分类器系统(DT-AB),以期进一步增强自动识别分类器的检测率、泛化性能和稳定性能。1 基本方法1.1 决策树算法决策树是一种树形结构的识别、分类算法。其基本思想是以不纯度为度量指标,构造一棵不纯度下降最快的 树。不 程度。以i(N)表示节点 “不纯度”,当节点上的样本属于同一类时,i(N)=0;当节点上的样本类别齐全且数量相当,则i(N)很大。决策树的构造是通过对样本集的学习,自顶向 下建立决策规则(见图1)。树中每个节点代表某些样本的集合,每个分叉路径代表某一特征及其阈值对节点进行分裂生长。在每个非叶节点上,遍历所有特征参数,找到能使此节点的不纯度下降最大的特征参数及其阈值以进行分裂。以此类推,直到叶节点处不纯度为0止,此时每个叶节点中的样本都属于同一类别。图1 决策树示意图Fig.1 The scheme of decision tree常 用 的 决 策 树 算 法 有 ID3,ID4,C4.5,C5.0,CART 等,本研究选择opencv函数库中的 CART 树算法。CART 树的不纯度指标为 Gini(基尼)不纯度:i(N)=∑i≠jP(ωj)=1-∑jP2。 (1)其中:i,j为类的编号;P(ωj)是节点 N 处属于ωj类的样本数占总样本数的频度。在决策树构造过程中,如果树分支停止太晚,决策树的泛化性能将较差,被称为“过拟合”。相反,如果树分支 停 止 太 早,将 导 致 分 类 性 能 较 差,被 称 为 “欠 拟合”。为解决“过拟合”问题,有交叉验证、不纯度下降差门 限、节 点 样 本 数 门 限 以 及 剪 枝 等 方 法 可 供 选择[22-23,31,66]。本研究同时使用opencv函数库中提供的交叉验证和剪枝方法。1.2AdaBoost算法AdaBoost是 Adaptive Boosting(自 适 应 增 强)算法的缩写,它是一种分类器的自适应增强算法。Ada-Boost算法的基础是1990年 Schapire构造的 Boosting算法[40],经 Freund和 Schapire对 Boosting算法 的 改进[41-42],解决了原 Boosting算法中需要依靠弱学习器先验 知 识 的 限 制,最 终 形 成 了 AdaBoost算 法。Ada-Boost算法的基本思想是:针对同一个训练样本集,并选定某单分类器,例如决策树,通过调整样本权重,训练一系列不同的分类器,进而组合成一个分类器系统。调整样本权重的规则是提高分类错误样本的权重,降低分类正确样本的权重。其目的是训练下一个分类器时,更加关注上一个分类器错分的样本。如此迭代训练,构建一系列单分类器,直到足够小的分类错误率为止。AdaBoost算法目前已成为一族算法,具有多个变种,其中包括 Discrete AdaBoost、Real AdaBoost、LogitBoost、Gentle AdBoost等。 本 研 究 表 明,Gentle Ad-Boost算法对SAR 溢油检测效果是较好的。本研究使用opencv函数库提供的 Gentle AdaBoost算法。Gentle AdaBoost的具体步骤如下:第一步:定义权重分布空间。Dm=(ωm,1,ωm,2,ωm,3,……ωm,i……,ωm,N)。 (2)其中:m 为迭代轮数,即单分类器的个数;i为训练样本编号,i=1,2,…N;为 m 轮迭代时第i个样本的权重。第二步:初始化权重空间。因为有 N 个训练样本,因此每个训练样本的初始权重为1/N。首先训练第一个单分类器,即迭代轮数为1,因此权重分布空间为:D1=(ω1,1,ω1,2,ω1,3,……ω1,i,……,ω1,N)= (1N,1N,1N,……1N,……,1N)。 (3)第三步:进行多次迭代,训练系列单分类器。(1)使用具有权重分布的训练样本集训练出第 m个单分类器Gm(x)的回归函数fm(x),其中fm(x)值域331中 国 海 洋 大 学 学 报 2 0 1 8 年为[-1,1],|fm(x)|反映了样本被分为某类的置信度,其符 号 为 分 类 器 输 出 的 类 别,即 Gm(x)=sign(fm(x))。(2)更新权重分布空间,从 Dm更新至Dm+1:ωm+1,i=ωm,iexp(-yifm(xi))。 (4)其中:是第 m 个分类器对某样本xi的回归函数值。yi是xi样本的真实值。此公式表明,对于分类错误的样本,其权重被增加,且被错分样本的置信度越高其权重被增加越多。规一化以使样本总权重为1,即:∑Mi=1ωm+1,i =1。 (5)第四步:组 合 各 单 分 类 器,形 成 一 个 强 分 类 器 系统,其回归函数由 M 个单分类器的回归函数之和求得。f(x)=∑Mm=1fm(x)。 (6)其中,M 是单分类器的系列总数。Gentle AdaBoost分类器系统的分类结果由下式描述:G(x)=sign(f(x))=sign(∑Mm=1fm(x))。(7)1.3Bagging算法Bagging 算 法 的 名 称 源 自 bootstrap aggregation(自助聚集),是一种组合系列同类型分类器构成一个强分类器系统的自助聚集算法。其基本思想是从个数为 N 的训练样本集中随 机 且 有 放 回 的 抽 取 个 数 为n(n(N)的 训 练 样 本 以 形 成 一 系 列 独 立 的 自 助 数 据集[30]。每个独立自助数据集训练一个选定类型的的分类器,例如决策树。这一系列独立决策树分类器的分类结果的平均值被取为 Bagging决策树分类器系统的最终分类结果。选定的分类器被称为 Bagging分类器系统中的分量分类器。研究表明[44,50-51,54-58],当自助数据集的样本数n 与训练样本集的样本数 N 相等时,由于其随机且有放回的样本抽取方式,某些样本可能被多次抽取,某些样本可能从不被抽取,而每个自助数据集中无重复的有效样本的概率为训练样本集总数 N 的63.2%,许多研究均采用这种抽取方式。另一些研究者使用了不同的抽取方式,包括按比例抽样[59]、无放回抽样[60-62,65]、交叉验证抽样[61-62]、先验概率抽样[63]、EBBag抽样[64-65]、un-der-sampling和 over-sampling 抽 样[64]等。对 于 SAR图像海面溢油自动识别系统,SAR 观测到的海面油膜和疑似油膜的样本数是不平衡的,即油膜样本往往远少于疑似油膜样本。我们希望保持各自助数据集中两种样本数比例为训练样本集中的原比例,因此本研究使用按比例,无放回抽样。Bagging算法的关键问题是训练多少个分量分类器是最佳的。许多研究表明[48,50-53],并非分量分类器越多,Bagging系统的性能越好。许多研究者通过测试实验来确定 Bagging系统中分量分类器的个数[29,44-49]。本研究表明,分量分类器过少,Bagging分类器系统的性能欠佳;分量分类器过多,会导致计算量过大而 Bag-ging分类器系统的性能并无提高。Bagging算法不仅是一个强分类器系统,同时亦是一个稳定性系统[30]。这是因为 Bagging分类器系统中的每个分量分类器都是使用不同的独立自助数据集训练而得,因而组合的Bagging分类器系统得以适应各种样本特征空间分布情况,并对不连续处作了平均化处理[30-31]。2 数据与特征参数本文使用的1 448个SAR 图像海面暗目标样本集源自65幅 Envisat/ASAR 精处理和宽刈幅图像,其中包括10幅2011中国渤海蓬莱19-3油田溢油事故期间的数据。暗目标样本由 Zeng[33]等研发的自适应阈值分割算法和软件提供。经人工经验判读,其中溢油样本564个,疑似溢油样本884个。对每个暗目标样本提取68个特征,其中包括14个几何特征、15个灰度特征、39个纹理特征(包括 24 个灰度共生矩阵特征和 15 个灰度梯度共生矩阵特征)。表1给出68个特征名称、分类和特征计算公式的参考文献[34-39,43]。3 实验与结果本研究建立了四个分类器和分类器系统,分别是决策树(DT)、AdaBoost-决策树(DT-A)、Bagging-决策树(DT-B)和 Bagging-AdaBoost-决 策 树 (DT-AB),并通过实验测试它们的检测率、泛化性能和稳定性能,以验证 DT-A、DT-B分类器系统对于 DT 单分类器在海面溢油 自 动 识 别 上 的 增 强 效 果,并 证 明 本 文 提 出 的DT-AB分类器系统的优良性能和应用前景。下面,首先介绍检测率、错检率和识别率的基本概念;其次通过测试实验确定 DT-B 和 DT-AB 分类器系统中分量 分 类 器 的 个 数。最 后 分 别 测 试 DT,DT-A,DT-B和 DT-AB的性能并作比较分析。3.1 检测率、错检率和识别率检测率,错检率和识别率是模式识别的 3 个重要指标。识别率是描述整个样本集内所有类别样本正确分类的比值,检测率是描述特定样本正确分类的比值,而错检率是描述特定样本被错误分类的比值。在本研究中,关心的是海面溢油样本的正确识别以及海面疑似溢油的 误 判,并 不 关 心 海 面 疑 似 溢 油 的 正 确 识 别。因此,高检测率和低错检率是 SAR 海面溢油自动识别业务化系统所追求的。431涛,等:用于SAR 图像海面溢油自动识别的 Bagging-AdaBoost决策树分类器系统表1 特征参数列表Table 1 Features list特征类别Category offeatures中英文特征名The Chinese and Englishnames of the features特征类别Category of features中英文特征名The Chinese and Englishnames of the features几何特征[34,43]目标面积(Area)目标周长(Perimeter)光滑度(Smoothness)不对称性(Asymmetry)形状因子(FormFactor)复杂度(Compactness)形状指数(ShapeIndex)七个不变矩(HuMoment1-7)灰度特征[43]目标灰度均值(Target_Mean)目标灰度标准差(Target_Stddev)背景灰度均值(最小外接矩形内)(Back_Mean)背景灰度标准差(最小外接矩形内)(Back_Stddev)最小外接矩形内均值(Rect_Mean)最小外接矩形内标准差(Rect_Stddev)边缘梯度(Edge_Gradient)众数(Mode)偏度(Skewness)峰度(Kurtosis)四分位距(IQR)目标均值背景均值比(Target_Mean/Back_Mean)目标均值目标标准差比(Target_Mean/Target_Stddev)目标标准差背景标准差比(Target_Stddev/Back_Stddev)背景均值背景标准差比(Back_Mean/Back_Stddev)灰度共生矩阵[35,36,37,43]角二阶矩(ASM)对比度(Contrast)Haralick相关(Haralick Correlation)方差(SSV)和均值(Sum Average)和方差(Sum Variance)熵的和(Sum Entropy)熵(Entropy)差分方差(Difference_Variance)差分熵(Difference_Entropy)信息测度1(Infor_Measures_1)信息测度2(Infor_Measures_2)最大相关系数(Max_Correlation_Coefficient)逆差归一化(Inverse_difference_normalized)逆差矩归一化(Inverse_difference_moment_normalized)逆差(Inverse_difference)相异性(Dissimilarity)最大概率(Maximum_Probability)逆差矩(Inverse_difference_moment)相关性(Correlation)惯性(Inertia)聚类削弱(Cluster_Shade)聚类凸显(Cluster_Prominence)自相关(Auto-correlation)灰度梯度共生矩阵[38,39,43]小梯度优势(Small_gradient_strengths)大梯度优势(Large_gradient_strengths)灰度分布的不均匀性(Gary_uneven_distribution)梯度分布的不均匀性(Gradient_uneven_distribution)能量(Energy)相关(Correlation)灰度熵(Gray_entropy)梯度熵(Gradient_entropy)混合熵(Entropy)惯性(Inertia)逆差矩(Inverse_difference_moment)灰度均值(Gray_average)灰度标准差(Gray_StdDev)梯度均值(Gradient_average)梯度标准差(Gradient_stdDev)531用于SAR 图像海面溢油自动识别的 Bagging-AdaBoost决策树分类器系统丁新涛,曾 侃 ,贺明霞(中国海洋大学海洋遥感研究所,山东 青岛 266003)摘 要: 目前应用于 SAR 图像海面溢油检测的分类器大多为单分类器,其检测率往往难以达到要求。本文引入 Ada-Boost算法和 Bagging算法,内核采用决策树分类器(Decision tree,DT),形 成 两 种 分 类 器 系 统 DT-A(AdaBoost-Decision-tree)和 DT-B(Bagging-Decision-tree)。进 而 提 出 以 AdaBoost分 类 器 系 统 为 内 核 的 Bagging 系 统 DT-AB(Bagging-Ada-Boost-Decision-tree)。对1 448个 Envisat/ASAR 海面暗目标样本进行分类实验,DT-AB分类器系统与 DT 单分类器相比,溢油暗目标检测率从74%增至83%,错检率从26%降至16%。对4种分类器的检测率、泛化性能和稳定性能进行了比较测试,结果如下:(1)DT-A 和 DT-B的泛化性能明显优于 DT,并且 DT-A 的泛化性能略优于 DT-B;(2)DT-A 和 DT-B比DT 的稳定性能提高一倍以上,DT-B的稳定性能略优于 DT-A;(3)DT-AB的泛化性能和稳定性能均优于 DT-A 和 DT-B。因此,DT-AB分类器系统用于卫星 SAR 图像海面溢油自动识别业务化系统具有应用前景。关键词: 合成孔径雷达(SAR);海面溢油;AdaBoost;Bagging;决策树中图法分类号: TP75;X87     文献标志码: A     文章编号: 1672-5174(2018)10-132-11DOI:10.16441/j.cnki.hdxb.20160013引用格式: 丁新涛,曾侃,贺明霞.用于 SAR 图像海面溢油自动识别的 Bagging-AdaBoost决策树分类器系统[J].中国海洋大学学报(自然科学版),2018,48(10):132-142.DING Xin-Tao,ZENG Kan,HE Ming-Xia.A bagging-ada boost-DT multiple classifier system based on SAR image for ma-rine oil spill automatic detection[J].Periodical of Ocean University of China,2018,48(10):132-142.   收稿日期:2016-03-12;修订日期:2017-01-21作者简介:丁新涛(1990-),男,硕士生,研究方向卫星SAR 图像海面溢油监测。E-mail:dingxintao_orsi@foxmail.com  通讯作者:E-mail:zengkan@ouc.edu.cn  海上溢油是人类工业活动引发的严重海洋环境污染之一。上世纪90年代以来,国际上可用于海洋观测的业务化卫星大发展,为海上溢油事故监测提供了无可比拟的新技术支持。其中,星载合成孔径雷达(Syn-thetic Aperture Radar,SAR)具有高空间分辨率、全天时全天候工作等优点,且对海面油膜的探测灵敏度高,被公认为监测海面溢油的理想传感器。SAR 对海面的成像机制基于雷达波与海面毛细波或短重 力 波 的 相 互 作 用,其 简 单 模 型 是 Bragg 散 射。海面油膜的存在,引起局部海表面张力的变大,导致海面粗糙 度 的 变 小,从 而 使 Bragg 后 向 散 射 系 数 变 小。在SAR 图像 上,海 面 油 膜 相 对 于 周 围 海 面 呈 现 为 暗斑。但是,SAR 图像中的暗斑不仅是海面溢油,众多大气和海洋现象都可能导致 SAR 图像中的暗斑,它们被称为疑似溢油(look-alikes)。因此,利用星载 SAR 图像监测海面溢油的关键技术之一是海面溢油和疑似溢油的自动识别技术[1-3]。目前,用于海面油膜识别的分类方法主要有四种,分别是概率统计模型[4-11]、神经网络[12-18]、决策树[2,21-23]以及模糊逻辑[19-20,32]。这些方法的共同点是,通过各种方式试图建立一个高检测率的单分类器。实际上,获得一个高检测率及优秀泛化性能和稳定性能的强单分类器是相当困难的,因此,Schipire等于1990年代在计算机学习领域提出了将多个弱分类器组合为强分类器的算法[24],其中包括 Boosting 算 法 及 其 改 进 型 Ada-Boost算法[25-26]和 Bagging 算 法[30-31]。这 些 算 法 在 计算机领域已 成 为 分 类 器 性 能 增 强 的 通 用 方 法。2006年,Geraldo L B Ramalho等在模式识别国际会议上首次以神经网络作为 Boosting算法的内核对 SAR 图像进行海面溢油检测[27],结果显示 Boosting算法增强了神经网络的分类结 果。2012 年,Topouzelis等首次使用 Bagging算法组合多个决策树分类器对溢油和疑似溢油SAR 图像样本进行分类,结果显示 Bagging算法增强了决策树单分类器的识别性能[28]。本研究针对1 448个 Envisat/ASAR 暗目标样本,进一步验证 AdaBoost算法 和 Bagging 算法对单分类器在SAR 图像海面溢油识别上的泛化性能和稳定性能的增强效果,选择决策树(Decision Tree,DT)作为单中 国 海 洋 大 学 学 报 2 0 1 8 年  检测率、错检率和识别率的计算公式及相关符号说明为下:人工判定类别溢油(Y=Yy+Yn) 疑似溢油(N=Ny+Nn)分类器判定类别 溢油(y=Yy+Ny) Yy Ny疑似溢油(n=Yn+Nn) Yn Nn  检测率=Yy/(Yy+Yn);错检率=Ny/(Yy+Ny);识别率=(Yy+Nn)/(Yy+Ny+Yn+Nn);其中,检 测 率 是 分 类 器 正 确 判 别 的 溢 油 样 本 数(Yy)与人工判别的溢油样本数(Y)的比值;错检率是分类器将人 工 判 别 为 疑 似 溢 油 样 本 误 判 为 溢 油 样 本 数(Ny)与分类器判别的溢油样本数(y)的比值;识别率是分类器正确判别的样本数(Yy+Nn)与测试样本集总数的比值。3.2Bagging分类器系统中分量分类器个数的选择如前所述,在测试两个 Bagging分类器系统(DT-B和 DT-AB)的检测率、泛化性能和稳定性能之前,需要通过测试实验来确定分量分类器的个数。测试实验流程如图2所示:图2 Bagging系统中分量分类器个数选择实验流程图Fig.2 The flow chart of the experiment that was used to test how many numbers component classifiers should be select  首先在 1 448 个 SAR 海 面暗目标样本集中按溢油/疑似溢油样本比例随机抽取70%的样本作为训练样本集,剩余样本作为测试样本集。然后从训练样本集中按同样比例随机抽取70%的样本作为独立的自助数据集,并训练出一个决策树(DT)分类器和以决策树为内核的 AdaBoost(DT-A)分类器系统。这个过程循环1 000次,即用1 000个独立的自助数据集分别训练出1 000个 DT 和 DT-AB。从训练好的 1 000个分 类 器中随机 抽 取 M(M=1~300)个分类器组成 Bagging系统,并对测试样本集进行测试,得到相应的检测率、错检率、识别率。将这个过程 循 环 100 次,得 到 100 个 分 量 分 类 器 为 M 的631涛,等:用于SAR 图像海面溢油自动识别的 Bagging-AdaBoost决策树分类器系统Bagging系统,同样对测试样本集进行测试,得到 100个相应的检测率,错检率,识别率。这100个独立分类器系统相应的检测率、错检率和识别率的均值和标准差即为分量分类器为 M 的 Bagging分类器系统(DT-B、DT-AB)的分类结果。图3为 DT-B 在不同个数分量分类器下的检测率及标准 差。可 以看出,当分量分类器个数 M 达到 10时,分类器系统的检测率均值达到最大。随着 M 的增加,检测 率 均 值 呈 降 低 趋 势,标 准 差 呈 变 小 趋 势。当M=130时,标准差趋于稳定,因此选择 DT-B 分类器系统的分量分类器个数 M=130。图4为 DT-AB 在不同个数分量分类器下的检测率及 标准差。可以看出,当分量分类 器个数 M 到 10时,分类器系统的检测率均值达到最大。随着 M 的增加,检测率均值呈降低趋势,当 M=50时,DT-AB检测率均值趋于稳定,标准差均值仍呈变小趋势。综合考虑分类性能和计算效率两方面,选择 DT-AB分类器系统的分量分类器个数 M=150。对比图3和4,可以看到,DT-AB分类器系统在检测率和标准差两方面均优于 DT-B分类器系统。图3 DT-B在不同个数分量分类器下的检测率及标准差(检测率的标准差表示为竖线线段)Fig.3 The mean value and standard deviation of DT-B’s detection rate with different numbers of component classifiers(The standard deviations of detection rate are expressed as vertical bar lines)图4 DT-AB在不同个数分量分类器下的检测率及标准差(检测率的标准差表示为竖线线段)Fig.4 The mean value and standard deviation of DT-AB’s detection rate with different numbers of component classifiers(The standard deviations of detection rate are expressed as vertical bar lines)731中 国 海 洋 大 学 学 报 2 0 1 8 年3.3 泛化性能泛化性能是描述分类器或分类器系统的普适性指标。常用的泛化性能测试方法有交叉验证法和自抽样法。本研究选择自抽样法(Booststrapping)对四种分类器或分类器系统(DT、DT-A、DT-B 以及 DT-AB)的泛化性能进行测试。自抽样法每次从样本集中抽取一部分样本训练分类器,而后对剩余样本进行测试。这样做 N 次,最后获取检测率、错检率和识别率的均值,作为泛化性能的衡量标准。设计的实验流程如图5所示。图5 泛化能力测试实验流程图Fig.5 The flow chart of the experiment that wasused to test generalization performance  首先从样本集中按溢油/疑似溢油样本比例随机抽取70%的样本作为训练样本集,剩余30%样本作为测试样本集。用训练样本集训练出 DT、DT-A、DT-B、DT-AB四种分类器或分类器系统。然后分别使用四种分类器或分类器系统对相应的测试集进行测试,得到各自的 检 测 率、错 检 率、识 别 率。 重 复 以 上 步 骤 100次,得到四种分类器或分类器系统各100个检测率、错检率、识别率,其中每次从样本集中随机抽取70%的样本作为训练样本集 的 过程即 为自抽样法 (Booststrap-ping)的概念。各100个检测率、错检率、识别率的均值和标准差即为评价 DT、DT-A、DT-B和 DT-AB泛化性能的指标。实验结果如表2所示。可以看出,DT-A 和 DT-B的检 测 率、错 检 率 和 识 别 率 均 优 于 DT,这 说 明 Ada-Boost算法(DT-A)与 Bagging算法(DT-B)确实提高了决策树单分类器的检测率和泛化性能,DT-A 略优于DT-B。尤 其,以 DT-A 分 类 器 系 统 为 分 量 分 类 器 的Bagging系统 DT-AB的检测率和识别率最高而错检率最低,说明其泛化性能最佳。3.4 稳定性能Breiman提出[30],如果一个 分 类器因训 练 集 样 本的较小改变而导致分类器性能的显著改变,则这种分类器被认为是“不稳定”(Unstable)的。Bagging算法对分类器稳定性能的提高需通过实验进行测试。测试过程需满足训练集样本的较小改变这一条件。需要获得一系列由略有差别的训练集训练出的某种分类器或分类器系统,进而得到它们对相同测试集的检测率、错检率和识别率的均值、标准差。以标准差作为稳定性的评价指标,标准差越小,表明稳定性能越好。表2 泛化能力测试实验结果Table 2 The test result of generalization performanceDT  DT-A检测率① 错检率② 识别率③ 检测率① 错检率② 识别率③均值④ 0.741  0.259  0.798  0.828  0.162  0.870标准差⑤ 0.045  0.028  0.019  0.031  0.026  0.015DT-B(130) DT-AB(150)检测率① 错检率② 识别率③ 检测率① 错检率② 识别率③均值④ 0.806  0.172  0.859  0.832  0.156  0.874标准差⑤ 0.032  0.027  0.016  0.028  0.026  0.015Note:①Detection rate;②False discovery rate;③Recognition rate;④Average;⑤Standard deviation831涛,等:用于SAR 图像海面溢油自动识别的 Bagging-AdaBoost决策树分类器系统  设计的实验流程如图6所示。首先从训练样本集中按溢油/疑似溢油样本比例随机抽取80%的样本组成微调训练集,并训练出 DT、DT-A、DT-B(130个分量分类器)和 DT-AB(150 个分量分类器)四种分类器或分类器系统。然后分别使用DT、DT-A、DT-B 和 DT-AB 对测试样本集进行测试,得到各自 的 检 测 率、错 检 率、识 别 率。重 复 以 上 步 骤100次,得到四种分类器各100个检测率、错检率、识别率。最后,计算各 100个检测率、错 检率、识别率的均值和标准差,以标准差作为分类器稳定性能的指标。实验结果如表3所示。可以看出,DT-A 和 DT-B的检测率、错检率和识别率的标准差均低于 DT,这说明 Bagging算法和 AdaBoost算法不仅提高了决策树单分类器的检测率和泛化性能,同时提高了稳定性能,DT-B的标准差略低于 DT-A 的标准差。尤其,DT-AB分类器系统的标准差最小,说明 DT-AB分类器系统不仅泛化性能最佳,其稳定性能亦最佳。图6 稳定性能测试实验流程图Fig.6 The flow chart of the experiment that was used to test stability performance表3 稳定性能测试实验结果Table 3 The test result of stability performanceDT  DT-A检测率① 错检率② 识别率③ 检测率① 错检率② 识别率③均值④ 0.728  0.269  0.789  0.820  0.168  0.865标准差⑤ 0.039  0.030  0.020  0.016  0.015  0.009  DT-B(130) DT-AB(150)  检测率① 错检率② 识别率③ 检测率① 错检率② 识别率③均值④ 0.810  0.184  0.855  0.826  0.161  0.870标准差⑤ 0.014  0.014  0.008  0.011  0.011  0.007Note:①Detection rate;②False discovery rate;③Recognition rate;④Average;⑤Standard deviation931中 国 海 洋 大 学 学 报 2 0 1 8 年4 结论与讨论近年一些重大的海上溢油事故引起广泛重视,从而利用卫星SAR 图像自动监测海面溢油成为 SAR 数据海洋应用的热点之一。目前应用于 SAR 海面溢油检测的分类器大多为单分类器,其检测率往往难以达到要求。本研究引入AdaBoost算法和 Bagging算法,采用决策树(DT)单分类器为其内核,形成两种分类器系统 DT-A 和 DT-B。进而提出以 DT-A 为内核的 Bagging分类器系统 DT-AB。对1 448个 Envisat/ASAR(C-Band)海面溢油和疑似溢油样本 集 进 行 分 类 实 验。结 果 表 明:(1)Ada-Boost算法和 Bagging算法可以明显增强单分类器的分类性能、泛化性能和稳定性能。(2)本研究首次提出的 DT-AB分类器系统的分类性能、泛化性能和稳定性能优于 DT-A 和 DT-B。因 此,DT-AB 分 类 器 系 统 用于卫星SAR 海面溢油自动识别业务化应用方面具有前景。本 研 究 对 不 同 时 空 覆 盖 的 Envisat/ASAR(C-Band)样 本 集 以 及 不 同 卫 星 不 同 波 段 的 COSMO-SkyMed SAR(X-Band)样本集进行了同样的实验,结果与上述一致。需要说明的是,上述用于实验的样本集中,海面溢油样本数与疑似溢油样本数的比例在 1∶5左右。而实际应用中,一幅 SAR 图像中的海面溢油样本数与疑似溢油样本数的比例往往达到 1∶100 甚至更大。这种样本不平衡问题是模式识别中的难点之一。在项目研究方案中采用一个新的自适应阈值分割算法先行解决严重的不平衡问题。今后,将针对样本集深入研究海面溢油和疑似溢油的特征参数。致谢:感谢中海油项目“海上溢油卫星自动识别和预警业务化系统研发”对本研究的资助以及项目课题组师 生 对 本 研 究 的 有 益 讨 论 和 帮 助。 感 谢 ESA-MOST Dargon3ID10580Project提供 Envisat/ASAR卫星图像。参考文献:[1] Brekke C,Solberg A H S.Oil spill detection by satellite remotesensing[J].Remote Sensing of Environment,2005,1:1-13.[2] Solberg A H S,Solberg R.A large-scale evaluation of features forautomatic detection of oil spills in ERS SAR images[C].Interna-tional Geoscience and Remote Sensing Symposium:IEEE,1996:1484-1486.[3] Konstantinos N,Topouzelis.Oil Spill Detection by SAR Images:Dark Formation Detection,Feature Extraction and ClassificationAlgorithms[J].Sensors,2008,10:6642-6659.[4] Solberg A H S,Volden E.Incorporation of Prior Knowledge inAutomatic Classification of Oil Spills in ERS SAR Images[C].In-ternational Geoscience and Remote Sensing Symposium:IEEE,1997:157-159.[5] Solberg A H S,Storvik G,Solberg R,et al.Automatic detectionof oil spills in ERS SAR images[J].IEEE Transactions on Geosci-ence and Remote Sensing,1999,37(4):1916-1924.[6] Solberg A H S,Dokken S T,Solberg R.Automatic detection of oilspills in Envisat,Radarsat and ERS SAR images[C].Internation-al Geoscience and Remote Sensing Symposium:IEEE,2003.[7] Solberg A H S,Brekke C,Husy P.Oil spill detection in Radarsatand Envisat SAR images [J].IEEE Transactions on Geoscienceand Remote Sensing,2007,45(3):746-755.[8] Fiscella B,Nirchio F,Pavese P,et al.Oil spill detection using ma-rine SAR images [J].International Journal of Remote Sensing,2000,21(18):3561-3566.[9] Nirchio F,Di Tomaso S,Biamino W,et al.Oil spills automaticdetection from SAR images [C].Envisat and ERS Symposium:IEEE,2004.[10] Nirchio F,Sorgente M,Giancaspro A,et al.Automatic detectionof oil spills from SAR images[J].International Journal of RemoteSensing,2005,26(6):1157-1174.[11] Brekke C,Solberg A H S.Classifiers and confidence estimationfor oil spill detection in ENVISAT ASAR images[J].Geoscienceand Remote Sensing Letters,2008,5:65-69.[12] Aires F,Prigent C,Rossow W B.Neural network uncertaintyassessment using Bayesian statistics:A remote sensing application[J].Neural Computation,2004,16(11):2415-58.[13] Del Frate F,Petrocchi A,Lichtenegger J,et al.Neural networksfor oil spill detection using ERS-SAR data[J].IEEE Transactionson Geoscience & Remote Sensing,2000,38(5):2282-2287.[14] Topouzelis K,Karathanassi V,Pavlakis P,et al.Oil Spill Detec-tion Using RBF Neural Networks and SAR Data[C].Journal ofPhotogrammetry and Remote Sensing Congress:IEEE,2004.[15] Topouzelis K,Karathanassi V,Pavlakis P,et al.Detection anddiscrimination between oil spills and look-alike phenomenathrough neural networks [J].Journal of Photogrammetry andRemote Sensing(ISPRS),2007,62:264-270.[16] Topouzelis K,Stathakis D,Karathanassi V.Investigation of ge-netic algorithms contribution to feature selection for oil spill de-tection[J].International Journal of Remote Sensing,2009,30:611-625.[17] Singha S,Bellerby T J,Trieschmann O.Detection and classifica-tion of oil spill and look-alike spots from SAR imagery using anArtificial Neural Network[C].Geoscience and Remote SensingSymposium:IEEE,2012:5630-5633.[18] Singha S,Bellerby T J,Trieschmann O.Satellite oil spill detec-tion using artificial neural networks[J].IEEE Journal of SelectedTopics in Applied Earth Observations and Remote Sensing,2013,6:2355-2363.[19] Keramitsogloua I,CartalisaC,Chris T Kiranoudisb.Automatic i-dentification of oil spills on satellite images[J].EnvironmentalModelling and Software,2006,21(5):640-652.[20] Karathanassi V,Topouzelis K,Pavlakis P,et al.An object‐o-riented methodology to detect oil spills[J].International Journal041

[返回]
上一篇:NTRU全同态掩码防御方案
下一篇:一个采用新颖的混合电容切换模式的SAR ADC设计