欢迎访问一起赢论文辅导网
本站动态
联系我们
 
 
 
 
 
 
 
 
 
 
 
QQ:3949358033

工作时间:9:00-24:00
机械论文
当前位置:首页 > 机械论文
混合过滤器和封装器启发式判别籽棉成熟
来源:一起赢论文网     日期:2013-06-25     浏览数:3251     【 字体:

  棉花是我国三大农作物之一 棉花采摘环节中人工手采棉质量 稳 定 市 场 欢 迎 但 拾 花 期 短 劳 动强度大受拾花工不足的制约 机械化采摘是发展方向但成本太高质 量 无 保 证 研制田间籽棉采摘机器人可以从源头上解决棉花采摘质量和成本问题田间籽棉成熟度判别是棉花采摘机器人视觉系统的关键技 术 之 一 描 述 籽 棉 成 熟 度 的 形 态 结 构 和 边界轮廓特征量大 势必造成维数灾难 必须进行特征选择
  近年来混合过滤器封装器和启发式搜索的特征选择算法已成为研 究 热 点 等 人 以 最 小生成树 中 的 几 何 信 息 为 过 滤 器 用 确 定 相关性增益 前 向 顺 序 选 择 了 特 征 子 集然 后 用图替代 在 个自然或合成的数据集上混合过 滤 器封装器选择了特征子集 等 人以 在训练集附近未知样本上的局部泛化误差 为过滤器顺序选择了特征子集 计 算 速度快尤其适宜 高 维 小 样 本 数 据 集 等 人 用基因提升法根据原始训练集的分类结果构造临时训练集并通过过滤 算 法 选 择 排 行 靠 前 的 特 征等人 以 距 离 为过滤器预选几个特征以 分类器为封装器从中选择最好的如此反复混合过 滤 器 封装器进行了前向浮动搜索并 给 出 了 不 同 混 合 系 数 下 特 征 子 集的识 别 率 陈 友 等 人 以 信 息 增 益 相 关 性为 过 滤 器 以 决 策 树 支 持 向 量 机和神经 网 络 为 封 装 器 基 于 遗 传 算 法和禁忌搜索进行 随 机 搜 索 特征子集的识别率依封装器混 合 过 滤 器封 装 器 和 过 滤 器 下 降 且 低 于 全部特征的识别率 本 文 将 田 间 籽 棉 是 否 成 熟 视 为 二类问题分别在空域频域中提取特征 并在空域频域以及空域合并频域 个特征集中混合过滤器封装器和启发式搜 索 提 出 了 一 种 效 率 高 效 果 好 的 特征选择算法
  特征提取
  田间籽棉通常由 个棉瓣构成成熟籽棉边界轮廓饱满圆滑 棉芯绽放未成熟籽棉边界轮廓瘦小突兀棉芯紧实因 此籽棉的形态结构和边界轮廓信息能够客观地反映籽棉的成熟度
  空域特征
  用一组同心圆切割棉瓣可获取棉瓣的形态结构信息考虑到精度与速度的匹配 一 般 选 用个同心圆比较合适 如 图 所 示 用 个 圆 外接棉瓣可获取全 局 特 征 棉瓣与外接圆面积之比用 个圆径向二等分切割棉瓣可获取径向切割区域特征 棉瓣内圈与外圈面积之比和 圆 周 向 切 割 区域特征 棉瓣内圈外 圈 面 积 占 其 所 在 圆 或 圆 环面积的比例 用 个圆径向 等分切割棉瓣可获取径向切割区域特征 棉 瓣 内 圈外 圈 面 积 与 中 圈面积之比和 圆 周 向 切 割 区 域 特 征 棉 瓣 内圈中圈外圈面积占其所在圆或圆环面积的比例用 个圆径向 等分切割棉瓣可获取径向切割线特征 棉 瓣 内 外切割线长度与中切割线长度之比和圆周向切割线特征 棉 瓣 内中外 切 割线长度占其所在圆周长的比例 为了描述籽棉的整体形态结构分布 以不同尺度的栅格度量棉瓣区域作出栅格子数 与尺度 的双对数图用线 性 回归法求取计盒维数图 棉 瓣 切 割将棉瓣个数全 局 特 征 径 向 切 割 区 域 特 征圆周向切割区域特征 径向切割线特征圆周向切割线特征 和计盒维数作为棉瓣的形态结构特征集 记作 相关分析 表 明 时切割区域与切割线特征之间径向与圆周向切割特征之间的部分相关系数超过 它们是 与 与 与 与与 与 与 与 单 因 素 方 差 分 析表明 时仅 在二类样本上的均值没有明显差异频域特征籽棉的边 界 轮 廓 信 息 可 用 邻域跟踪法沿着各棉瓣 边 界 依 次 获 取棉瓣边界像素的坐标序列为 封 闭 边 界 曲 线如 图 所 示归一化后基 于 复 变 量 在 频 域计算机研究与发展中提 取 各 次 谐 波 下 的 傅 里 叶 描 述 子它们具有平移缩放不变性 并且不是 严 格对称的图 邻域跟踪籽棉封闭边界将 作 为 籽 棉 的 边界轮 廓 特 征 集 记 作 相 关分析表明 时仅 与 的 相 关 系 数 大 于单因素方 差 分 析 表 明 时在二类样本上的均值没有明显差异特征选择算法特 征 选 择 一 般 包 括 评 估 特 征 子 集 产 生 特 征 子集停止条件和验证结果 个 阶 段 评 估 特 征子集分为过滤器 和 封 装 器 评 估 函 数过 滤 器 利 用 数据本身的特性基 于 距 离 测 度 信 息 测 度 相 关 性 测度和一致 性 测 度 等 评 估 特 征 子 集 效 率 高 通 用 性好但分类效果不确定 封装器根据分类器的误分率评估特征子集由于特征拟合分类器分 类 效 果 好但在速度上比过 滤 器 慢 时间主要消耗在成千上万次分类器的训练 及 其 性 能 验 证 上其实用性是一个值 得 关 注 的 问 题 产生特征子集分为穷举搜索启发式搜索和随机搜索 穷举搜索可以挖掘最优解但计算开销大有 时 几 乎 无 法 实 现 启 发 式 搜 索是一种次优搜索 计算开销小有时能获得类似穷举搜索的效果 随机搜索带有一定的智能性 停止条件并 验 证 结 果 就 是 确 立 何 时 停 止 搜 索 并 在新的数据集上验 证 其 准 确 性由于经过了特征选择的数据集最终都 要 用 来 设 计 一 个 分 类 器 可 基 于 分类器在数据集上的误分率停止搜索过滤器评估函数距离测度是所有过滤器评价函数中理论最完善研究时间最长的准则 包 括 概 率 距 离 类 内 和类间距离等类可分性准 则 根 据 类 内散布矩阵 类间散布矩阵 和混合散布矩阵定义而来它考虑了 多 维 空 间 中 样 本 之 间 的分布关系基于类内和类间距离可测量特征子集的分类效果若每一类样本都很好地聚集在其均值周围并且不同类别样本完全分离时 值较大启发式搜索启发式搜索是一系列基于启发式规则的次优搜索技术 特征作为 标 量 处 理 时 计 算 每 一 个 特征的 值 并 按 值 降 序 排 序选择前 个 值 最 大 的 特 征 形 成 最 优 维 特 征 子 集这 种 最 优 特 征 组 合 策 略 计 算简单其分 类 性 能 有 时 优 于 特 征 向 量 并 且 最优 是 最 优 的 子 集由 于 没 有 考 虑 特 征 之 间的关系可能不适应高度相关的特征集特征作 为 向 量 处 理 时从 个 特 征 中 顺 序 前向后向和浮动搜 索 值 最 大 的 最 优 维 特 征 子 集考虑了特征之间的关系 顺序前向搜 索 从 个 空 集 开 始 在 最 优 上 建 立 所 有并从中 选 择 最 优 搜 索 次 数 为顺序后向搜索从 个 特 征 开 始 在 最 优下建 立 所 有 并 从 中 选 择 最 优 搜 索 次 数 为浮 动 搜 索 是 近 几 年 的研究热点 之 一 它 允 许 在 搜 索 过 程 中 进 行 回 溯 反复剔除已经选择 的 特 征 并重新考虑已经剔除的特征使得最优 不一定是 最 优 的 子 集消 除 了前两种方法存在 的 嵌 套 效 应有可能获得近似最优解算法 前向浮动搜索算法王 玲 等混合过滤器和封装器启发式判别籽棉成熟度算法 可 描 述 为 以 下 步在 最 优 的 基 础上从 其余 个 特 征中 选 个 特 征 形成最 优 转 向 已 经 选 择 的 低 维 最 优依 次 检 验 包 含 新 特 征 后 是 否 改进了 值 如果是则用新特征替换已经选择的特征封装器评估函数分类 器 利 用 各 个 类 别 的 先 验 概 率 类 条件概率密度函 数 和 公 式 计 算 后 验 概 率 基 于最小错误率决策准 则 将 样 本 归 入 后 验 概 率 最大的类别其分类 性 能 通 常 优 于 或 相 当 于 其 他 分 类器 假定类条件 概 率 密 度 函 数 服 从 多 元 正 态 分布并 且 各 类 协 方 差 同 质 可 获 取 线 性 分类器其误分率常被用作封装器的评价函数方法是分别计算分类器 在 训 练 集 验证集和预测集上的误分率随着 不断增加训练集误差将逐渐减小当增加到足够大时 训练集误差会减小到零 在这一过程中验证集误差 则 经 历 了 由 逐 渐 减 小 到 逐 渐 增 大的过程其拐点处产生最优特征子集 由于拟合方法适应训练集使得 训 练 集 误 差 总 是 低 于 验 证 集 和 预测集误差算法描述本文的特征选择算法可概括为基于过滤器启发式搜索特征子集 以提高搜索效率 并基于封装器停止搜索以提高分类效果 具体步骤如下在训练集 上基 于 过 滤 器 启 发 式 搜 索 最 优维特征子集 并 用 最 优 建立线性 分类器其中过滤器评价函数为最大值启发式搜索策略为最优特征组合和前向浮动搜索在验证集上基于 封 装 器 从 最 优 维 特 征 子集 中 选 择 评 估 函 数 值 最 优 的特征子集评估函数为分类器在验证集上的最小误分率在预测集上验证最优特征子集的准确性结果与分析田间籽棉成熟度判别用于试验的田间籽棉正面图像样本来自南京农业大学苏棉 号试验田其中成熟籽棉 幅未成熟籽棉 幅二值化处理后获取空域特征集和频域特征集共计 个特征由于模式识别领域通常要求特征子集尽可能小并且每类样本的数量比特征子集至少大倍的模型才 比 较 稳 定 因 此在样本量不足的情形下可利用 交 叉 验 证 客 观 准 确 地 选 择 特 征 折交叉验证将数据集划分为 等份每次用 份作为训练集拟合模型 用剩余 份作为验证集选择模型已广泛应用于特征选择中 对 于 以 下 个 特 征集 空域 频 域空域合并 频 域 记作 基于 折 交 叉 验 证 用 全 部 样 本的 作为训练集和验证集选择最优特征子集 用其余 样本作为预测集验证最优特征子集的准确性最优特征组合在每 个 训 练 集 上 分 别 在 个 特 征 集 中 计 算 每个特征的 值组 合 前 个 值最大的特征形成最优 维特征 子 集和 并 用 最 优 和建立线性 分 类 器将 训 练 集 验 证 集 和 预测集样本划分为 类随 着 不 断 增 加 最 优和 在 个训练集上的平均 值分别在和之间单调递增其类可分性越来越好同时随着不断 增 加最 优 和 在个训练集上的平均 误 分 率 逐 渐 减 小如 图 所 示在 个验证集上的平均误分率分别在 和处达到局部极小 和 并且最优 和 在相应预测集上的平均误分率和 均未达到局部极小 可见最 优特征组合的最优 的分类性能 较 优 但 其 训 练 集 误差 却高于验证集 误 差 尽 管 还 存 在 分 类 性能更优的 和 但却以 牺 牲 特 征 子 集 尽 可 能 小为代价计算机研究与发展图 最优特征组合的特征子集的平均误分率随其容量变化浮动搜索在每个 训 练 集 上 分 别 在 个特征集中计算和 的 值从中选择 值最大的最优 和 计 算和 的值从中选 择 值 最 大 的 最 优 和 依 此 类推浮动搜索 值最大的 最 优和 并 用 最优 和 建 立 线 性 分 类 器将 训 练 集验证集和预测集样本划分为 类在搜索最优 和的过程中 出 现 了 回 溯 现 象随 着 不 断 增 加 最优 和 在 个训练集上的平均 值分别在和之间单 调 递 增 同 比 大 于 最 优 特 征 组 合 策略其增量 分别在 和 处 急剧增大如图 所示同时随着 不断 增 加最 优 和 在个训练集上的 平 均 误 分 率 逐 渐 减 小 至 和处达到局部极小 并且普遍低于最优特征组合策略使得训练集误差总 是 低 于 验 证 集 和 预 测 集 误 差 如图 所示 最优 和 在 个验证集上的 平均误分率于 和 处 达 到 局 部 极 小图 类可分性测量值的增量随着特征子集容量而变化和 并且最优 在 相 应 预 测 集 上的平 均 误 分 率 也 达 到 了 局 部 极 小 可 见浮动搜索的 最 优 的 分 类 性 能 较 优 尽 管 还 存 在分类性能更优的 和 但 却 以 牺 牲 特 征 子 集 尽可能小为代价本着特 征 子 集 尽 可 能 小 的 原 则 将 个 最 优如 表 所 示中出现频次较高的特征作为判别田间籽棉成熟度的最优特征子集它们在训练集验证集和预测集上分别获得和 的 平 均 识 别 率 该 特 征子集在二类样本上 的 均 值 显 著 不 同并 且 与高度相关描述了籽棉的整体分布 外 围 形 态 棉 芯结构和边界轮廓王 玲 等混合过滤器和封装器启发式判别籽棉成熟度图 浮动搜索的特征子集的平均误分率随其容量变化表 十个训练集上的最优算法有效性验证因 算 法 的 执 行 效 率 依 赖 于 具 体 硬 件 配 置 下 面仅在文献中涉及的数据集上比较文献中提及的算法方法与本文算法的分类性能 如表 所示 其中文献 中部分 数 据 集 无 法 下 载 并 忽 略 了 文 献中部分高 维 小 样 本 超 大 样 本 等 特 殊 数 据 集 文 献以 图的 为过滤器前向顺序搜索了特征子集并在数 据 集 中计算了所有特征以及特征子集在 分 类 器 上 的 折 交 叉 验 证 识 别率见文献 中 表 文 献 基 于 在 训练集附近未知样本上的 后 向 顺 序 搜 索 了 特征子集在文献 链接的数据集中计算了所有特征以及 特 征 子 集 在 上 的 留 一 验 证识别率见文献 中 表 文 献 中 混合 和 分 类 器改 变 其 混 合 系 数前向浮动搜索 了 特 征 子 集 在 文 献 链 接 的 数据集中计算 了 所 有 特 征 以 及 不 同 下 特 征 子 集 的折交叉验 证 识 别 率 见 文 献 中 图 文 献从 攻击和 二类样本的训练集和测试集中随机抽 取 个 数 据 集 个 训 练 集个测试 集基 于 遗 传 算 法 混 合 选择了特征子集基于 折交叉验证计算了所有特征以 及 特 征 子 集在 个 测 试 集 上 的平均检测率见文献 中 表 和 图 文 献从网络入侵训练集 中 随 机 抽 取和混合攻击 个训练 集并 从 网 络 入 侵 测 试 集中随 机 抽 取 种攻击的已知攻击和未知攻击共个测试集 以优化的线性支持向量机为封装器混合遗传算法和禁忌搜索 随 机 搜 索 特 征 子 集 在个测试集中计算了所有特征以及特征子集的分类正确率见文献 中 表 和 图 文 献 以检验为过滤器剔除无关和冗余特征 基于近似 前向 选 择 了 特 征 子 集 在 文计算机研究与发展表 文 献 中 的 算 法方法与本文算法分类性能的比较__王 玲 等混合过滤器和封装器启发式判别籽棉成熟度献 链接的数据集中计算了所有特征以及特征子集在 分类器和决策树上的识别率 见文献中表 文献 以 种 朴 素 分 类器和 网络为封装器浮动搜索了特征子集 在文献 链接的 个数据集中计算了所有特征以及特征子集在分类器 上 的 折交叉验证识别率 见 文献 中表在上述可下载的 个数据集上运行本文算法计算所有特 征 以 及 混 合 过 滤 器封 装 器 浮 动 搜 索 的特征子集在测试集 上 的 折交叉验证识别率 如 表所示 结 果 表 明 在 个 数 据 集 中 本 文 算 法 的分类性能高于文献算法 文 献 算 法 和 本 文算法均采用混合过滤器 封装 器 搜 索 特 征 子 集 仅 文献 算法采用随机搜索 其分类性能略高于本文算法其余采用顺序搜索 本文算法的分类性能高于文献算法文献 算法使用过滤器搜索特征子集因而其分类性能低于本文算法
  结 论
  本 文 提 取 了 描 述 籽 棉 形 态 结 构边 界 轮 廓 的 空域频域特征集这些特征集存在高度相关的特征且半数以上在二类 样 本 上 的 均 值 差 异 显 著 能 够 区 分籽棉的成熟度针对田间籽棉成熟度判别的特征选择问题属于难题本文基于 过 滤 器 启 发 式 搜 索 特 征 子 集 搜索效率高基于封 装 器 停 止 搜 索 分 类 效 果 好 并 验证了其有效性结论如下由于考虑了特征之间 的 关 系 浮 动 搜 索 的 特征子集的类可分性测量值同比大于最优特征组合其增量在低维空 间 急 剧 增 大使得特征子集在训练集上的误差普遍 低 于 最 优 特 征 组 合从 而 使 训 练 集误差总是低于验 证 集 和 预 测 集 误 差有 利 于 在 低 维空间停止特征选择频域特征集考虑了籽 棉 的 边 界 轮 廓但 可 能忽略棉芯结构空域特征集描述了籽棉的整体分布外围形态和棉芯 结 构 空域合并频域特征集则兼顾了籽棉的形态结 构 和 边 界 轮 廓 信 息基 于 该 特 征 集浮动搜索的特征 子 集 最 优 该最优特征子集的容量为 反映了 成 熟 籽 棉 边 界 饱 满 圆 滑 棉 芯 绽 放 未成熟籽棉边界瘦小突兀 棉芯紧实的特性 在预测集上的平均识别率为在 个数据集上验证本文算法的有效性结果表明本文算法在其中 个数据集上的分类性能优于文献 中提及的算法方法
    参 考 文 献陈 友 程 学 旗 李 洋 等基于特征选择的轻量级入侵检测系 统 软 件 学 报陈 友 沈 华 伟 李 洋 等一种高效的面向轻量级入侵检测系统的特征选择算法 计 算 机 学 报毛 勇 周 晓 波 夏 铮 等特征选择算法研究综述 模 式识别与人工智能崔 自 峰 徐 宝 文 张 卫 丰 等一 种 近 似 最优 特 征 选 择 算 法 计 算 机 学 报计算机研究与发展宋 枫 溪 高 秀 梅 刘 树 海 等统计模式识别中的维数削减与 低 损 降 维 计 算 机 学 报统 计 模 式 识 别 王 萍 等 译 版 北 京电子工业出版社王 玲 等混合过滤器和封装器启发式判别籽棉成熟度

[返回]
上一篇:基于落滚法则的球团矿生球堆积改进模型
下一篇:离散自适应重复控制:收敛性分析与实现