欢迎访问一起赢论文辅导网
本站动态
联系我们
 
 
 
 
 
 
 
 
 
 
 
QQ:3949358033

工作时间:9:00-24:00
材料论文
当前位置:首页 > 材料论文
基于核稀疏分类与多尺度分块旋转扩展的鲁棒图像识别
来源:一起赢论文网     日期:2013-07-10     浏览数:3712     【 字体:

摘 要 针对在图像旋转或局部扭曲变形等复杂情况下的图像识别问题,提出一种基于核稀疏分类与多尺度分块旋转扩展的鲁棒图像识别算法该算法首先对图像进行多尺度分块与旋转扩展,使得字典能近似测试图像局部的旋转扭曲与各种排列组合为了增加字典类间稀疏度,改善系统效率,提出一种字典降维策略 通过核随机坐标下降方法高效求解核稀疏分类的凸优化问题,进而通过对比不同类对测试图像的重构误差完成图像识别实验表明,与经典方法相比,文中方法具有更好的识别效果,对图像旋转或局部扭曲变形等复杂情况具有较好的鲁棒性
关键词 核稀疏分类,多尺度分块旋转扩展,图像识别
  引 言
  近年来,图像识别引起学术界广泛的关注,它是目标检测行为识别等后续应用的基础,在 社 会 安全航空航天等重大项目中有着广阔的应用前景近年来,基于稀疏分类框架的图像识别算法因其独特的抗噪声与抗遮挡能力引起较多学者的关注
  等[]提出基于稀疏分类(, ) 的鲁棒人脸识别方法,其在噪声和遮挡环境下具有较优的识别效果等[]提出结合稀疏分类与贝叶斯推理框架的目标跟踪与识别算法,还提出用细节模板对噪声遮挡等干扰进行建模的方法,同时还提出一种非负约束用以增强稀疏分类精度宋相法等[]提出一种基于稀疏表示的多标记学习算法此算法充分利用隶属度对标记进行排序,进而完成分类
  虽然稀疏分类方法在图像识别问题中得到较多的应用,但文 献[][]指 出,对于小样本分类问题,系数的稀疏性对分类准确率并没有实质的帮助针对此问题, 等[]指出结合线性判别分析技术能够提升类间的区分度,提升稀疏分类效果等[]成功将核函数( ) 技巧与稀疏分类结合在一起,此文献提出基于特征标记搜索(, ) 的核稀疏分类(, ) 算法并将其成功应用于人脸识别问题中然而, 等[]指出使用 方法求取 中凸优化问题的效率较低,所以提出核坐标 下 降 法( , ) 用以求解凸优化问题,并结合 特征构建人脸识别系统但是, 方法效率不高,因此需要进一步研究高效的凸优化问题求解方法
  以上方法适合刚性物体的识别任务,但是由于场景或柔性物体目标等非特殊目标的特征组合方式与刚性物体目标有很大差别,主要是柔性物体目标可能发生弯曲变形,目标部分区域可能发生旋转或重叠等情况对于同类场景,场景中的多种物体( 如天空,大海,树林,房屋,以及行人等) 的组合方式会有多种可能所以,通用的稀疏分类 方法不能直接用于此类任务针 对 此 类 问 题,殷 飞 等[]提 出一种基于稀疏表示与旋转扩展的遥感图像目标识别算法其算法是对训练集进行旋转扩展,使得测试图像能近似用训练集稀疏表示,然后通过求解一个范数最小化问题得到测试图像相对于训练集的一个稀疏表示,进而根据不同类对应的稀疏表示对测试图像的近似程度进行识别这种方法能较好地处理目标整体的不确定旋转,但其不能很好处理目标的部分旋转或部分随机组合等情况
  本文提出基于核稀疏分类和多尺度分块旋转扩展( ) 的图像识别算法 首先提出核随机坐 标 下 降 法 ( ,) 用 以 求 解 中 凸 优 化 问 题,其 效 率 比更高,并分析选用不同核函数对系统识别率的影响 其次,提出多尺度分块旋转扩展(, ) 方法用以构建字典,为了提升系统效率,提出一种字典降维方法结合与 提出相应的图像识别方法最后通过大量实验对比 算法与其它算法在通用图像识别任务中的性能差异,并分析不同倍数的旋转扩展在不同训练样本数量对识别率的影响
  核稀疏分类
  稀疏分类基于稀疏分类的图像识别算法本质为寻找测试图像相对于训练集的最稀疏表示,并基于得到的稀疏表示对测试图像分类该方法的前提是对任一测试图像存在一种稀疏表示[],即训练集可作为测试集的过完备字典设训练图像的分辨率为 ,共有 类训练图像,将每幅训练图变换为列向量 , ,令表示第 类图像对应的字典,则 [,,,],那么 个训练图像组成第类字典矩阵[,,,,,,]在稀疏表示框架下,目标列向量 可由训练字典 和稀疏系数向量 的线性组合重构[]:( )在理想情况下,向量 中只有属于某类的 个系数不为零但是,在现实情况中,因为目标列向量中有噪声信号污染,目标列向量很难得到完美恢复,所 以 式( ) 需要加上松弛条件:,其中,为实 际 列 向 量, 为 重 构 残 差在 上 式中,字典 与 是已知的,需要求出的是测试图像在字典中所对应的系数向量 另 外 因 为 是 欠 定的,所以没有唯一解最稀疏解就是唯一的,则模式识别与人工智能 卷( ) , ( )其中, ,为折衷权值,增大则系数的稀疏度增大 为非零系数的个数式( ) 为一个无法在多项式里求解的问题,但是近期压缩感知理论[]证明如果式( ) 的解足够稀疏,则它等于( ) ,( )其中, ,用 范数方法代替 范数这是一个凸优化问题,存在多种有效解法如果根据以上计算得到的系数足够稀疏,则其包含有效的分类信息核稀疏分类取得较高分类正确率的前提是字典 的列向量之间不相关 但是在图像识别任务中,有时不同类别图像之间可能存在较多的相似图案,则字典的列向量的相关度较高,则式( ) 的非零解可能集中在错误的类别上[]核函数为维度变换函数,其将特征向量由低维空间投影到高维度空间,增大类别间的几何距离,使得线性不可分变为线性可分其在支持向量机等经典分类器中有较多的成功应用 受文献[]的启发,核函数技巧也能应用于稀疏表示问题中,降低分类难度,减少重构误差设函数 将特征从维度空间 投影到维度空间 , ,待分类向量被投影为( ) ,字典被投影为( ) , ( ) , ,( ) ( )设( ,) ( ) ( ) ,则式( ) 在核函数空间中可写为( ) ( ) ( )( )受文献[]的 启 示,本 文 提 出 用 来 求 解 式( ) ,与[]及 ( )[]方法相比,本文算法具有更快的收敛速度使 用求解稀疏系数的条件为目标函数 ( ) 的梯度符合独立坐标利普希茨连续 () ,即( ) ( ) ,当 时,对( ) 求偏导,则( ,) ( ) ( ) ,( ,) ( ) ( ) ,( ) ( ,) ( ,)通过计算可知( ) ( )( )( ,) ,其中,( ,) ,由此可知目标函数的梯度 ( )可微,且其一次导数有界 所以目标函数 ( ) 的梯度符合利普希茨连续由文献[]可知, 的更新方法:( ) ,其中 为[,]之间的随机整数 所以,对于任意核函数( ,) , 能靠上式迭代优化稀疏系数接下来定义 方法对图像进行识别,若为对应于第类的残差:( )( ,) ( ,) ,其中 为 第 类 对 应 的 系 数 若 第 类 的 残 差 最小,则测试图像属于第 类本文方法可结合多种形式核函数,如高斯核函数( ) ,拉普拉斯核函数() ,有理二次核函数( )等不同种类的核函数所对应的最终分类精度有所不同( 如高斯核函数在小样本情况下分类精度较差) ,本文将在第 节中显示对比实验结果过完备字 典 的 构 建 和 分 块 旋 转扩展原理过完备字典的降维字典 的构建是稀疏分类的一部分为保证识别效果,必须是过完备的,即在较小误差内对于任意测试图像向量,都能使用一组训练向量的线性叠加表示文献[][]随机选择图像集中一部分图片,并将这些图片作为过完备字典这样的过完备字典中训练向量的数量是庞大的,这 将 导 致 使 用算法求解最优解所需时间可能会过长 文献[]提出基于压缩感知的下采样方法对原始图像进行降维但此方法是有损压缩,会降低识别精度假设在一张图片中,有一些区域的纹理颜色以及亮度等特征是非常相似的每类字典 中的原子期 匡金骏 等: 基于核稀疏分类与多尺度分块旋转扩展的鲁棒图像识别是原图 向 量 的 子 集( 分 块) ,所以如果假设成立,则这些子向量之中有部分欧氏距离较小,抛弃这些相似性较大的子向量,能在不影响字典 完备性的前提下大幅度减少原子 的数量设欧氏距离为 ,设最小相似度阈值为 ,则((, ,)) ,其中,为原子的第 维向量 与 代表第与个原子,当固定时,遍历,类似地,当固定时,遍历 如果 ,说明两个原子的特征非常相似,则随机抛弃其中一个原子图 显示用此方法进行降维对凸优化次数的影响数据集为 ,在将图分为 块时,原子数量减少 ,降维后比降维前系统效率高两倍以上,结果为 次运算的均值图 字典降维与优化次数的降低多尺度分块旋转扩展原理以上章节介绍的图像识别方法对噪声 遮挡等情况具有较好的鲁棒性,但此方法存在一个假设: 一幅图像被成功识别的前提是在字典中存在同类的完备原子集合,进而保证测试图像向量可用训练集稀疏表示,见式( )在图像识别任务中,图像的主体可能是刚性物体,如预处理后的人脸正面照,经典 算法在处理此类图像时能取得极佳的识别效果但对于未经预处理的图像,如在不同角度拍摄的人脸图片或是由卫星拍摄的遥感汽车图片等,则有可能因为字典的完备性不足导致识别效率下降另外,若图像的主体是柔性物体或多个无关物体,则物体的局部旋转或图像中多种物体的随机排列会导致使用 算法的重构率下降,进而导致对图像类别的识别率下降本文通过对训练集进行多尺度分块旋转扩展来解决以上问题具体来说,首先构造尺度为 { ,,,} 的网格对原始图像进行分割,尺度的网格由个分块组成然后对在尺度的每个分块 进行一定角度的旋转得到多幅图像 ,,,,,,,其中, 用这些旋转得到的图像扩展训练集得到新训练集:[,,,,,,,,,,,,,,,,,,,,,],[,,,],其中,( ) ( ),该过程称为对尺度为 的分块训练集做倍旋转扩展 为训练集的 倍多尺度分块旋转扩展 节中介绍的第 类字典 可由转 换 获 取,且其可被重新定义为 [,,,], ( ) ,函数( ) 的功能是将二维向量转化为一维向量图 展示多尺度分块旋转扩展的原理,其中右图显示不同尺度的分块所对应的原图区域,对于图像中的柔性易变形物体,旋转扩展后的小尺寸分块比大尺寸分块有更多种排列组合方式,具有更强的重构能力图 左图展示使用旋转扩展的图像分块求取稀疏表示的过程,在将旋转扩展后的图像分块转换成一维向量之后,再结合使用 节介绍的核稀疏分类 方法对测试图片进行识别图 多尺度分块旋转扩展原理示意图由 节的降维方式可知,仅使用小尺寸分块作为字典具有更高的运算效率但是,小尺寸分块会丢失部分图像的整体结构信息,因此有可能降低分类识别精度所以,为了平衡效率与精度,在识别阶段需要自适应地选择尺寸: 预设阈值,首先使用最大尺寸字典对待识别目标进行重构,若最小残差,说明仅用此尺寸的字典无法有效表示目标,则使用更小尺寸的字典计算重构残差对训练集做多尺度分块旋转扩展后,任意旋转角度的测试图像柔性物体以及多物体的排列组合都可用训练集稀疏表示进而完成识别模式识别与人工智能 卷结合核稀 疏 分 类 和 多 尺 度 分 块旋转扩展字典的图像识别算法将训练样本图像按尺寸 { ,,} 进行分块,并根据 节介绍的方法删除每类中相似的分块,并构建字典首先将测试样本图像按尺寸 { ,,} 进行分块,得到测试向量 { ,,} 然后用 方法求取在尺度 时的所有类别中最小重构残差,预设阈值,若 ,说明重构率太低,需要在更小尺度上进行尝试在尺度 时, 方法只能求出分块的 类重构残差,,全图重构残差为所有分块的均值:,,如果所有类重构残差中最小的为 ,且 ,则可认为测试图像属于 类如果 ,则可知此尺度的重构误差过大,需要在更小尺度上进行尝试,若最小尺度的重构误差仍然过大,则系统拒绝识别此图像分尺度重构策略兼顾识别精度与识别效率 理论上,对于预处理之后的标准测试图像,方法最高识别效率能与经典 方法相同对于未经预处理的通用测试图像,其最低识别精度高于经典 方法实验与结果分析本文使用 场景识别数据集[]以及 行为识别数据集进行测试实验,经过预处理后,所有图片变为 像素的灰度图选择以上数据集的原因是因为它们的图像包含更多类内变化,待识别物体不在图像正中,而且包含的类别和种类足够多 本文的实验环境: 双核, 内存,实现算法的软件是算法性能对比测试本节测试本文算法( ) 在上述种数据集上的识别率,最大分块尺度取 ,旋转扩展倍数为 ,随机选取原数据集中的图片作为训练集,其余部分作为测试集由于训练样本是随机选择,所以在每个训练集大小进行次测试,取识别结果的平均值作为算法在该训练集大小下的识别率另外,在上述实验设置下,将本文算法与其它 种算法做对比这 种算法分别为经典 算法[],核函数稀疏分类[]方法,稀疏编码空间金字塔匹配[]方法以及基于不变矩和支持向量机的识别方法( )[]( 矩) ,其 使用 核函数,本文算法与都使用拉普拉斯核函数实验结果如表 所示,无多尺度分块旋转扩展的 和 算法的识别率明显低于其它算法,这是因为训练测试集的线性组合无法有效表示测试图像而本文算法通过多尺度分块旋转扩展使得其字典足够完备,实际对残缺遮挡等图像都有一定鲁棒性,所以取得较好结果在各种大小训练集下,和 的识别率相差不大,本文算法高于这两种算法,这是因为本文算法对图像部分旋转变形的鲁棒性导致的另外,除本文算法外其它 种方法在小样本情况下识别率较低,而本文算法在训练集小到只占原数据集 时才有小幅下降,这说明对小样本情况也具有较好的鲁棒性表 种方法在各种训练集下的识别率识别方法训练集比例需要指出的是, 是一种基于实例( ) 的机器学习方法[],其无需训练,但为了获取稀疏分类的结果,求解凸优化问题的时间随样本数量增加而增加,所以测试时间较长在实现中当训练集大小为数据集的 时,平均每测试一幅图像需要 为提高求解速度,需要减少字典中原子的数量,所以,在下一节将测试不同的尺度数量与旋转扩展倍数对识别精度的影响旋转扩展倍数的选择本节通过实验分析验证分块旋转扩展的倍数对算法速度及识别精度的影响本文算法在对不同类别的图像进行重构时所需的分块大小和旋转扩展倍数是不固定的 如在图中的两类图像的性质有本质的区别,阙草类图像中虽然纹路相似,但每张图的纹路组合和纹路方向都不同望远镜类图像中,相同型号的产品的外观是相同的,虽然在拍摄照片时存在角度差异,但其不同尺期 匡金骏 等: 基于核稀疏分类与多尺度分块旋转扩展的鲁棒图像识别度上的分块旋转角度是一致的所以,理论上对于有大量细节旋转差异或部分随机组合的图像类别,一定需要对其小尺度分块进行高倍数的旋转才能保证较高的识别率,而对于任意类图像,无法保证所有测试图像在大小尺度分块的旋转与排列都一致,因此,表 显示在各种旋转扩展倍数和各种训练集大小下的识别率在计算残差时,对于不同的尺度的分块字典的选择问题,采用 节提出的由粗到精的自适应原则图 不同类别图像示例表 显示 在各种旋转扩展倍数和各种训练集大小下的识别率从实验结果可看出,对不同训练集比例总体来说并不是旋转扩展倍数越大识别率越高,这是因为分块的旋转扩展虽然增加类内字典的完备性,但另一方面有可能减少类间的稀疏性,根据压缩感知理论[],式( ) 与式( ) 等价的前提是保证字典类间的稀疏性所以如果旋转扩展倍数太大, 求到的就不是真正的稀疏表示,基于它的识别也就不准确 从 表 还 可 看出,当训练集比例非常低的时候( 如 ) ,增大旋转扩展倍数能提高识别率,当训练集比例较高时,增大旋转扩展倍数反而降低识别率这是因为在训练集比例较高时,字典的完备性也相对较高,而增加旋转表 算法在各种旋转扩展倍数和各种训练集下的识别率旋转扩展倍数训练集比例扩展倍数在小幅增加类内完备性的同时,却较大幅度地减少类间的稀疏性,从而导致算法识别率下降不同核函数对识别率的影响虽然在现有文献中缺乏如何选择核函数的系统性指导原则,但通过各种分类实验观察结果表明,特定问题使用特定的核函数会取得更好的效 果在众多核函数中,高斯核函数的应用范围最广泛,但其在训练样本数量较少时分类精度不佳本实验将使用高斯核函数拉普拉斯核函数以及有理二次核函数进行对比实验,这 种 核 函数都满足假设 ( ,) ( ) ( )) 高斯核函数:, ( )( )) 拉普拉斯核函数:, ( )( )) 有理二次核函数:, ( )表 算法在不同核函数和各种训练集大小下的识别率核函数训练集比例无核函数高斯拉普拉斯有理二次参数选择会影响其余核函数的分类精度,旋转扩展倍数设定为 表 显示 种核 函 数 在 最优参数设定时的识别精度在 本 实 验 中,高 斯 核函数的 ,拉普拉斯核函数 ,有 理 二次核函数 实 验 结 果 如 表 所 示,在 不 使 用核函数进行特征空间变换时,虽然比 经 典 效果 要好,但相比其它 种 算法要相差很多拉普拉斯核函数在本实验中比另外两种核函数有更好的效果高斯核函数在小样本时识别精度较 差,但在样本足够的情况下,比有理二次函数更佳需要说明的是,实 验 结 果 为 次 测 试 的 平均值模式识别与人工智能 卷
  结 束 语
  本文提出的基于核稀疏分类与多尺度分块旋转扩展的图像识别算法( ) ,在文中推导证明核函数随机坐标下降法求解核稀疏分类中凸优化问题的合理性同时提出多尺度分块旋转扩展原理,并给出相应的字典降维方法与图像识别算法实验结果表明,本文算法比其它经典算法有更好的识别精度,但由于 有可能导致字典体积过大,求解凸优化时间过长,所以对识别速度较敏感的任务,可适当降低旋转扩展倍数以提升算法速度
    参 考 文 献 ( 宋相法,焦李成基于稀疏表示的多标记学习算法 模式识别与人工智能, ,( ) : ) ( 殷 飞,焦李成基于旋转扩展和稀疏表示的鲁棒遥感图像目标识别模式识别与人工智能, ,( ) : ) ( 张艳宁,郑江宾,王晓红,等一种有效的遥感图像目标识别方法信号处理, ,( ) : ) 期 匡金骏 等: 基于核稀疏分类与多尺度分块旋转扩展的鲁棒图像识别

[返回]
上一篇:谈电力系统中的电气自动化技术
下一篇:模拟通信信号调制方式自动识别算法