基于稀疏近邻表示的分类方法 - 计算机论文 - 一起赢论文辅导网--专业代写代发SCI、EI、核心期刊、代写MBA、硕博毕业论文。QQ910330594

欢迎访问一起赢论文辅导网

加入收藏 | 设为主页 | 联系我们

本站动态

联系我们

QQ：3949358033

微信：paperwinner

工作时间：9:00-24:00

成功案例

计算机论文

当前位置：首页 > 计算机论文

基于稀疏近邻表示的分类方法

来源：一起赢论文网日期：2013-06-14 浏览数：3688 【字体：大中小】

摘要稀疏表示分类方法在人脸识别方面取得了当前最好的分类结果针对存在的问题提出稀疏近邻表示方法在局部线性嵌入方法前提假设成立的条件下通过稀疏近邻表示实现目标分类在几个不同数据集上的实验结果显示适用于呈非线性分布的数据集并取得了较好的效果进一步的分析表明能够较好的适用于那些通过降维方法得到的低维数据的分类问题尤其适用于基于近邻保持的一类降维方法得到的低维数据并且具有较低的时间复杂度
关键词稀疏表示局部线性嵌入稀疏近邻表示近邻分类降维
　　引言
　　传统的信号表示理论大多是基于非冗余的正交基函数的变换如傅立叶变换变换小波变换等年等人首先提出基于过完备的词典的信号稀疏表示方法开创了信号稀疏分解的新方向近年来该领域的研究主要集中在设计一组针对具体对象的过完备字典有效的求解稀疏编码的算法以及在信号和图像处理还有模式识别领域的应用在模式识别这个研究方向有利于解决分类问题的一类稀疏表示方法得到显著的关注文献介绍了一种学习多个字典的方法其中每个字典在具有重构性的同时还具有判别性该方法通过学习得到的字典对每个图像块进行稀疏表示最后用重构误差实现对像素的分类与文献相比等人则提出一种同时具有重构性和判别性的稀疏图像分类方法该方法在具有稀疏性的同时还具有鲁棒性很强的重构性进而有效的实现了对有损信号的分类与文献预先指定字典相似在文献中作者提出一种基于图像的通用目标识别方法基于稀疏表示的分类方法该方法把模式识别问题看作一个针对多个线性重构模型的分类问题同时文献还强调信号稀疏表示理论为该方法解决模式识别问题提供了强有力的依据虽然算法的主要目的是强调其判别性但是算计算机工程与设计年法整个过程并没有体现出明显的判别性针对上述问题本文提出改进的稀疏表示分类方法判别性是本文提出方法强调的一个重要方面
　　基于稀疏表示的分类方法
　　算法的主要思想是对于一个测试样本从一个过完备的字典中包含整个训练集寻找能够稀疏表示的一组基元素全部基元素称作基具体而言如果训练集中包含的样本数量足够多那么对于测试样本来说其将可以由与其属于同一类别的部分训练样本线性重构同时其线性重构权值向量满足一定的稀疏性即重构权值向量中只有少数几个分量是非零的文献总结了算法在解决计算机视觉问题方面的两个贡献一方面针对高维可视化的数据采用稀疏表示尤其重要另一方面提供了一个求解范数最小化问题的方法对其它的优化方法也具有较好的借鉴意义从文献的几个示例中可以发现如果恰当的应用算法其可以达到目前最好的分类性能算法的具体步骤如下所示单位化训练集中的每个样本其中求解范数最小化问题满足或者求解对于任意的一个测试样本计算每一类的残差式中一个维向量并且若属于第类那么否则虽然算法有很多令人满意的优点其同时也存在一些缺陷首先该算法缺乏明显的判别性算法根据基元素所属的类别对测试样本进行分类若基元素属于第类那么也属于第类其中基元素为那些可以最好的稀疏表示的一类训练样本事实上由确定的这组基元素中很可能包括距离比较远的样本即这组基元素并不一定是的局部近邻在此情况下根据算法将被分到某一类中其中该类基元素所张成的子空间距离最近即使该类样本距离比较远然而如果上述结论成立的话算法需要一个前提假设即使每类的基元素相互之间距离比较远由各类基元素张成的子空间仍然是线性的也就是说算法成立的一个前提是每类训练样本所张成的子空间是线性的其次即使每类训练样本分布在一个线性子空间里仍可能出现一种情形测试样本可以由来自多个不同类别的基元素稀疏表示其原因在于分别由各个类别训练样本所张成的子空间之间可能存在交集从而那些距离交集比较近的测试样本则可以由来自不同类别的基元素稀疏表示而这可能导致在求得的基元素中没有或者包含很少的与属于同一类别的训练样本因此除了需要满足每类训练样本位于同一个线性子空间的假设还需要另外一个前提条件各个类别训练样本张成的子空间之间不能有交集或者距离太近由上述分析可知算法无法有效处理非线性分布的数据分类问题基于稀疏近邻表示的分类方法本文提出一种新的分类方法基于稀疏近邻表示的分类方法该方法可以有效的解决上述算法遇到的问题即数据集是非线性分布的不满足算法的前提假设算法介绍对于任意的一个测试样本与算法不同的是算法首先计算在每个类别中的近邻其次每类的近邻被当作一个局部基然后这些基被用来线性表示最后被分到某个类别中满足其在该类别的基能够最好的线性重构简而言之算法求解如下优化问题式中在第个类中的近邻且或者求解以下问题其中为了方便起见等同于求解如下优化问题其中且需要注意的是由于因此与在整个训练集中寻找一个全局基不同的是则从每个类别中寻找的近邻作为其在该类别的局部基这么做的好处在于可以有效的避免遇到的问题即根据算法得到的基可能包含来自各个类别的样本更差的情况是该基中仅仅只有很少的甚至没有与属于同一类别的样本在此情形下很容易被分错类别然而算法则不会发生上述情形其原因在于在每一类中都寻找了近邻作为一个局部基即对每一类分别计算此外再加上另外两个约束项算法还第卷第期王琦惠康华基于稀疏近邻表示的分类方法可以用于线性分布的数据分类问题进一步地与相比求解每个局部基稀疏表示系数的时间复杂度要更低算法的整个识别过程如下所示单位化每个训练样本其中在训练集的每一个类别中分别计算测试样本的近邻其中是在第类中的第个近邻且求解最小化问题计算局部稀疏表示残差算法论证对于非线性分布的一类数据集算法如何保证仅根据其在每类中的近邻就可以对测试样本进行正确的分类？在讨论开始之前先考虑一个问题如果一个样本属于第类那么其近邻将属于哪个类别？根据分类方法的分类原则可知的大部分近邻将和属于同一类别如果上述分析成立的话如何使得被正确分类呢？这里首先介绍一个非线性降维方法局部线性嵌入方法方法有一个前提假设即使高维样本数据分布在一个非线性的流形上该流形的局部区域仍然满足线性关系也就是说每个样本及其局部近邻位于一个近似的局部线性块上用这些局部线性块来近似的描述流形结构的重要意义在于其近似的表示不会引起太大的误差其原因在于当对流形进行局部分析时其局部区域并不会包括太多的曲形结构从而用线性超平面来近似表示是可行的此外在过去的几年内相关作者提出许多基于的一类算法算法以及正交近邻保持映射所有这些方法的成功应用证明了的前提假设即非线性流形的局部块满足线性关系是可信的现在回到上面的问题对于一个测试样本算法如何进行正确分类根据算法可知在样本集的数据量比较充足的情况下样本集中的每个样本及其局部近邻将位于一个近似的局部线性块上也就是说如果测试样本距离其在第类的近邻比较近的话那么式中的线性重构残差将会非常的小与此同时根据的分类原则可知与其局部近邻属于同一个类别但是对于那些距离比较远的样本的分类原则将不再适用针对算法判别性的分析如下若测试样本属于第类那么根据分类准则与其在第类的近邻之间的距离比之与其它类别中的近邻之间的距离将会明显的小即第类近邻对的线性重构残差将明显小于其它类别近邻对的线性重构残差其中且具体而言根据分类方法的分类准则样本在第类的近邻中的大部分样本将属于在整个训练集上的近邻即第类的近邻是的真实近邻然而样本在其它类别的近邻中的大部分样本将不属于在整个训练集上的近邻即这些类别中的近邻距离比较远于此同时根据的假设的这些真实近邻由于距离比较近满足局部性因而可以较好的近似线性表示与之相对地由于其它类别的近邻距离比较远不满足局部性因此这些近邻将无法保证可以近似的线性表示诚然与算法采用稀疏近邻表示方法线性重构相比算法通过在整个训练集上优化求得的基可以更好的线性重构测试样本但是这在分类问题中作用并不是特别明显相比算法算法在采用稀疏近邻表示方法实现次优的稀疏表示的同时增加了判别性从某种意义上来说算法可以被看作是稀疏表示和判别性的一种折衷图算法表示测试样本为在第类的近邻为在第类的近邻对应的实线长度分别代表第类重构权值向量的两个分量值以及第类重构权值向量的两个分量值需要注意的是如果通过求解如下的重构误差优化问题代替式其将只适用于那些满足局部线性并且全局非线性的数据集原因在于如果数据集满足全局线性关系那么对于属于第类的测试样本来说由于数据集是局部线性的所以第类的近邻对的线性重构误差将会较小但是同时其它类的近邻对的线性重构误差也可能比较小因为数据集是全局线性的也就是说当数据集满足全局线性关系时计算机工程与设计年可能比较接近甚至大于进而测试样本容易被错分然而算法将不会发生上述情形如图所示虽然在第类的近邻和第类的近邻都可以很好的线性重构但是第类近邻的线性重构权值向量和第类近邻的重构权值向量却截然不同详细地相比而言距离测试样本更近并且此外为了使得和之间的差异变大被加到式上即式或者式令的原因在于距离测试样本比较远的那些样本在重构的过程中容易产生负的重构权值即比较容易大于从而当时即使数据集是全局线性的式中的值仍将远小于根据上述分析式使得算法不仅可以处理非线性数据的分类问题对线性数据同样适用至此为何算法能够通过稀疏近邻表示方法同时适合处理非线性和线性数据的这个问题已经分析清楚对于的特点总结如下首先满足局部性对任意一个测试样本在每类中计算其近邻其次是线性重构的及其近邻位于一个近似的局部线性块上从而可很好的由其近邻来线性表示再次具有稀疏性只在近邻中挑选部分样本来线性重构最后具有判别性因为及其近邻是局部的分类准则指出与其近邻属于同一类别因此算法可以被看作是吸收了算法和分类器的优点同时弥补了算法的缺陷实验验证本文采用和两个数据集来评估算法的性能数据集中的个训练样本作为训练集个测试样本作为测试集数据集包含个人以种姿态以及在种光照条件下采集得到的幅人脸图像为了和算法进行比较本文实验也选用个人共计幅正面人脸图像作为数据集此外这幅图像被随机的分成两个子集训练集和测试集其中每个子集都为幅图像可分性分析为了更好的观察的分类性能本部分实验将同时列出和的分类结果此外上述三种分类方法针对降维后的数据分别由以及降维的分类效果也进行了比较经验性地手写体数字分别降到以及维子空间中依次对应为保留以及的主成分同样地正面人脸图像则分别降到以及维与其它两种方法不同的是降维方法确定的最大维数比样本类别数少因此确定的手写体数字图像的低维空间是一个维的子空间对于正面人脸图像则是维的子空间这里人脸图像降到维而不是维的原因是为了和两种降维方法在相同的低维空间进行对比图和图分别列出了和三种识别方法在和上的分类性能对比结果以及包括上述两个数据集分别被和降到不同低维子空间后的分类效果此外上述三种分类方法针对由降到维的数据集的分类结果的比较在表中单独列出其中加下划线的表示更好的结果从上述数据可以发现对不同类型数据的可分性均要好于另外两种方法表三种方法在上的识别率表中样本维数已由降到维表示和的近邻参数或的稀疏度此外从表图及图中还可以看出实验结果显示了三个重要的现象首先在正面人脸数据集上当数据维数分别为和由降维时方法的分类结果毫无疑问的均要好于和其中如图所示当稀疏度时方法甚至达到了的正确识别率其原因如下由于人脸图像在采集过程中每个人在一种特定姿势的情况下拍摄的幅基于不同光照环境的图像的这个环节是在两秒左右的时间内完成的幅秒因此该幅图像中人脸位置的变化以及面部表情的变化都非常小也就是说该幅图像近似的只受光照变化的影响文献指出若人脸或者其它任意对象的象素图像只受光照变化的影响那么任意的这些图像都将位于图像空间的一个凸锥里文献指出上述凸锥可以近似的由一个低维线性子空间表示从而可知上面提及的数据集中每个人的正面幅人脸图像由于近似的只受光照的影响因此每个类别的图像近似的位于一个线性子空间中即满足算法成立的第一个前提条件与此同时不同人第卷第期王琦惠康华基于稀疏近邻表示的分类方法之间的人脸差异很大这使得各类样本所张成得子空间之间的距离比较远即满足算法的第二个前提假设当上述两个条件都成立时算法取得非常好的分类效果也就理所当然了此外当人脸图像被降到维时由于是线性降维方法同时维子空间保留了原始人脸图像的主成分也就是说维的子空间近似的保持了原始高维空间的线性结构从而维的子空间可以近似的被看作是一个线性子空间图手写体数字识别结果图中原始样本分别由和降到和维子空间中每个子图的坐标均表示和两种算法选择的不同的近邻参数或者表示算法的稀疏度图正面人脸图像识别率计算机工程与设计年图中原始样本分别由以及降到和维子空间中每个子图的横坐标均表示和两种方法选择的不同的近邻参数或者表示方法的稀疏度然而在大多数情形下上述情况发生了很大的变化比如在数据集上由于其每类样本所张成的空间不满足线性关系从而不满足方法的第一个前提假设从图中可以看出在某些情形下的分类性能甚至不如分类器但是方法却仍然有效得到了的最高识别率进一步地观察可以发现近邻参数的变化对分类性能影响不大如图以及图所示在数据集上当在区间里变化以及在数据集上在区间里变化对方法效果的影响都很小最后从上述所示的实验结果可以观察到针对由不同降维方法得到的低维数据与相比取得了更好的分类效果特别地组合的分类性能总是好于组合即使是在数据集上其原因是由和两种方法的特性决定的具体而言对于高维数据的目标是得到其低维的近邻保持的映射虽然方法本身是线性降维方法但是在降维过程中并不保持原始高维空间的线性结构而是寻找高维数据局部近邻之间的关系并把这种关系保留在低维嵌入空间换句话说即使原始高维空间满足线性关系当该高维数据由方法降维后对应的低维空间将不再满足线性关系但是高维数据的局部近邻关系被保留下来了进而在理想的情况下原始高维数据中任意一个样本的局部近邻在对应的低维嵌入空间将仍然是该样本的局部近邻由此可知降维方法不适合与方法组合但是非常适合与方法组合即方法需要线性空间的保证而方法需要局部近邻的保持时间复杂度分析假设训练集包含的样本个数为样本类别数为每个样本的维数为近邻参数为算法的时间复杂度如下所示单位化所有样本计算近邻求解最小化的优化问题计算局部稀疏表示残差由于方法没有详细的讨论式中的参数如何选择因此在本文算法实验中用范数取代范数范数的优化问题是个问题其时间复杂度为！！！因此实验中采用算法求范数的近似最优解从实验来看范数求得的虽然是近似解但是与范数求得的最优解相比分类正确率相差很小方法需要运行次才能得到稀疏度为的稀疏表示其时间复杂度如下所示单位化所有样本求解范数最小化问题计算稀疏表示残差从上述两种方法的时间复杂度对比来看和两种方法的时间复杂度依赖于近邻参数样本维数以及样本个数当时方法的时间复杂度将主要由其步骤决定也由其步骤决定此时由于在每个类别中均要寻找近邻其时间复杂度将是的倍但是要远低于方法当值逐渐变大时的时间复杂度将主要由步骤和决定对应地时间复杂度则仍然由步骤决定此时的时间复杂度依然远低于尤其是值增加且值很大时的字典将非常庞大其优化过程很费时图显示了上述三种分类方法在和数据集上的时间花费从图可以发现当值很小时算法的时间花费与相比相差不大但是当值增加时两者区别则明显变大然而在各种情形下的时间花费都要低于其主要原因是需要在整个训练集上求解线性重构的权值向量而只需要在局部近邻上求解通常这也支持了本文开头的讨论图及在两个数据集上的时间花费
　　结束语
　　理论分析和实验结果指出方法高的分类性能需要满足两个前提假设每类的训练样本分布在一个线性子空间里不同类别样本张成的子空间之间不能相交或第卷第期王琦惠康华基于稀疏近邻表示的分类方法者距离比较近然而对于现实生活中的真实数据集来说上述两个假设是很难同时满足的针对上述问题本文提出基于稀疏近邻表示的分类方法其可被看作兼顾了和两个分类方法的特性与方法假设过于牵强不同方法假设即使整个数据集是非线性的每个样本及其局部近邻仍然位于一个近似的局部线性块上这也是算法的前提假设而且通过本文实验也证明这个假设是可行的此外针对由不同降维方法进行降维后的数据集分类问题在大多数情形下方法的识别结果要好于方法尤其当降维方法是通过保持高维数据的局部近邻关系得到低维样本的进一步地方法的时间复杂度要远低于总而言之方法可以被看作是针对非线性数据集的一种重要补充

[返回]

上一篇：激光点云中输电线拟合与杆塔定位方法研究
下一篇：基于FFT-Matching Pursuit 的心电身份识别算法研究