欢迎访问一起赢论文辅导网
本站动态
联系我们
 
 
 
 
 
 
 
 
 
 
 
QQ:3949358033
微信:paperwinner
工作时间:9:00-24:00
博士论文
当前位置:首页 > 博士论文
基于区域上下文感知的图像标注
来源:一起赢论文网     日期:2015-04-24     浏览数:3300     【 字体:

  摘   要   随着互联网的发展, 网络图像指数般增长, 图像理解技术变得日益重要 . 其中图像标注技术作为其关键技术得到广泛关注和研究 . 现有的图像标注技术大多是在图像层次上训练标签模型, 忽略了图像区域之间的关系及其标签之间的关系 . 为了解决这个问题, 文中提出了一种新的算法, 结合区域之间的位置关系及其标签之间的共生关系辅助标注图像 . 具体而言, 算法首先使用支持向量机对部分可确定区域赋予语义标签, 然后利用区域位置关系帮助聚类标注未知区域 . 得到一幅图所有的区域标签后, 我们提出两种模型对标签共生关系建模辅助修正标签集,一个是随机游走模型, 另一个是条件随机场模型 . 最终算法输出每幅图像的文本标签集 . 在对图像集 NU S - W I D E的标注实验中显示, 上述方法和单纯考虑区域关系的方法相比, 标注效果和性能有了较好的改善, 证实该方法是一种稳定、 有效的标注算法 .

关键词   图像标注; 上下文信息; 随机游走; 条件随机场
   1  引   言
    随着互 联 网 的 不 断 发 展 以 及 移 动 终 端 的 兴起, 网络中 的 图 像 数 量 呈 现 指 数 般 的 增 长. 根据T h e N e x t W e b的记录,2 0 0 9年, F l i c k r拥有4 0亿张图像, 到2 0 1 1年为止上升到了6 0亿. F a c e b o o k在2 0 0 9年 存 有 1 5 0 亿 张 图 像, 两 年 的 时 间 上 升 了4 5 0亿张. 图像数据大规模的增长对图像理解处理技术提出了更多的要求. 图像标注作为提供图像语义文本信息的关键技术, 在诸如图像检索、 存储、 分类等方面有着广泛的应用价值 [1 ] .现实中的图像是多种多样的, 每一张图像可以对应一个或者多个标签. 现有的方法把图像标注视为图像到标签的映射过程, 他们都是把标签与完整的图像进行对应. 例如潜在语义模型 [2 - 3 ] , 跨媒体关联模型 [4 ] 等等. 
    为了更好地理解和分析图像, 仅仅是图像层次的内容是不够的, 更需要图像区域层次的信息. 因此图像区域标注应运而生. 例如对象概率模型 [5 ] 、 周边纹理模型 [ 6 ] 、 多目标学习模型 [ 7 ] 等都在区域层次的图像标注上取得了显著的效果.近年来, 区域标注算法常常借助图像区域周边的信息辅助标注. 根据视觉相似对应标签相似的原理, 研究者结合不同的关联图像提出了相应的算法 [8 - 9 ] ; 根据区域的视觉相关和语义相关的原理, 研究 者 利 用 不 同 的 方 式 挖 掘 区 域 间 联 系 辅 助 标注 [1 0 - 1 2 ] ; 根据区域的空间位置分布规律, 研究者也提出了相应的算法辅助标注 [1 3 - 1 4 ] . 但是图像区域标注无法完全替代图像标注, 它的实际对象或区域相对独立, 无法获取整体语义信息. 因此有许多研究者把图像区域标注的算法引入图像标注工作中 [1 5 - 1 6 ] , 图像区域标注算法中利用区域之间的位置关系能够很好地帮助理解图像层次的语义信息. 但现有工作中很少同时考虑一个区域与多个区域之间空间位置分布关系的方法, 更没有同时考虑语义标签之间的共生关系来帮助进行图像标注的工作 .
    为了解决这个问题, 本文提出了一种综合使用区域间相对位置关系及其标签共生关系辅助标注的算法— — —基于区域上下文感知的图像标注算法. 算法先使用支持向量机分类并标注可确定类别的区域 . 对无法确定类别的未知区域, 引用分类结果建立未知区域与周围确定区域的空间相对位置关系描述符, 然后结合未知区域自身的图像特征信息进行聚类. 为了获得未知区域的标签, 需要在待标注的图像集中混入带有人工标签的已标注图像, 由此聚类后通过标签传播的方式即可对未知区域进行标注. 得到一幅图的所有候选标注集后, 本文使用两种模型实现引入标签之间的共生关系辅助确定图像标注集. 这两种模型分别是随机游走模型和条件随机场模型. 随机游走模型引入标签共生信息使得标签之间的联系更加紧密. 条件随机场模型结合标签概率和标签共生关系推断图像标注, 使得图像标签整体分布更加合理. 
本文使用图像数据集 NU S - W I D E[ 1 7 ]进行图像标注实验, 结果表明本文提出的算法相较于其他算法, 标注效果得到了显著的改善. 通过对比发现使用条件随机场模型的效果要优于随机游走模型, 这说明引入越多的标签共生信息, 对图像标注的帮助越明显.
2   基于区域上下文感知的图像标注算法
图像的标签可以是带有具体指向的标签, 也可以是高层语义的标签, 使用本文算法既能标注出具体对象或区域的标签, 也能标记出高层语义信息的标签. 在使用本文提出的算法进行图像标注之前需要对待标注图像集进行预处理. 预处理包括在图像集中加入带有人工标签的已标注网络图像、 图像分割、 特征提取. 此后使用基于区域上下文感知的图像标注算法标注图像集, 就能得到每张图像对应的标签集. 算法具体描述如下.算法1 .基于区域上下文感知的图像标注算法.输入: 未标注图像和带标签图像的混合区域集输出: 所有图像对应的标签集1. 使用支持向量机识别分类图像区域并标注.2. 对未知区域建立上下文描述符, 并结合图像视觉特征进行聚类标注 .3. 引入标签共生信息对每幅图的标签集进行修正 .
    2 . 1  识别区域类别任何未标记的图像中都混杂着许许多多或复杂或简单的区域 . 通过识别和标注这些区域, 可以得到图像内部信息甚至高层次的语义信息. 为了标注这些区域, 本文首先使用训练好的支持向量机对图像所有区域进行识别分类 .理想情况下, 图像分割能够准确地提取出一个图像中的各个区域, 然后对各个区域进行分类标记,就能得到每个区域对应的标签. 但实际情况下由于受到图像分割水平的限制, 并不能得到完整的区域.因此, 需要先对每幅图像进行多重分割, 再将所有的分割都当作独立的区域进行处理, 这样可以提升区域识别的准确率. 此外由于受分类器分类数目的限制, 实际中不可能得到每个区域对应的标签. 因此对于不属于分类器识别范围内的区域暂定为未知区域, 在后续步骤中进行处理.本文首先使用一组训练集训练 N 个支持向量机分类器 C = { c1 , c 2 , …, c n } . 分类时输入图像区域的视觉特征, 输出为每个区域对应不同类别的概率,一个区域 s 对应一个分类 ci 的概率为 P ( c i | s ). 如果一个区域很有可能属于一个已知的类别, 那么它对应的分类 ci 的概率 P ( c i | s ) 会很高, 而对应其他类的概率会很低. 而不属于任何已知类别的区域对应所有类别的概率会比较平均. 因此, 在得到所有区域的类别概率后, 本文通过计算区域对应类别的不确定程度来判断该区域是否确定为某一类别.E ( s ) =- ∑Ni =1 P(c i | s ) ×l o g 2 P ( c i | s )(1 )   本文设计了一个熵函数 E ( 式( 1 ) ) 来计算和衡量区域 s 的不确定程度, 其中熵值越低的区域的确定性越大; 反之, 熵值越高的区域不确定性越大. 熵值函数的值域为[0 , l o g 2 N ] , 本文把判定确定区域和未知区域的阈值简单地设为值域的中点. 当熵值小于阈值时把该区域当作确定区域, 当熵值高于该阈值时把它视为未知区域. 对于确定区域, 使用对应的分类器类别标签对其进行标注. 接下来对于未知区域进行处理.
    2 . 2  聚类标记未知区域现实中的图像区域多种多样, 仅仅依靠分类数量有限的分类器是难于满足标注需求的. 对那些不属于分类器识别范围内的区域, 本文引入带有人工标签的网络图像区域帮助标注其标签. 在得到所有的未知区域后, 通过聚类能得到一定数量的区域集合, 在这些集合中含有许多带有标签的网络图像区域, 然后利用标签传播的方式对未知区域进行标注.为了提高聚类精度, 本文参考文献[1 8 ] 引入了上下文描述符辅助聚类. 上下文描述符是一种表现确定区域和未知区域之间位置关系的图像特征. 算法通过构建以未知区域为中心的邻近确定区域的关系图作为描述未知区域的一种特征, 如图1所示. 在关系图中, 节点表示区域, 边表示的是已知区域和未知区域间的距离, 它表现了未知区域和相邻区域之间的关系拓扑结构. 根据这种结构, 算法可以根据两个未知区域在对象层次上和周围区域的关系有多大的相似度来判断是否可以被分到同一个类别中.
本文算法没有单纯地把最大概率的类别作为表示区域的节点值, 而是把每个区域对应所有类别的概率组成的概率直方图作为节点值, 然后根据已知区域和未知区域的距离远近计算权重. 具体来说对于每一个未知区域 s , 结合它邻近的已知区域的类别概率直方图构建上下文描述符, 其中每个直方图表示区域 s 附近的某一个区域 r 对应每一个类别的概率分布. 由于区域之间上下方向的相对位置关系比较固定, 因此选择与区域 s 邻近的上下两个方向的已 知 区 域 作 为 邻 近 区 域 . 连 接 所 有 的 直 方 图{r =0 , …, R } 得到上下文描述符:g ( s ) = [ H 0 ( s ) , H 1 ( s ) , …, H R ( s ) ](2 )其中 H 0 ( s ) 表示未知区域本身的概率直方图 .已经确定的区域也有可能是错误分类的结果,但是相似的区域会产生相似的错误, 所以用概率直方图描述一个区域能够减小上一步分类错误带来的影响. 最终构建的上下文描述符是一个( (R +1 ) ×2 N ) 维的向量, 其中 R 表示所选取的确定区域的数目, R 值越大意味着引入的辅助区域越多. 由于未知区域的相似程度和他们的上下文相似程度成正比,因此上下文描述符可以用于辅助聚类.得到未知区域的上下文描述符后, 结合区域的视觉特征信息对其进行聚类可以得到相似区域的集合 .
 为了计算两个区域之间的相似程度, 本文引入一个结合区域视觉特征和上下文描述特征的相似度函数:K ( s m , s n ) =1| u | ∑uK χ 2 ( a u ( s m ) , a u ( s n ) ) +K χ 2 ( g ( s m ) , g ( s n ) )(3 )其中 sm 和 s n 表示未知区域, g ( s m) 和g ( s n ) 表示它们对应的上下文描述符. a u ( s m ) 和 a u ( s n ) 表示其视觉特征信息. K χ 2 ( •, •) 表示两个直方图之间的 χ2 核函数, 如式(4 ) 所示. 通过计算每一对未知区域之间的相似度, 可以得到一个相似度矩阵, 然后送入聚类算法中聚类. 理想情况下, 未知区域和其相似的未知区域能够分到同一个聚类集合中.K χ 2 ( x , y ) =e x p -12 ∑i(x i - y i )2x i + y ( )i(4 )其中 i 表示直方图中区间的个数.在得到聚类子集后, 算法利用预先混入图像集中的带有用户标注的网络图像帮助标注未知区域.由于网络图像是同待标记图像一起进行处理的, 经过聚类后的区域集合中一定含有带标签的图像的区域. 通过统计的方法确定集合的标签, 然后把这些标签赋值给待标注的未知区域.
    2 . 3  标签修正在得到一幅图像的确定区域和未知区域的标签集合后, 把这些标签整合成一个图像标注向量 r =[p ( a 1 ) , p ( a 2 ) , …, p ( a n ) ] , 其中 p ( a n ) 表示该图像被标注为标签 an 的概率. 本文引入另一种上下文信息辅助进一步的标注, 利用标签之间的共生关系对图像标注向量进行修正, 最终确定图像的标注集. 本文使用两种模型实现该步骤, 它们分别是随机游走模型和条件随机场模型.
    2 . 3 . 1  随机游走模型一幅图的标签集可以表示为一个带有 N 个结点的标签关联图, 然后根据实际情况加强或减小标签之间的联系, 改变标签概率, 最终根据新的概率就能确定图像最终标签集合. 一幅图像完整的标注向量为 r = [p ( a 1 ) , p ( a 2 ) , …, p ( a n ) ] , 我们使用 C 表示一个 n × n 的标签转移矩阵. 其中 ci j表示从标签 i转换到标签 j 的可能性, 具体计算如式( 5) 所示.ci j=f i , jm i n ( f i , f j )(5 )其中 f 表示对应标签出现的频率.由此可以构建随机游走函数:r k ( j ) = α ∑ir k - 1 ( i ) ci j+ ( 1- α ) v j(6 )其中 vj 表示最初的标签概率向量 r 中的第 j 个标签概率.α 是一个( 0 , 1 ) 之间的权重参数, 本文使用网格搜索的方式确定其值 . 经过式( 6 ) 的迭代处理, 标签之间的联系将会强化, 孤立标签的标注概率将会减小, 最终依据概率高低确定图像标签集. 接下来通过推导得到随机游走表达式, 使用矩阵重构式(7 ) .r k = α C   r k - 1 + ( 1- α ) v(7因此可以得到式(8 ) .r π =l i mn → ∞ (α C ) r 0 + (1- α ) ∑ni =1(α C )i -( )1 v(8 )   把转换矩阵 C 的每一行归一化到1. 如果对于0< α<1, 存在 γ<1, 且α < γ , 就可以得到∑j(α C )ni j= ∑j∑k(α C )n - 1i k(α C )k j= ∑k(α C )n - 1i k α ∑jC k( )j= ∑k(α C )n - 1i k(α ) ∑k(α C )n - 1i k(γ ) γn .   因此( α C )n 中按行求和后为0. 代入式(8 ) 可得r f = ( 1- α ) ( I - α C )- 1v(9 )   通过随机游走表达式( 式( 9 ) ) 可以计算图像标注的唯一解 rf . 通过把标签概率向量和标签转移矩阵代入式(9 ) 进行计算, 得到新的标签概率向量, 根据此向量最终确定图像标注. 通过随机游走函数修正后, 图像区域的标注集合更符合实际情况, 准确度也会提高.
    2 . 3 . 2  条件随机场模型自条件随机场被提出以来, 已经有不少研究者将其引入图像标注算法中 [1 9 - 2 0 ] , 本文结合标签共生信息构建适合的条件随机场模型辅助图像标注. 条件随机场模型是一个无向图模型, 其中图中的点表示标签, 连接两点的边表示两个标签之间的关系. 使用条件随机场模型可以充分地结合标签的先验知识和标签间关系的先验知识辅助图像标注, 它是图像标注算法中一个强有力的武器.本文借鉴文献[2 0 ] 的思想提出了一种条件随机场模型辅助图像标注. 与前面提及的随机游走算法不同, 条件随机场算法不是单纯地利用标签之间的共生关系修正标签概率向量, 而是把标签概率向量当做一种标签的先验, 构建标签关系图并重新估计图像的标签概率向量. 算法构建所有标签的关系无向图, 并构建无向图的边势函数( 式(1 0 ) ) 和点势函数( 式(1 1 ) ) , 其中点的势函数由标签概率向量所确定, 边的势函数由学习训练集标签所得的标签关系所确定. 例如“ 天空” 出现了 f 1 次, “ 草地” 出现了 f 2次, 它们同时出现的次数为 f 3 次 . 那么“ 天空” 和“ 草地” 的联合概率求解如式(1 2) 所示.Φ ( a i , a j ) =-l o g ( P ( a i , a j ) )(1 0 )Ψ ( a i ) =11+ep ( ai )(1 1 )其中 p ( ai ) 表示由先前步骤获得的图像标签概率.P ( a 1 , a 2 ) =f 3m i n ( f 1 , f 2 )(1 2 )   在得到无向图中各个点和边的势能后, 求取最佳的图结构就能得到最终的图像标注集{a 1 , a 2 , …,a n } . 其中最佳图结构是图势函数值最小时对应的图结构, 即式(1 3 ) 的值最小的图结构.∑ai ∈ SΨ ( a i ) + λ∑( ai ,aj ) ∈ EΦ ( a i , a j )(1 3 )其中 λ 表示点势函数和边势函数的权重关系, 本文通过交叉验证的方法确定 λ , 它的值一定小于1 , 因为边的数量总是大于点的数量.使用条件随机场模型, 不仅考虑了所有标签之间的关联, 而且引入被前面步骤除去的标签重新判断, 增加了修正前面错误步骤的机会, 增加了本文算法的鲁棒性. 条件随机场模型使得标签之间的共生信息在图像标注发挥了更大的作用, 极大丰富了图像标注集的可能值.
    3  实验结果与分析
    本文使用 NU S - W I D E图像数据集对算法进行验证. NU S - W I D E包含有2 6 9 6 4 8张图像和4 2 5   0 5 9个标签. 其图像来源于网络, 内容丰富多样, 适合多标签标注. 本文选取其中含有8 1个人工标签的数据集作为实验标注数据. 根据 NU S - W I D E  2 6万图片对应的8 1个标签分布状况, 抽样得到了1 0 0 0张代表性图像作为标注算法测试图像. 实验图像标签分布如图2所示.
本文选取带有区域标签的图像集 MS R C -V 2训练支持向量机, MS R C - V 2共有5 9 1张图片,2 3个区域类别, 使用时剔 除 区域 较少 的 类 别, 共 训 练了1 9个分类器对图像区域进行分类. 在使用基于区域上下文感知的图像标注算法对图像进行图像标注的过程中, 本文选取了图像的颜色、 纹理和形状特征对区域进行识别分类, 并选取了文献[2 1 ] 中的谱聚类算法对未知区域进行聚类.实验选取5 0 0 张图像作为带有标签信息的混入图像,5 0 0张图像作为待标记图像. 在实验的过程中, 每次标注选择4 0 0张图像作为训练集, 使用交叉验证的方式确定模型参数, 然后使用训练好的模型标注剩下的1 0 0张图像.图3(a ) 显示了使用本文算法和 α =0 . 3 的随机游走模型实现图像标注, 然后按照选取关键字的标准选取5个标签作为图像标签的实验结果. 从图中可以看出本文提出的算法得到了丰富的图像内部区域和对象的信息, 而且还获取了一些高层语义信息.图3(b ) 显示了使用本文算法和 λ =0 . 0 5的条件随机场模型实现图像标注, 然后按照与上面一致的标准选取标签的实验结果. 从图中同样可以得到本文提出的算法有效性的证明. 相比于噪声较大的人工标签, 我们算法实现的标注效果会更好些.由于本文是基于图像中存有多种对象或区域的假设提出的算法, 因此引入评价指标 F - s c o r e 来衡量算法的标注效果 .
     F - s c o r e是一种综合考虑正确率和召回率的评价指标, 它是一种常用的衡量标注效果好坏的指标, 具体计算如式(1 4) 所示.为了对比标注效果, 本文引入另外3种方法对选取的图像进行标注. 方法1是利用支持向量机分类标记图像的算法. 方法2是在支持向量机分类的基础上引入视觉相似约束标注图像的算法. 方法3是在方法2的基础上加入空间相对位置约束辅助标注的算法.对比实验结果如图4所示, 从图中可知仅仅使用S VM 对网络图像进行识别标注有很大的局限性. 方法2的得分要明显高于方法1 , 这证明了利用区域视觉相似约束辅助标注的有效性. 进一步, 方法3通过引入图像区域的空间信息后, 可以得到更鲁棒的区域聚类, 从而提高了图像标注的效果. 本文提出的算法在所有方法中获得了最优的标注效果,验证了在图像区域层同时考虑区域空间关系和标签共生关系的优势 . 进一步, 条件随机场模型又比随机游走模型要好一些. 随机游走模型只是利用标签之间的共生信息修正概率, 条件随机场模型是把标签概率和标签之间的共生信息融合到一个势函数中,更加全面和鲁棒, 因此算法性能有所提高 .图4中显示只用一个标签标注图像时, 各个算法的准确度都不高, 因为在各个算法中标注概率最高的是最常见的标签, 而不是图像最主要标签. 随着选择的标签数的增加, 图像标注的准确度不断的提高, 本文算法的优势得以凸显. 基于区域上下文感知的图像标注算法结合空间区域相对位置关系和标注共生关系, 得到比原有方法更高的精准度. 而且由于标签共生关系的引入, 得到了更符合实际的标签集,由此证明本文算法的有效性.
    我们提出的两个模型的效果不同说明如何对标签共生关系建模进行标签修正对于图像标注也十分重要.本文提出的算法是结合图像区域的相对位置关系及其标签共生关系辅助图像标注. 在两种模型的实现过程中, 我们发现标签共生关系的强弱对随机游走模型有很大的影响. 当有标签对是强关联关系时, 得到的标签集会有较大的偏差, 使得图像标注集偏向于强关联的标签集. 条件随机场模型通过转化重新推断标签概率向量, 使得标注集更倾向于信息量大的标签集, 有助于提高标注效果. 但实验过程中发现当参数 λ 大到一定程度时, 条件随机场模型也会出现与随机游走模型相类似的情况, 造成图像标注效果下降. 虽然通过实验证明了引入标签信息的有效性, 但是如何合理地挖掘和利用共生信息还难以把握, 还有诸如如何去除无用处的标签, 确定每张图像特有的标签等问题都还有待我们思考和解决.
    4  总结与展望
    本文提出了一种结合区域空间相对位置关系和标签共生关系的图像标注新方法. 该方法首先使用分类器对图像区域进行分类. 对能确定类别的区域进行标注, 对无法确定类别的区域则利用它周围的确定区域对其构建上下文描述符, 然后结合上下文描述符和图像视觉特征信息对其聚类, 引入网络图像标签集标注未知区域. 在得到图像标签集后, 引入两种模型实现借助标签的共生关系对标签集进行修正, 最终得到更符合实际的图像标注集, 从而提高图像标注精度. 通过实验证明, 本文提出的算法是有效的, 引入图像标签之间的共生信息是有助于图像标注的. 在未来的研究中将使用标签数量更多的图像集进行标注, 测试本文算法的好坏, 也将提出更好的模型对图像上下文信息建模进行图像标注. 同时将尝试把算法和网络搜索相结合, 得到更多的图像周围信息辅助标注.致   谢   在此诚挚地对给本文提出建议和意见的师兄、 老师、 审稿人表示感谢!
    参 考 文 献[ 1 ] W a n g   M , N i  B , H u a  X  S , e t  a l . A s s i s t i v e  t a g g i n g : A  s u r v e yo f  m u l t i m e d i a  t a g g i n g   w i t h  h u m a n - c o m p u t e r  j o i n t  e x p l o r a t i o n .A CM C o m p u t i n g   S u r v e y s , 2 0 1 2 , 4 4 (4 ) : 2 5[ 2 ] D u y g u l u  P , B a r n a r d  K , d e  F r e i t a s  J  F  G , e t  a l .O b j e c tr e c o g n i t i o n  a s  m a c h i n e  t r a n s l a t i o n : L e a r n i n g   a  l e x i c o n  f o r  af i x e d  i m a g e  v o c a b u l a r y / / P r o c e e d i n g s  o f  t h e  C o m p u t e rV i s i o n — E C C V  2 0 0 2. B e r l i n , G e r m a n y , 2 0 0 6 : 9 7 - 1 1 2[ 3 ]T a n g J  H , L i  H , Q i  G  J , C h u a  T  S. I m a g e  a n n o t a t i o n  b yg r a p h - b a s e d  i n f e r e n c e  w i t h  i n t e g r a t e d  m u l t i p l e /s i n g l e  i n s t a n c er e p r e s e n t a t i o n s .I E E E  T r a n s a c t i o n s  o n  M u l t i m e d i a , 2 0 1 0 ,1 2 ( 2 ) : 1 3 1 - 1 4 1[ 4 ] J e o n  J , L a v r e n k o  V , M a n m a t h a  R.A u t o m a t i c  i m a g e  a n n o t a t i o na n d  r e t r i e v a l  u s i n g   c r o s s - m e d i a  r e l e v a n c e  m o d e l s/ / P r o c e e d i n g so f  t h e  2 6 t h  A n n u a l  I n t e r n a t i o n a l  A CM S I G I R  C o n f e r e n c e  o nR e s e a r c h  a n d  D e v e l o p m e n t  i n  I n f o r m a t i o n  R e t r i e v a l .T o r o n t o ,C a n a d a , 2 0 0 3 : 1 1 9 - 1 2 6[ 5 ] C h e n  Y , Z h u  L , Y u i l l e  A , Z h a n g   H.U n s u p e r v i s e d  l e a r n i n go f  p r o b a b i l i s t i c  o b j e c t  m o d e l s ( P OM s ) f o r  o b j e c t  c l a s s i f i c a t i o n ,s e g m e n t a t i o n , a n d  r e c o g n i t i o n  u s i n g   k n o w l e d g e  p r o p a g a t i o n.I E E E  T r a n s a c t i o n s  o n  P a t t e r n  A n a l y s i s  a n d  M a c h i n e  I n t e l l i -g e n c e , 2 0 0 9 , 3 1 ( 1 0 ) : 1 7 4 7 - 1 7 6 1[ 6 ] S h o t t o n  J , W i n n  J , R o t h e r  C , e t  a l .T e x t o n B o o s t  f o r  i m a g eu n d e r s t a n d i n g : M u l t i - c l a s s  o b j e c t  r e c o g n i t i o n  a n d  s e g m e n t a t i o nb y  j o i n t l y   m o d e l i n g   t e x t u r e , l a y o u t, a n d  c o n t e x t . I n t e r n a t i o n a lJ o u r n a l  o f  C o m p u t e r  V i s i o n , 2 0 0 9 , 8 1 ( 1 ) : 2 - 2 3[ 7 ] Y a n g   C , D o n g   M.R e g i o n - b a s e d  i m a g e  a n n o t a t i o n  u s i n ga s y mm e t r i c a l  s u p p o r t  v e c t o r  m a c h i n e - b a s e d  m u l t i - i n s t a n c el e a r n i n g / / P r o c e e d i n g s  o f  t h e  2 0 0 6I E E E  C o m p u t e r  S o c i e t yC o n f e r e n c e  o n  C o m p u t e r  V i s i o n  a n d  P a t t e r n  R e c o g n i t i o n.N e w Y o r k , U S A , 2 0 0 6 : 1 7 - 2 2[ 8 ] U l g e s  A , W o r r i n g   M , B r e u e l  T. L e a r n i n g   v i s u a l  c o n t e x t s  f o ri m a g e  a n n o t a t i o n  f r o m  F l i c k r  g r o u p s . I E E E  T r a n s a c t i o n s  o nM u l t i m e d i a , 2 0 1 1 , 1 3 ( 2 ) : 3 3 0 - 3 4 1[ 9 ] B a o  B  K , L i  T , Y a n  S.H i d d e n - c o n c e p t  d r i v e n  m u l t i l a b e li m a g e  a n n o t a t i o n  a n d  l a b e l  r a n k i n g . I E E E  T r a n s a c t i o n s  o nM u l t i m e d i a , 2 0 1 2 , 1 4 ( 1 ) : 1 9 9 - 2 1 0[ 1 0 ] L i u  Y , L i u  J , L i  Z , e t  a l .N o i s y t a g a l i g n m e n t  w i t h  i m a g er e g i o n s / / P r o c e e d i n g s  o f  t h e  2 0 1 2 I E E E  I n t e r n a t i o n a lC o n f e r e n c e  o n  M u l t i m e d i a  a n d  E x p o .M e l b o u r n e , A u s t r a l i a ,2 0 1 2 : 2 6 6 - 2 7 1[ 1 1 ] L i u  Y , L i u  J , L i  Z , e t  a l . S o c i a l  t a g   a l i g n m e n t  w i t h  i m a g er e g i o n s  b y   s p a r s e  r e c o n s t r u c t i o n s/ / P r o c e e d i n g s  o f  t h e  2 0 t hA CM  I n t e r n a t i o n a l  C o n f e r e n c e  o n  M u l t i m e d i a . N a r a , J a p a n ,2 0 1 2 : 8 6 1 - 8 6 4[ 1 2 ] L i u  X , Y a n  S , C h e n g   B , e t  a l . L a b e l- t o - r e g i o n  w i t h  c o n t i n u i t y -b i a s e d  b i - l a y e r  s p a r s i t y  p r i o r s .A CM T r a n s a c t i o n s  o n  M u l t i -m e d i a  C o m p u t i n g , C o mm u n i c a t i o n s , a n d  A p p l i c a t i o n s , 2 0 1 2 ,8 ( 4 ) : 5 0[ 1 3 ] Y u a n  J , L i  J , Z h a n g   B. E x p l o i t i n g   s p a t i a l  c o n t e x t  c o n s t r a i n t sf o r  a u t o m a t i c  i m a g e  r e g i o n  a n n o t a t i o n / / P r o c e e d i n g s  o f  t h e1 5 t h  I n t e r n a t i o n a l  C o n f e r e n c e  o n  M u l t i m e d i a .A u g s b u r g ,G e r m a n y , 2 0 0 7 : 5 9 5 - 6 0 4[ 1 4 ] Y a n g   Y a n g , Y a n g   Y i , H u a n g   Z i , e t  a l . T a g   l o c a l i z a t i o n  w i t hs p a t i a l  c o r r e l a t i o n s  a n d  j o i n t  g r o u p   s p a r s i t y/ / P r o c e e d i n g s  o ft h e  2 0 1 1I E E E  C o n f e r e n c e  o n  C o m p u t e r  V i s i o n  a n d  P a t t e r nR e c o g n i t i o n. C o l o r a d o  S p r i n g s , U S A , 2 0 1 1 : 8 8 1 - 8 8 8[ 1 5 ] G u o  Q  J , L i  N , Y a n g   Y  B , e t  a l . I m a g e  a n n o t a t i o n  b y   m o d e l i n gs u p p o r t i n g   r e g i o n  g r a p h. A p p l i e d  I n t e l l i g e n c e, 2 0 1 3 , 3 9 ( 2 ) :1 - 1 5[ 1 6 ] L i n  Z ,D i n g G , H u  M , e t  a l .A u t o m a t i c  i m a g e  a n n o t a t i o nu s i n g   t a g - r e l a t e d  r a n d o m  s e a r c h  o v e r  v i s u a l  n e i g h b o r s/ /P r o c e e d i n g s  o f  t h e  2 1 s t  A CM  I n t e r n a t i o n a l  C o n f e r e n c e  o nI n f o r m a t i o n  a n d  K n o w l e d g e  M a n a g e m e n t . M a u i  H a w a i i ,U S A , 2 0 1 2 : 1 7 8 4 - 1 7 8 8[ 1 7 ] C h u a  T ,T a n g J , H o n g   R , e t  a l . NU S - W I D E : A  r e a l - w o r l dw e b  i m a g e  d a t a b a s e  f r o m  n a t i o n a l  u n i v e r s i t y   o f  S i n g a p o r e/ /P r o c e e d i n g s  o f  t h e  A CM  I n t e r n a t i o n a l  C o n f e r e n c e  o n  I m a g ea n d  V i d e o  R e t r i e v a l . S a n t o r i n i  I s l a n d , G r e e c e , 2 0 0 9 : 8 - 1 0[ 1 8 ] L e e  Y  J , G r a u m a n  K. O b j e c t- g r a p h s  f o r  c o n t e x t - a w a r e  c a t e g o r yd i s c o v e r y / / P r o c e e d i n g s  o f  t h e  2 0 1 0 I E E E  C o n f e r e n c e  o nC o m p u t e r  V i s i o n  a n d  P a t t e r n  R e c o g n i t i o n.S a n  F r a n c i s c o ,U S A , 2 0 1 0 : 1 - 8[ 1 9 ] P r u t e a n u - M a l i n i c i  I , M a j o r o s  W H , O h l e r  U.A u t o m a t e da n n o t a t i o n  o f  g e n e  e x p r e s s i o n  i m a g e  s e q u e n c e s  v i a  n o n -p a r a m e t r i c  f a c t o r  a n a l y s i s  a n d  c o n d i t i o n a l  r a n d o m  f i e l d s .B i o i n f o r m a t i c s , 2 0 1 3 , 2 9 ( 1 3 ) : 1 2 7 - 1 3 5[ 2 0 ] W a n g   Y , G o n g   S .R e f i n i n g   i m a g e  a n n o t a t i o n  u s i n g   c o n t e x t u a lr e l a t i o n s  b e t w e e n  w o r d s / / P r o c e e d i n g s  o f  t h e  6 t h  A CMI n t e r n a t i o n a l  C o n f e r e n c e  o n  I m a g e  a n d  V i d e o  R e t r i e v a l .Am s t e r d a m , N e t h e r l a n d s , 2 0 0 7 : 4 2 5 - 4 3 2[ 2 1 ]N g A Y , J o r d a n  M  I , W e i s s  Y.O n  s p e c t r a l  c l u s t e r i n g :A n a l y s i s  a n d  a n  a l g o r i t h m / / P r o c e e d i n g s  o f  t h e  1 4 t h  N e u r a lI n f o r m a t i o n  P r o c e s s i n g   S y s t e m s  C o n f e r e n c e . C a m b r i d g e ,U S A , 2 0 0 1 : 8 4 9 - 8 5 6
 
[返回]
上一篇:基于差分零系数和索引共生矩阵的通用隐密分析
下一篇:基于混沌鲶鱼效应的人工蜂群算法及应用