基于语义分割的双目场景流估计 - 博士论文 - 一起赢论文辅导网--专业代写代发SCI、EI、核心期刊、代写MBA、硕博毕业论文。QQ910330594

欢迎访问一起赢论文辅导网

加入收藏 | 设为主页 | 联系我们

本站动态

联系我们

QQ：3949358033

微信：paperwinner

工作时间：9:00-24:00

成功案例

博士论文

当前位置：首页 > 博士论文

基于语义分割的双目场景流估计

来源：一起赢论文网日期：2020-06-13 浏览数：1674 【字体：大中小】

第期年月电子学报收稿日期: ; 修回日期: ; 责任编辑: 李勇锋基金项目: 国家自然科学基金( ，， ) ; 江西省优势科技创新团队计划( ，) ; 江西省青年科学基金( ) ; 中国博士后科学基金( )基于语义分割的双目场景流估计陈震，马龙，张聪炫，，黎明，吴俊劼，江少锋( 南昌航空大学无损检测技术教育部重点实验室，江西南昌 ; 中国科学院自动化研究所，北京 )摘要: 针对现有场景流计算方法在复杂场景大位移和运动遮挡等情况下易产生运动边缘模糊的问题，提出一种基于语义分割的双目场景流估计方法首先，根据图像中的语义信息类别，通过深度学习的卷积神经网络模型将图像划分为带有语义标签的区域; 针对不同语义类别的图像区域分别进行运动建模，利用语义知识计算光流信息并通过双目立体匹配的半全局匹配方法计算图像视差信息然后，对输入图像进行超像素分割，通过最小二乘法耦合光流和视差信息，分别求解每个超像素块的运动参数最后，在优化能量函数中添加语义分割边界的约束信息，通过更新像素到超像素块的映射关系和超像素块到移动平面的映射关系得到最终的场景流估计结果采用标准测试图像序列对本文方法和代表性的场景流计算方法进行对比分析实验结果表明，本文方法具有较高的精度和鲁棒性，尤其对于复杂场景运动遮挡和运动边缘模糊的图像具有较好的边缘保护作用关键词: 语义分割; 场景流; 深度学习; 双目立体匹配; 最小二乘法; 超像素分割; 运动遮挡; 边缘保护中图分类号: 文献标识码: 文章编号: ( )电子学报 : : :，，，，，，( ( ) ，，，， ;，，， ): ，，，，，，，，，: ; ; ; ; ;; ;电子学报年引言场景流最初由等人［］提出，根据光流将其定义为图像序列中像素点的三维运动矢量，从而建立了场景流计算基本模型随后，针对场景流计算模型的优化方法不断涌现针对复杂场景下物体运动的不连续性问题，等人［］首次提出基于变分理论的双目场景流模型，该模型通过多分辨率算法求解偏微分方程，能较好克服运动的不连续性问题针对大位移运动场景流估计问题，等人［］提出通过三维点云表示场景流，并采用金字塔分层策略，能够有效解决大位移运动下场景流估计问题针对运动边缘模糊问题，等人［，］提出联合光流与视差的场景流模型，通过稀疏匹配和边缘信息的稠密插值操作，能够有效保护运动边缘等人［］提出分段刚性场景流模型，该模型将场景表示为有限数量的刚性移动平面，通过优化平面运动参数获取最终场景流结果现阶段，分段刚性场景流模型已经成为求解场景流的基本方法，但是该方法在复杂场景大位移运动和运动遮挡等情况下易产生运动边缘模糊问题本文提出一种基于语义分割的双目场景流计算方法，能够有效提高复杂场景大位移运动和运动遮挡情况下场景流估计精度图像语义分割语义分割是计算机视觉领域的研究热点之一语义分割是根据语义对像素点进行分类，将图像中的场景分割为若干个目标区域，并最终得到语义标签图像，如图所示卷积神经网络能够较好地实现图像分类，为增强语义分割结果中图像特征的表达性能，本文采用语义分割模型［］，结合深度卷积神经网络和条件随机场，采用多个卷积核实现多尺度图像语义分割语义分割模型的输出为带有不同语义标签类别的图像区域，本文使用分层模型［］将其分为物体平面和其他三类对三种不同的图像区域分别进行运动建模，通过融合算法［］组合三种图像区域的运动得到最终的语义光流语义分割场景流估计模型初始场景流运动模型动态场景可表示为有限数量刚性移动的平面区域，通过超像素分割得到平面区域的运动边界，每一个超像素块表示一个刚性运动的平面 ( ，，) ，旋转矩阵和平移向量表示平面的运动参数，法向量表示平面的空间位置参数如图所示，由于双目图像存在四个视图，为更高效地求解运动参数，本文将时刻左目图像表示为参考图像，其他视图可通过参考图像转换得到转换关系为:( )( )( ( ) ){( )其中分别表示参考图像到右目第一帧图像左目第二帧图像右目第二帧图像的单应性转换矩阵，符号和分别表示摄像机投影矩阵与标定参数矩阵本文通过最小二乘法耦合语义光流和视差信息，对每个超像素块的深度和运动进行推理首先通过最小二乘法求得初始解，然后通过洛伦兹惩罚函数 ( )( ) 对误差进行优化，公式如下:( ) ( ) ( )( ) ( )，( )其中，超像素块中像素与转换视图中像素相对应，代表投影算子优化能量函数模型为优化初始场景流运动参数，首先定义两种映射关系和表示像素到超像素块的映射，表示超像素块到移动平面的映射定义场景流优化能量函数如下:( ，) ( ，) ( ，) ( ) ( )其中，( ，) 为数据项，表示为:( ，) ( )式( ) 中，分别表示当前帧和下一帧的立体匹配第期陈震: 基于语义分割的双目场景流估计项，分别表示左右目的光流数据项:( ， ) ，， ( )， ( ) ，， ( ){( )数据项通过汉明距离来评估不同视图的外观一致性，汉明距离越小，两个视图的外观相似程度则越高( ，) 为正则化项，表示为:( ，) ( ，) ( ，) ( )式( ) 中，( ，) 为几何正则化项，表示为:( ，)( ，)，， ( )( )( ，)，(， ) ( )式( ) 中，，为边界长度系数，( ) 表示惩罚函数像素和共享相同边界，边界端点和投影至三维平面得到四个三维端点，端点距离差分别为和，通过 ( ) 表示边界在三维空间的距离由于空间表面存在曲率，需考虑三维端点沿法向量方向移动后的距离两个三维平面的法向量分别为和，法向量差为，因此距离函数定义为:( ，) ( ) ( ) ( )( )式( ) 中，为边界距离系数，为法向量系数，为调节曲率和边界距离的权重系数( ，) 为运动正则化项其中，分别更新为，和分别更新为和三维端点的距离差为和，法向量之差为 ( ) ( ) ，则运动正则化项表示为:( ，)( ，)，( ，) ( )( ) 为语义分割项，表示为:( ) ( ) ( ) ( )( ) 为语义项，像素和像素为语义标签内两个相邻的像素为了避免过度分割并在空间上保持运动一致性，对语义标签内的像素进行优化，因此语义项表示为:( )( ，) ，( ) ( )( ) ( )( ，)( )( )式( ) 中表示图像中的语义标签区域，( ) 和( ) 分别表示像素和像素的灰度值，表示灰度梯度系数，表示标准差调节范围( ) 为限制项，避免在映射关系更新过程中超像素块尺寸过大导致场景过于简化限制项表示为:( )， :，{( )式( ) 中，表示超像素块的中心点像素，表示超像素块区域，表示限制超像素块大小的尺寸计算步骤: 通过将图像划分为带有语义标签的区域: 以语义标签作为先验知识计算光流信息: 采用半全局匹配算法计算视差信息: 通过最小二乘法耦合语义光流和视差信息求得初始运动参数，可得到映射关系: 固定映射，更新映射: 固定映射，更新映射经过能量函数优化后，两种映射关系和为最优，即求得更新后每个超像素块的运动参数实验与分析评估指标本文采用异常值百分比评估场景流:( )( )其中，和分别表示场景流和视差异常值百分比，式中表示光流端点误差大于个像素的像素个数，表示视差端点误差大于个像素的像素个数，表示像素总个数对比方法为验证本文方法的精度以及对运动边缘的保护作用，选取［］［］［］［］［］等方法与本文方法进行定性分析和量化对比其中算法是变分框架场景流估计的经典方法; 算法使用双线性插值的策略进行估计; 算法首先预测自身运动，然后通过校正步骤来改进结果; 算法通过最小二乘法解决非线性问题实现更好的优化; 算法通过判断与相机运动不一致的区域估计场景流参数设置本文设置参数主要为语义分割项系数本文以序列和序列为例，设定语义分割项系数为，，，，，，对测试图像误差结果进行定性分析由图看出当参数取时误差最小，因此本文选取为本文根据文献介绍设置各对比方法的关键参数如电子学报年下: 算法中平滑项权重，视差范围; 算法中数据项权重，平滑项权重 ; 算法中分辨率尺度系数，迭代次数算法中标准偏差，视差最大距离 ; 算法中掩膜参数，截断阈值数据集实验本文采用数据库提供的双目可见光图像测试序列验证本文方法场景流估计效果与鲁棒性图分别展示了数据集和四组双目图像序列，其中序列存在复杂边缘结构的车辆信息，序列场景中存在大位移运动，序列和序列存在遮挡问题和运动不连续图展示了本文方法与等对比算法的场景流误差图，红色表示误差较大区域由图可以看出本文方法红色误差区域最少，场景流估计效果最好为验证本文方法综合性能，表列出了本文方法和各对比算法在组测试图像的误差结果和时间消耗情况，其中和分别对应背景误差值和前景误差值由表可以看出，本文方法各项误差均最小，说明本文方法具有较好的估计精度表场景流估计误差和时间消耗对比对比方法时间( )本文方法在时间消耗方面，算法时间消耗最少，源于该算法采用物体与相机运动相融合的统一框架计算策略算法时间消耗最大，主要因为该方法使用的变分计算框架优化需要进行大量迭代操作本文方法时间消耗主要源于语义标签生成语义光流计算初始运动参数计算以及优化迭代等过程为更好展示本文方法在图像边缘的保护作用，图分别展示了本文方法与各对比算法的视差估计结果第期陈震: 基于语义分割的双目场景流估计图中黑框区域为包含复杂结构信息和遮挡的区域，如车辆信号灯等处从图中可以看出，在车辆边缘信号灯边缘和标志牌轮廓细节上，本文方法通过语义分割能提供更准确的分割信息为了进一步验证本文方法的估计精度，表分别列出了本文方法与各对比算法的视差误差结果从表中可以看出，本文方法各项误差均最小，说明本文方法在复杂场景大位移遮挡等情况下，针对立体匹配估计同样具有较高的精度和鲁棒性表视差估计误差方法本文方法结论本文提出一种基于语义分割的双目场景流估计模型首先对场景进行语义分割，根据语义标签进行运动建模，然后通过最小二乘法耦合光流和视差信息获取初始运动参数，最后添加语义分割约束条件优化运动参数得场景流结果本文通过获取场景语义信息优化图像分割，针对复杂场景和运动遮挡具有很好的边缘保护作用参考文献［］，，，［］［］ : ，［］，［］［］ :，［］，，: ［］，，( ) :［］，，，:［］［］ : ，［］，，，［］［］ : ，［］，，［］［］ : ，［］，，， :，，［］，，( ) :［］，，，［］［］: ，［］，， :电子学报年［］［］ : ，［］，，，［］［］ : ，［］，，，［］［］: ，［］，，［］［］ :，作者简介陈震男，年月生，江西九江人分别于和年在西北工业大学获得学士硕士和博士学位现为南昌航空大学教授，博士生导师，主要研究方向为计算机视觉图像处理与模式识别:马龙男，年月出生于河南省鹤壁市现为南昌航空大学测试与光电工程学院硕士研究生主要研究方向为图像检测与智能识别:张聪炫( 通讯作者) 男，年月出生于河南省焦作市分别于年和年在南昌航空大学和南京航空航天大学获得学士和博士学位现为南昌航空大学副教授，硕士生导师，中国科学院自动化研究所博士后主要研究方向为图像检测与智能识别:

[返回]

上一篇：基于格局检测的模型计数方法
下一篇：神经机器翻译综述