期刊文献+
共找到26篇文章
< 1 2 >
每页显示 20 50 100
面向视觉相似的红外伪装仿真效果评估 被引量:10
1
作者 方浩 李艾华 +3 位作者 潘玉龙 王学进 姜柯 王华 《兵工学报》 EI CAS CSCD 北大核心 2017年第2期351-357,共7页
针对红外伪装仿真系统效果评估困难的问题,提出了一种面向视觉相似的解决方法。从视觉相似的角度出发,定义了一种新的视觉相似性模型,并建立了包括温度偏差系数、离散偏差系数和视觉相似性系数的评价指标体系;为减小主观经验的影响,引... 针对红外伪装仿真系统效果评估困难的问题,提出了一种面向视觉相似的解决方法。从视觉相似的角度出发,定义了一种新的视觉相似性模型,并建立了包括温度偏差系数、离散偏差系数和视觉相似性系数的评价指标体系;为减小主观经验的影响,引入直觉模糊集理论,建立了仿真效果评估的多属性决策模型;采用逼近理想解的排序算法(TOPSIS)进行模型求解,并针对算法存在距离正、负理想方案区分度不高的问题,定义了一种基于直觉模糊集Hamming距离的灰色接近系数来表征方案与理想方案的接近程度,有效解决了多属性决策问题。实例表明,该方法的评估结果与TOPSIS方法的结果一致,且与专家评估结果一致,验证了评价指标体系的合理性和评估方法的可行性。 展开更多
关键词 兵器科学与技术 效果评估 伪装 视觉相似性 直觉模糊集 逼近理想解的排序算法 灰色关联
下载PDF
基于模糊度量视觉特征的非局部均值去噪 被引量:6
2
作者 吕俊瑞 罗学刚 +1 位作者 岐世峰 彭真明 《重庆邮电大学学报(自然科学版)》 CSCD 北大核心 2018年第3期408-415,共8页
针对非局部均值(non local mean,NLM)相似性度量不够准确的问题,提出一种基于模糊度量的视觉特征相似度的改进非局部均值图像去噪算法。利用模糊度量理论构建视觉特征度量相似性函数作为衡量图像像素点相似性;将平滑核函数代替高斯加权... 针对非局部均值(non local mean,NLM)相似性度量不够准确的问题,提出一种基于模糊度量的视觉特征相似度的改进非局部均值图像去噪算法。利用模糊度量理论构建视觉特征度量相似性函数作为衡量图像像素点相似性;将平滑核函数代替高斯加权核函数,提高运算速度和避免滤波参数的设置;利用构建视觉特征相似性度量生成的平滑核函数,对图像进行去噪。由于改进方法考虑图像视觉结构特征,更加完善了非局部均值结构相似的特点。在高斯噪声和椒盐噪声下,用峰值信噪比(peak signal to noise ratio,PSNR)和结构相似性(structural similarity index,SSIM)评价指标分别对比分析提出方法与几种优秀的改进NLM方法的降噪性能。实验结果表明,改进的新方法在去噪性能方面得到较高的提升,同时降低了相似度计算的复杂度和减少了参数设置问题。 展开更多
关键词 非局部均值 图像去噪 视觉特征相似度 模糊度量
下载PDF
基于自学习框架的红外场景仿真效果评价 被引量:3
3
作者 方浩 李艾华 +3 位作者 潘玉龙 王学进 何川 吴元江 《系统工程与电子技术》 EI CSCD 北大核心 2019年第2期266-272,共7页
针对红外场景仿真效果评估困难的问题,提出了基于自学习框架的评价方法。首先,从仿真图像与实际图像视觉对比的角度提出了面向图像视觉相似的红外场景仿真效果评价指标体系,用于量化评价过程;其次,提出以极限学习机(extreme learning ma... 针对红外场景仿真效果评估困难的问题,提出了基于自学习框架的评价方法。首先,从仿真图像与实际图像视觉对比的角度提出了面向图像视觉相似的红外场景仿真效果评价指标体系,用于量化评价过程;其次,提出以极限学习机(extreme learning machine,ELM)为核心建立评估模型,建立包括蒙特卡罗样本仿真、ELM评估网络及自更新仿真样本评估模型等3部分在内的自学习框架来生成仿真样本、强化对ELM的训练;最后,针对实际样本数量较少的问题,在此框架基础上提出了包括样本评定、自学习、评估模型测试3个阶段在内的仿真图像相似性评估方法,实现了从样本生成到评估过程的自动化。实验结果表明提出的自学习框架能够显著提高评估模型的正确率,而且训练后的评估模型适用性强,可独立自主进行红外场景仿真效果评估。 展开更多
关键词 红外场景仿真 自学习 极限学习机 视觉相似
下载PDF
基于多特征相似性融合的半参考图像质量评价 被引量:2
4
作者 崔力 《陕西科技大学学报》 CAS 2019年第6期160-164,共5页
提出了一种基于多特征相似性融合的半参考图像质量评价方法.在多个特征域,该算法采用不同的策略,分别评估了原始与待测图像之间的视觉相似性,并利用特征融合模块将上述特征相似性度量合并为图像整体质量指标,即MFSIQ(Multi-Feature Simi... 提出了一种基于多特征相似性融合的半参考图像质量评价方法.在多个特征域,该算法采用不同的策略,分别评估了原始与待测图像之间的视觉相似性,并利用特征融合模块将上述特征相似性度量合并为图像整体质量指标,即MFSIQ(Multi-Feature Similarity based Image Quality).为验证所提出算法的性能,本研究分别在三个主流数据库上,将所提出算法与主流的全参考以及无参考算法进行了性能比较.实验结果表明,MFSIQ的性能优于两种主流半参考算法和全参考算法PSNR,甚至可以媲美人们所熟知的全参考算法SSIM. 展开更多
关键词 图像质量评价 特征 视觉相似性
下载PDF
数字人文影响下数字艺术史的研究实践与创新 被引量:1
5
作者 李斌 《媒介批评》 2023年第1期390-405,共16页
进入数字时代后,与数字人文相结合似乎已经成为人文艺术学科的重要发展路径。在数字人文理念影响下,图像识别、目标分类、深度计算等数字技术与艺术史研究深度交融,不断催生新的学术认知。一方面,数字艺术空间打破时空限制,使艺术史研... 进入数字时代后,与数字人文相结合似乎已经成为人文艺术学科的重要发展路径。在数字人文理念影响下,图像识别、目标分类、深度计算等数字技术与艺术史研究深度交融,不断催生新的学术认知。一方面,数字艺术空间打破时空限制,使艺术史研究从静态走向动态,呈现“历史视角”。另一方面,“数值化”打破数字图像限制,使艺术史研究实现基于生成模型与深度学习的自主分析,摆脱“主观影响”。随着数字技术与艺术史研究的进一步交叉融合,数字艺术史将成为艺术学领域交叉学科建设的重要思路。 展开更多
关键词 数字人文 数字艺术史 视觉相似性 数字技术
下载PDF
基于视觉特征的仿冒域名轻量级检测技术 被引量:1
6
作者 朱怡 宁振虎 周艺华 《计算机应用》 CSCD 北大核心 2020年第8期2279-2285,共7页
近年来,僵尸网络、域名挟持、钓鱼网站等仿冒域名攻击越发频繁,严重威胁着社会和个人的安全,因此仿冒域名检测已经成为网络防护的重要组成部分。当前的仿冒域名检测主要面向公共域名,检测方法以编辑距离为主,难以充分体现域名的视觉特征... 近年来,僵尸网络、域名挟持、钓鱼网站等仿冒域名攻击越发频繁,严重威胁着社会和个人的安全,因此仿冒域名检测已经成为网络防护的重要组成部分。当前的仿冒域名检测主要面向公共域名,检测方法以编辑距离为主,难以充分体现域名的视觉特征;此外利用域名相关信息进行判定虽然有助于提高检测效率,却会引入较大的额外开销。为此,考虑采用仅基于域名字符串的轻量级检测策略,并综合考虑字符位置、字符相似度和操作类型对域名视觉的影响,提出基于视觉特征的编辑距离算法。该算法根据仿冒域名的特点,先对域名进行预处理,然后按照字符位置、字符相似度及操作类型对字符赋予不同的权重,最后通过计算编辑距离值进行仿冒域名判定。实验结果表明,基于视觉特征的仿冒域名轻量级检测方法与基于编辑距离的判定方法相比,在阈值取1和2时,F1值分别提高了5.98%和13.56%,验证了该方法具有良好的检测效果。 展开更多
关键词 仿冒域名 编辑距离 视觉相似度 检测算法 轻量级
下载PDF
考虑视觉相似性的广角图像背景区分层增强 被引量:1
7
作者 周先博 王敏 《计算机仿真》 北大核心 2021年第3期157-160,共4页
为了解决广角图像背景区内容复杂导致的视觉效果差问题,提出一种考虑视觉相似性的广角图像背景区域分层增强方法。首先根据视觉习惯将对图像亮度进行调整,通过相似性像素取值计算出符合人眼需求的相似性曲线,使最初图像转换至模糊域中,... 为了解决广角图像背景区内容复杂导致的视觉效果差问题,提出一种考虑视觉相似性的广角图像背景区域分层增强方法。首先根据视觉习惯将对图像亮度进行调整,通过相似性像素取值计算出符合人眼需求的相似性曲线,使最初图像转换至模糊域中,并求解得出模糊特征平面,再运用分段函数实现灰度映射增强,同时将增强后的图像空间像素分层映射到对应模糊集合中,运用迭代增强函数求解获取出新模糊集合,并按照用户个人视觉相似性来控制增强迭代计算次数,实现图像背景区增强。仿真结果证明,所提方法可有效提高图像层次感,并表现出较好的对比度和亮度,说明所提方法具有良好的图像增强效果。 展开更多
关键词 视觉相似性 广角图像 图像分层 图像增强 映射函数 灰度图像
下载PDF
以视觉相似为基础的Phishing检测方法 被引量:1
8
作者 李暄 刘莹 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2009年第1期146-148,共3页
目前检测网络欺诈均采用人工的方式。该文提出了一种基于EMD(earth move distance)算法的视觉相似度欺诈网页检测算法,算法将网页在像素级别的相似度比较结果作为依据,判断某网页是否为欺诈网页。在2个实际系统中应用和实践了该算法,通... 目前检测网络欺诈均采用人工的方式。该文提出了一种基于EMD(earth move distance)算法的视觉相似度欺诈网页检测算法,算法将网页在像素级别的相似度比较结果作为依据,判断某网页是否为欺诈网页。在2个实际系统中应用和实践了该算法,通过对9280个网站进行检测,检测出欺诈的正确率为90.90%,结果显示该算法具有较高的欺诈检测精度以及较低的时间性能开销。 展开更多
关键词 网络安全 反欺诈 EMD算法 视觉相似度
原文传递
基于视觉和语义互学习的标签完备标注 被引量:1
9
作者 杨凯婷 张素兰 +2 位作者 张继福 胡立华 杨海峰 《小型微型计算机系统》 CSCD 北大核心 2022年第3期632-637,共6页
大多数图像标签完备方法仅依据待完备图像的视觉特征搜索近邻图像,获取候选标签实现完备,往往忽略候选标签与初始标签隐含的语义和视觉关系.为有效完备图像标签,本文依据信息的相互学习机制提出一种基于视觉和语义互学习的标签完备标注... 大多数图像标签完备方法仅依据待完备图像的视觉特征搜索近邻图像,获取候选标签实现完备,往往忽略候选标签与初始标签隐含的语义和视觉关系.为有效完备图像标签,本文依据信息的相互学习机制提出一种基于视觉和语义互学习的标签完备标注方法.首先,依据待完备图像的视觉特征和初始标签语义,搜索其近邻图像集并获取候选标签;其次,根据候选标签与初始标签的视觉内容相似性和语义相关性度量候选标签与待完备图像的关联度;最后,结合候选标签频率,选取关联程度高的候选标签实现标签补全.在基准数据集Corel5K以及真实数据集Flickr30Concepts上进行实验验证,结果表明该方法在图像标签完备的平均准确率、平均召回率以及覆盖率上均表现出更优的性能. 展开更多
关键词 图像标签完备 互学习 视觉相似性 语义相关度
下载PDF
MS-VSCN:用于影像匹配的多尺度视觉相似度比较网络 被引量:1
10
作者 彭锦超 万刚 +1 位作者 李科 李锋 《测绘科学技术学报》 CSCD 北大核心 2021年第1期56-63,共8页
影像匹配在多种计算机视觉任务中起着重要的作用。提出一种用于影像匹配的多尺度视觉相似度比较网络。该网络基于孪生网络结构进行构建,将普通卷积与空洞卷积进行融合,使得卷积神经网络在多个尺度上提取到的视觉特征实现互补。首先,网... 影像匹配在多种计算机视觉任务中起着重要的作用。提出一种用于影像匹配的多尺度视觉相似度比较网络。该网络基于孪生网络结构进行构建,将普通卷积与空洞卷积进行融合,使得卷积神经网络在多个尺度上提取到的视觉特征实现互补。首先,网络的输入由两幅待匹配的影像组成,使用权值共享的两个网络分支分别提取两幅影像的深度特征;其次,在网络中与每个普通卷积模块平行设置一个或多个空洞卷积模块,得到的特征经过融合后输入下一个网络层进行特征提取;最后,根据网络输出特征间的欧氏距离对影像的相似度进行比较,从而完成影像匹配关系的判别。实验结果表明,本文提出的方法在测试数据集上的性能优于对比方法,能够有效地完成影像匹配任务。 展开更多
关键词 影像匹配 卷积神经网络 视觉相似度 深度特征 多尺度
下载PDF
基于ICA-HMAX的视觉与语义相似性计算模型
11
作者 郑新想 段士雷 《电脑知识与技术(过刊)》 2016年第3X期177-181,共5页
该文首先简单介绍多层次卷积ICA-HMAX模型;然后提出卷积核的可视化方法实现对不同层次卷积核的理解。提出采用ICA-HMAX模型的S3层特征实现不同类别的视觉的相似度计算。通过在Caltech101数据集上实现对不同的类别之间的视觉相似度计算,... 该文首先简单介绍多层次卷积ICA-HMAX模型;然后提出卷积核的可视化方法实现对不同层次卷积核的理解。提出采用ICA-HMAX模型的S3层特征实现不同类别的视觉的相似度计算。通过在Caltech101数据集上实现对不同的类别之间的视觉相似度计算,并与类别之间的语义相似度进行对比分析进而探讨语义相似与视觉相似之间的关系。 展开更多
关键词 ICA-HMAX模型 视觉相似度 卷积核 语义相似度
下载PDF
基于形状特征描述算子的3D模型检索
12
作者 廖凯宁 李志强 孙静 《计算机工程》 CAS CSCD 北大核心 2010年第12期282-284,共3页
针对投影图像的形状特征,结合傅里叶描述算子、Zernke不变矩、形状参数、离心率的特点,提出一种基于权重关系的合成的形状特征描述算子,将其应用到3D模型投影图像检索算法中。实验结果表明,相比其他4种形状特征描述算子,该算子能较好描... 针对投影图像的形状特征,结合傅里叶描述算子、Zernke不变矩、形状参数、离心率的特点,提出一种基于权重关系的合成的形状特征描述算子,将其应用到3D模型投影图像检索算法中。实验结果表明,相比其他4种形状特征描述算子,该算子能较好描述投影图像的轮廓、区域以及整体特征信息,并可提高算法的检索效率。 展开更多
关键词 3D模型检索 视觉相似 形状特征描述算子
下载PDF
一种基于NEMD的三维场景视觉相似度评价方法
13
作者 李秀怡 《信息与电脑》 2017年第19期61-62,65,共3页
在空间的综合简化过程中,需要删除部分三维模型,笔者提出了一种基于NEMD的视觉相似度评价方法。该方法首先基于最小包容盒提取空间中单个模型的几何特征(长、宽、高),再分析模型之间的关系(距离),从而生成空间特征关系图(Attribute Rela... 在空间的综合简化过程中,需要删除部分三维模型,笔者提出了一种基于NEMD的视觉相似度评价方法。该方法首先基于最小包容盒提取空间中单个模型的几何特征(长、宽、高),再分析模型之间的关系(距离),从而生成空间特征关系图(Attribute Relation Graph)。通过计算原空间与简化后空间特征关系图之间的嵌套运土者距离(NEMD),对模型场景之的视觉相似度进行评价。通过与用户实验的比较,本方法更符合视觉特征。 展开更多
关键词 三维模型 视觉相似度 嵌套运土者距离
下载PDF
利用FAIMS法鉴别黄斑烟污染物的来源 被引量:7
14
作者 秦诗棋 周沅桢 +3 位作者 刘泽 李萍 张波 林婷 《中国烟草学报》 EI CAS CSCD 北大核心 2018年第4期7-15,共9页
为了鉴别黄斑烟中香精斑烟和料斑烟支污染物的来源,利用高场不对称离子迁移谱(FAIMS)法不同离子在强场(>15000 V/cm)条件下离子迁移率呈非线性变化的原理,使黄斑烟支上疑似香精污染物的离子团相互分离,得到待测物质的特征三维扫描图... 为了鉴别黄斑烟中香精斑烟和料斑烟支污染物的来源,利用高场不对称离子迁移谱(FAIMS)法不同离子在强场(>15000 V/cm)条件下离子迁移率呈非线性变化的原理,使黄斑烟支上疑似香精污染物的离子团相互分离,得到待测物质的特征三维扫描图谱。通过图像相似度计算查找软件(Visual Similarity Duplicate Image Finder),对比香精斑烟支污染物和对照样品三维扫描图谱的相似度,鉴别香精斑烟支污染物来源。料斑烟在经过样品处理后,可利用同样的方法鉴别。结果表明:人工分拣香精斑烟支污染物的FAIMS图谱和人造香精斑的FAIMS图谱相似度达到95%以上,人工分拣的烟丝湿团的FAIMS图谱和各类人造污染物的FAIMS图谱相似度约为95%,说明可利用FAIMS分析与鉴别香精斑烟和料斑烟表面污染物来源,且人工观察分拣黄斑烟支归类的方法基本准确。 展开更多
关键词 高场不对称离子迁移谱(FAIMS) 黄斑烟污染物 糖料 香精 图像相似度计算查找软件(visual similarity DUPLICATE Image Finder)
下载PDF
高光色品质LED照明光源研究 被引量:6
15
作者 赖传杜 庄其仁 +1 位作者 胡奕彬 刘士伟 《激光与光电子学进展》 CSCD 北大核心 2017年第6期243-251,共9页
为解决现有高显色指数发光二极管(LED)光源仍然可能存在富蓝光危害的问题,基于人眼光谱光视效率、辨色函数和光谱响应度函数建立了被测光源光谱与参考光源光谱视觉相似度模型,提出一种以光谱视觉相似度参数(R_V)设计高光色品质LED合成... 为解决现有高显色指数发光二极管(LED)光源仍然可能存在富蓝光危害的问题,基于人眼光谱光视效率、辨色函数和光谱响应度函数建立了被测光源光谱与参考光源光谱视觉相似度模型,提出一种以光谱视觉相似度参数(R_V)设计高光色品质LED合成照明光源的方法。采用国际照明委员会(CIE)推荐的标准光源D50作为参考光源,将冷白光、暖白光、红色光、绿色光、青色光和蓝色光6种LED组合,通过遍历优化的方法计算各种LED的组合灯珠数量,根据R_V>96的指标要求设计的LED合成光源相关色温范围为4000~7000K,一般显色指数Ra>95,符合高光色品质健康照明光源要求,证明了该设计方法的合理性。研究结果还表明,选择不同色温的CIE标准光源作为参考光源,可以设计不同色温要求的高显色性白光。 展开更多
关键词 光学器件 发光二极管 光色品质 显色指数 蓝光危害 光谱视觉相似度
原文传递
基于语境与文本结构融合的中文拼写纠错方法
16
作者 刘昌春 张凯 +2 位作者 包美凯 刘烨 刘淇 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第3期451-463,共13页
在中文拼写纠错任务的处理中往往存在对句子的语义理解不够且对于汉字的语音和视觉信息利用较少的问题,针对这一问题,提出一种基于语境置信度和汉字相似度的纠错方法(ECS).该方法基于深度学习的理论,融合汉字的视觉相似度、汉字的语音... 在中文拼写纠错任务的处理中往往存在对句子的语义理解不够且对于汉字的语音和视觉信息利用较少的问题,针对这一问题,提出一种基于语境置信度和汉字相似度的纠错方法(ECS).该方法基于深度学习的理论,融合汉字的视觉相似度、汉字的语音相似度以及微调过的预训练BERT模型,能自动提取句子语义并利用汉字的相似性.具体地,通过对预训练的中文BERT模型进行微调,使之能适应下游的中文拼写纠错任务;同时,利用表意文字描述序列获取汉字的树形结构作为视觉信息,采用汉字的拼音序列作为语音信息;最后,利用编辑距离得出汉字的视觉和语音相似度,并将这些相似度数据与微调过的BERT模型融合,以实现纠错任务.在SIGHAN标准数据集上的测试结果显示,和基准模型相比,提出的ECS方法其F1-score提升巨大,在检错层面上提升2.1%,在纠错层面上提升2.8%,也验证了将汉字的语境信息、视觉信息与语音信息融合用于中文拼写纠错任务的适用性. 展开更多
关键词 中文拼写纠错 BERT 汉字语音相似度 汉字视觉相似度 预训练模型
下载PDF
汉语短时序列回忆中的语音相似性和视觉相似性效应 被引量:3
17
作者 李轩 刘思耘 《心理学报》 CSSCI CSCD 北大核心 2012年第12期1571-1582,共12页
语音相似性效应和视觉相似性效应是短时序列回忆中的两个典型性效应,但前人很少探讨这两种效应的交互作用。本研究利用汉语字形和语音的属性,观察汉字短时序列回忆中语音相似性效应、视觉相似性效应及两者的交互作用。研究结果发现当回... 语音相似性效应和视觉相似性效应是短时序列回忆中的两个典型性效应,但前人很少探讨这两种效应的交互作用。本研究利用汉语字形和语音的属性,观察汉字短时序列回忆中语音相似性效应、视觉相似性效应及两者的交互作用。研究结果发现当回忆项目在语音或视觉上单纯相似或不相似时,视觉相似性效应及其与语音相似性的交互作用与混合词表条件下所发现的结果有很大的不同。这个研究结果为丰富和补充相关理论模型提供了进一步实证依据。 展开更多
关键词 即时序列回忆 语音相似性 视觉相似性
下载PDF
即时序列回忆中汉字的字频、形似和音同效应 被引量:1
18
作者 钟毅平 张磊 叶义进 《湖南师范大学教育科学学报》 CSSCI 2010年第6期96-99,共4页
以母语为汉语的在校大学生作为被试,实验一采取2(字频:高频和低频)*2(读音:音同和音异)*2(字形:形似和形异)三因素混合设计,实验二在发音抑制条件下,采用2(读音:音同和音异)*2(字形:形似和形异)二因素被试内设计,探讨汉字即时系列回忆... 以母语为汉语的在校大学生作为被试,实验一采取2(字频:高频和低频)*2(读音:音同和音异)*2(字形:形似和形异)三因素混合设计,实验二在发音抑制条件下,采用2(读音:音同和音异)*2(字形:形似和形异)二因素被试内设计,探讨汉字即时系列回忆及其字频、形似和音同效应。实验一发现,字频的高低、字音和字形的相似性对即时回忆成绩有显著影响,但三个因素之间交互作用不明显。在发音抑制条件下(实验二),汉字系列回忆中字形相似性有显著的主效应,而语音相似性的主效应不显著,音形二者之间的交互作用明显。说明在汉字即时序列回忆过程中存在着相互独立的视觉编码和听觉编码过程。 展开更多
关键词 短时记忆 视觉系列回忆 发音抑制 音同效应 形似效应
下载PDF
图像重排序中与查询相关的图像相似性度量 被引量:2
19
作者 王黎 帅建梅 《计算机系统应用》 2010年第11期66-70,共5页
现今的图像搜索引擎主要利用图像周围文本信息为图像排序,根据图像内容重排序可以进一步提高搜索性能。图像相似性的度量对重排序算法的性能至关重要。然而已有的相似性度量没有考虑针对不同的查询,图像的相似性应该不同。提出一种与查... 现今的图像搜索引擎主要利用图像周围文本信息为图像排序,根据图像内容重排序可以进一步提高搜索性能。图像相似性的度量对重排序算法的性能至关重要。然而已有的相似性度量没有考虑针对不同的查询,图像的相似性应该不同。提出一种与查询相关的相似性度量方法,将基于全局特征的相似性,基于局部特征的相似性,以及视觉单词同时出现率融合到一个迭代算法中,挖掘出与查询相关的图像信息,计算图像相似性。在Bing图像搜索引擎上的实验结果证明本文提出的相似性度量方法优于基于全局特征,局部特征,或它们线性组合的相似性。 展开更多
关键词 图像重排序 与查询相关的图像相似性 视觉单词同时出现率
下载PDF
基于局部–全局建模与视觉相似引导的光流估计方法
20
作者 舒铭奕 张聪炫 +3 位作者 陈震 葛利跃 胡卫明 王子旭 《中国科学:信息科学》 CSCD 北大核心 2023年第10期1945-1964,共20页
光流估计是计算机视觉的核心任务.近年来,基于卷积神经网络的光流估计方法已取得很大成功,然而由于现有模型的卷积感受野有限,难以建模远距离的依赖关系,导致在大位移和局部歧义性区域的光流估计效果较差.此外,现有方法在光流上采样过... 光流估计是计算机视觉的核心任务.近年来,基于卷积神经网络的光流估计方法已取得很大成功,然而由于现有模型的卷积感受野有限,难以建模远距离的依赖关系,导致在大位移和局部歧义性区域的光流估计效果较差.此外,现有方法在光流上采样过程采用的插值操作会导致误差的传播放大,进而引起光流估计的运动边缘模糊等问题.针对以上问题,本文提出了一种基于局部–全局建模与视觉相似引导上采样的光流估计方法.首先,引入一个高效且简单的自注意力机制加强光流计算网络的局部和全局建模能力.通过提取更具有表达力的图像特征,降低因大位移和局部歧义性导致的光流估计误差问题.其次,基于物体视觉特征越相似,运动也越相似的假设,构建视觉相似引导的光流上采样网络模型.将特征的视觉相似性转化为运动的相似性进而指导光流上采样过程,提高了运动边界区域光流估计的精度.最后,分别采用MPI-Sintel和KITTI数据库测试图像集对本文方法和最先进的深度学习光流计算方法进行综合对比分析.实验结果表明,本文方法在所有对比方法中取得了最优的光流计算结果,尤其在大位移和运动边界区域显著提升了光流计算的精度. 展开更多
关键词 光流估计 卷积神经网络 自注意力 上采样 视觉相似引导
原文传递
上一页 1 2 下一页 到第
使用帮助 返回顶部