期刊文献+
共找到32篇文章
< 1 2 >
每页显示 20 50 100
汉字识别研究的回顾 被引量:48
1
作者 丁晓青 《电子学报》 EI CAS CSCD 北大核心 2002年第9期1364-1368,共5页
本文回顾了汉字识别研究的历程.根据模仿人类视觉模型,基于文字图像的统计模式识别方法是文字识别取得瞩目进展的基础。模式识别信息熵理论揭示了模式分类的信息过程和理论极限,本文讨论了从汉字图像中提取特征以及文字识别分类器设计... 本文回顾了汉字识别研究的历程.根据模仿人类视觉模型,基于文字图像的统计模式识别方法是文字识别取得瞩目进展的基础。模式识别信息熵理论揭示了模式分类的信息过程和理论极限,本文讨论了从汉字图像中提取特征以及文字识别分类器设计和学习的各种方法.介绍了文本识别必须解决的文字切分,版面分析、理解和重构,及提高识别性能等重要问题,最后,总结了文字识别研究的重要进展和对今后的展望。 展开更多
关键词 汉字识别 文本识别 视觉感知 特征提取 分类器设计 版面分析
下载PDF
基于视觉感知的蔬菜害虫诱捕计数算法 被引量:14
2
作者 肖德琴 张玉康 +3 位作者 范梅红 潘春华 叶耀文 蔡家豪 《农业机械学报》 EI CAS CSCD 北大核心 2018年第3期51-58,共8页
针对当前大田环境条件下对害虫进行识别研究的不足,以南方蔬菜重大害虫为研究对象,探索了一种在大田环境下使用黄色诱捕板对蔬菜害虫进行监测计数的方法。在经典图像处理算法基础上,根据害虫监测目标的需要,提出了一种基于结构化随机森... 针对当前大田环境条件下对害虫进行识别研究的不足,以南方蔬菜重大害虫为研究对象,探索了一种在大田环境下使用黄色诱捕板对蔬菜害虫进行监测计数的方法。在经典图像处理算法基础上,根据害虫监测目标的需要,提出了一种基于结构化随机森林的害虫图像分割算法和利用不规则结构的特征提取算法,进一步结合背景去除、干扰目标去除和检测模型计数子算法,集成设计了基于视觉感知的蔬菜害虫计数算法(Vegetable pest counting algorithm based on visual perception,VPCA-VP)。使用了现场环境下拍摄的图像进行实验与分析,共识别出蓟马9351只,烟粉虱202只,实蝇23只。经过与人工计数比对得出,本文基于视觉感知的蔬菜害虫计数算法的平均识别正确率为94.89%。其中,蔬菜害虫蓟马的识别正确率为93.19%,烟粉虱的识别正确率为91%,实蝇的识别正确率达到100%。算法达到了较好的测试性能,可以满足害虫快速计数需求,在农田害虫监测中有一定的应用前景。 展开更多
关键词 视觉感知 蔬菜害虫 识别 随机森林 相似性描述子 不规则特征提取
下载PDF
基于视觉感知特征的条烟异常检测算法 被引量:9
3
作者 颜西斌 《烟草科技》 EI CAS CSCD 北大核心 2016年第1期78-83,共6页
为解决卷烟生产过程中条烟存在的小包缺失、小包破损、烟支缺失、烟支错排等问题,基于条烟的X光图像设计了一种新的特征提取算法。通过模仿人眼识别原理,从视觉感知角度对物体边界区域、稠密性、分布状况、方向属性和规律程度进行特征提... 为解决卷烟生产过程中条烟存在的小包缺失、小包破损、烟支缺失、烟支错排等问题,基于条烟的X光图像设计了一种新的特征提取算法。通过模仿人眼识别原理,从视觉感知角度对物体边界区域、稠密性、分布状况、方向属性和规律程度进行特征提取,简称VPFE(Visual Perception Feature Extraction)算法。基于VPFE利用不同分类器对条烟生产中的异常情况进行检测试验,结果表明:1VPFE算法在不同分类器下均有较好的检测效果,可以被主流分类器用于学习分类,且检测精度优于其他特征提取算法。烟支缺失和小包缺失情况的检测精度达100%。2VPFE算法还可对破损面积在20%以上的小包以及烟支错排情况进行检测,小包破损检出率达95.8%,烟支错排检出率达96.6%。该算法有效满足了条烟异常情况检测的精度要求,杜绝了条烟缺支和缺包现象,提升了卷烟包装水平。 展开更多
关键词 条烟 视觉感知 X光图像 异常检测 分类器 特征提取
下载PDF
可计算图像复杂度评价方法综述 被引量:8
4
作者 郭小英 李文书 +2 位作者 钱宇华 白茹意 贾春花 《电子学报》 EI CAS CSCD 北大核心 2020年第4期819-826,共8页
可计算的图像复杂度评价是让计算机模拟人类视觉感知,从而对图像视觉复杂度进行决策的研究,该研究属于多学科交叉的创新性研究课题,在图像工程领域具有重要意义.本文针对可计算的图像复杂度评价方法进行了全面的梳理和分析,文中首先回... 可计算的图像复杂度评价是让计算机模拟人类视觉感知,从而对图像视觉复杂度进行决策的研究,该研究属于多学科交叉的创新性研究课题,在图像工程领域具有重要意义.本文针对可计算的图像复杂度评价方法进行了全面的梳理和分析,文中首先回顾了图像复杂度的应用领域,并详细阐述了图像复杂度评价方法,从信息论、图像压缩理论、图像特征分析、眼动数据等方面进行总结;随后,着重阐述基于图像特征的图像复杂度评价方法中所使用的图像特征;归纳图像复杂度建模中的分类和回归问题;最后,总结当前图像视觉复杂度评价方法存在的问题和挑战,展望图像复杂度的计算化发展方向. 展开更多
关键词 视觉复杂度 情感感知 复杂度评价 特征提取 分类与回归
下载PDF
小虫春秋:果蝇的视觉学习记忆与认知 被引量:6
5
作者 郭爱克 彭岳清 +1 位作者 张柯 奚望 《自然杂志》 北大核心 2009年第2期63-68,F0002,共7页
视觉认知是脑科学领域中的重要研究方向,是揭示"脑是怎样工作的","物质的脑是如何产生精神的"的重要路径。近年来,科学家们以果蝇为模式生物,从基因-脑-行为-认知相结合的角度,系统性地开创了果蝇的视觉"认知&... 视觉认知是脑科学领域中的重要研究方向,是揭示"脑是怎样工作的","物质的脑是如何产生精神的"的重要路径。近年来,科学家们以果蝇为模式生物,从基因-脑-行为-认知相结合的角度,系统性地开创了果蝇的视觉"认知"研究,如学习与记忆、注意、跨模态记忆、特征提取和泛化、两难抉择、抉择的神经环路等。即使果蝇这样相对简单的脑,在很多方面都展示了令人惊奇的"理性"行为。看来,那种认为只有某些独特的唯一的脑机制才能实现人类的理性的想法是不成立的。我们期待,在探索"智与愚"的神经生物基础方面,果蝇会对我们继续有所帮助。 展开更多
关键词 果蝇 视觉不变性 记忆痕迹 两难抉择 特征抽提 记忆协同
下载PDF
基于仿生视觉的图像RST不变属性特征提取方法 被引量:7
6
作者 余伶俐 夏旭梅 +1 位作者 周开军 陈海初 《仪器仪表学报》 EI CAS CSCD 北大核心 2017年第4期985-995,共11页
针对图像目标识别过程中易受旋转、缩放、平移及噪声影响的问题,提出一种仿生物视觉感知的RST不变属性特征提取方法,以提升形变目标的识别率与抗噪鲁棒性。受生物视觉感知机理启发,其皮质细胞经过多级变换后,能够最佳权衡图像选择性与... 针对图像目标识别过程中易受旋转、缩放、平移及噪声影响的问题,提出一种仿生物视觉感知的RST不变属性特征提取方法,以提升形变目标的识别率与抗噪鲁棒性。受生物视觉感知机理启发,其皮质细胞经过多级变换后,能够最佳权衡图像选择性与不变性。为此,该方法设计成两个阶段。第1阶段中,受生物视觉在水平与垂直方向响应强烈的启发,提出Gabor滤波器与双极滤波器融合的filter-to-filter方向边缘检测方法。Gabor滤波作为底层滤波器平滑图像,通过高层水平与垂直方向双极滤波器检测边缘,构建方向边缘检测子。以增强特征提取的鲁棒性,提升边缘检测的准确度。在此基础上,模拟大脑视觉皮质细胞对线条响应强度的反馈,根据不同边缘方向及间距,度量图像线条的空间频率。设计空间频率间距检测子,将方向边缘图像映射至方向θ-间距I坐标系中。使原图像的旋转与比例缩放,在该坐标系上表现为水平与垂直方向变化。在第2阶段中,针对第1阶段输出图像,再次进行方向边缘检测与间距检测。将第1阶段中水平与垂直平移变换,转变为第2阶段的特征图中不变像素点,使图像具有RST不变性。通过实验统计分析,验证了本文特征的RST不变性及其识别能力。并与其他不变属性特征提取方法进行了识别率与复杂度比较,突显本方法对噪声的强鲁棒性与RST的高识别率。 展开更多
关键词 RST不变属性特征 仿生物视觉感知 图像特征提取 目标识别
下载PDF
线性文化遗产景观视觉感知区位信息模型与实证 被引量:1
7
作者 孙宝磊 郭风华 +1 位作者 李仁杰 陈新杰 《地理科学进展》 CSSCI CSCD 北大核心 2024年第1期80-92,共13页
合适的视觉感知区位是获得良好景观体验的必要条件,但GIS视域计算结果对可视区位与景观语义之间可视关系的表征能力不足,难以进一步开展视觉景观资源的深度价值挖掘。论文基于已有景观视觉感知计算的理论与实践成果,提出并设计了面向线... 合适的视觉感知区位是获得良好景观体验的必要条件,但GIS视域计算结果对可视区位与景观语义之间可视关系的表征能力不足,难以进一步开展视觉景观资源的深度价值挖掘。论文基于已有景观视觉感知计算的理论与实践成果,提出并设计了面向线性文化遗产的景观视觉感知区位信息模型(landscape visual perception location model,LVPLM),基于NetCDF多维栅格数据结构建立了LVPLM数据集的组织方法及其应用逻辑。LVPLM数据集通过二维地理坐标维度表达视觉感知区位,通过语义特征点编码维度表达目标景观语义信息,进而建构视觉感知区位与景观语义之间的可视关系,实现了目标景观、感知区位和可视状态的信息集成。同时,设计了“钻取”“切片”“切块”三种LVPLM数据集应用模式,为多模式景观视觉感知信息挖掘与分析奠定了基础。论文选择长城线性文化遗产景观资源开展实证研究,建立了古北口长城LVPLM数据集,并通过实地调研勘测采集视觉对照验证数据,评估了数据集的基本可信度,初步证明了LVPLM模型的可行性与应用价值,也为长城国家文化公园高质量建设提供了新的数据资源。 展开更多
关键词 LVPLM模型 景观视觉感知 语义特征点 线性文化遗产 NETCDF 古北口长城
原文传递
多特征方向偏好轮廓提取算法 被引量:4
8
作者 权威 黄华 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2018年第1期100-106,共7页
轮廓提取是计算机视觉领域的经典难题之一.文中提出一种基于视觉感知机理的多特征方向偏好轮廓提取算法,分为3层结构:首先将亮度与颜色信息分离;随后使用高斯差模型进行滤波,模拟神经节细胞的同心圆拮抗机制;最后模拟初级视皮层的处理机... 轮廓提取是计算机视觉领域的经典难题之一.文中提出一种基于视觉感知机理的多特征方向偏好轮廓提取算法,分为3层结构:首先将亮度与颜色信息分离;随后使用高斯差模型进行滤波,模拟神经节细胞的同心圆拮抗机制;最后模拟初级视皮层的处理机制,通过方向滤波获取显著边缘信息,并利用固有变差对边缘进行筛选,最终整合输出轮廓结果.实验表明,该算法计算速度快,且轮廓提取结果完整、对噪声抑制强. 展开更多
关键词 轮廓提取 视觉感知 多特征 视觉皮层
下载PDF
融合点线特征的视觉惯性同时定位及建图
9
作者 姚建均 李英朝 +3 位作者 吴杨 唐瑞卓 于新达 闫宇坤 《哈尔滨工程大学学报》 EI CAS CSCD 北大核心 2024年第4期771-778,共8页
为了解决移动机器人在低纹理场景中的定位精度较低且容易跟踪丢失问题,本文设计了一种点线特征提取和匹配策略,并以此构建了视觉惯性同时定位和建图系统。提出线特征提取和匹配算法,通过改良线特征提取算法的隐藏参数,提高了线特征提取... 为了解决移动机器人在低纹理场景中的定位精度较低且容易跟踪丢失问题,本文设计了一种点线特征提取和匹配策略,并以此构建了视觉惯性同时定位和建图系统。提出线特征提取和匹配算法,通过改良线特征提取算法的隐藏参数,提高了线特征提取的精度。利用点线特征不同匹配筛选框架减少误匹配的数目,得出了可以应用于视觉惯性同时定位和建图系统的线特征提取匹配算法。在现有视觉惯性框架中引入提出的线特征约束,搭建了能在未知低纹理环境下鲁棒运行的视觉惯性同时定位及建图系统。研究表明:在真实环境中的移动机器人定位实验证明了该系统的精度和鲁棒性优于现有的视觉惯性框架,其室内定位精度提高了24.2%,走廊定位精度提高了8%,对于移动机器人在低纹理场景下的高精度定位具有较高价值。 展开更多
关键词 同时定位及建图 点线特征 视觉惯性里程计 单目视觉 移动机器人感知 特征匹配 低纹理 回环检测
下载PDF
一种基于视觉感知的舰船目标智能化识别方法 被引量:4
10
作者 马啸 邵利民 +2 位作者 卢惠民 肖军浩 谷东亮 《电讯技术》 北大核心 2020年第10期1133-1141,共9页
为有效识别视觉系统采集的可见光图像中的舰船目标,提出了基于YOLO(You Only Look Once)网络模型改进的10层的卷积神经网络(Convolutional Neural Network,CNN)用于水面舰船目标的智能识别,通过反卷积的方法可视化CNN中不同卷积层提取... 为有效识别视觉系统采集的可见光图像中的舰船目标,提出了基于YOLO(You Only Look Once)网络模型改进的10层的卷积神经网络(Convolutional Neural Network,CNN)用于水面舰船目标的智能识别,通过反卷积的方法可视化CNN中不同卷积层提取到的舰船目标特征。按照传统目标识别方法提取了舰船目标的四类典型人工设计特征,将所提CNN的舰船目标识别结果与YOLO网络模型及四类人工设计特征结合支持向量机用于舰船目标识别的结果进行比较。实验结果表明,与YOLO网络模型相比,综合精确率、召回率和效率3个舰船目标识别的性能指标,改进后的CNN性能更好,从而验证了所提方法的有效性。不同数据量下采用典型特征识别舰船目标与基于深度CNN识别舰船目标的识别结果比较说明了不同类型目标识别算法的优劣势,有利于推动综合性视觉感知框架的构建。 展开更多
关键词 无人作战系统 舰船目标识别 视觉感知 卷积神经网络 特征提取
下载PDF
结合视觉感知的调焦窗口构建 被引量:4
11
作者 刘雪超 吴志勇 +1 位作者 黄德天 梁敏华 《中国激光》 EI CAS CSCD 北大核心 2014年第1期191-198,共8页
为使靶场光测设备在进行基于图像的自动调焦过程中建立适当的调焦窗口以降低计算量并克服背景干扰,提出了结合视觉感知机制的调焦窗口构建方法。对图像进行金字塔分层获得多层子图;采用Gabor滤波器和基于高斯差分(DoG)的模型模拟人类大... 为使靶场光测设备在进行基于图像的自动调焦过程中建立适当的调焦窗口以降低计算量并克服背景干扰,提出了结合视觉感知机制的调焦窗口构建方法。对图像进行金字塔分层获得多层子图;采用Gabor滤波器和基于高斯差分(DoG)的模型模拟人类大脑视皮层细胞功能,对子图层进行信息提取和特征融合,获得基于视觉感知的特征图;对该特征图进行阈值去噪,以减少干扰,并以边界扩展法建立适合于后续处理的矩形调焦窗口。实验结果证明,对于各种调焦状态下的图像,尤其是深度离焦状态,都能快速、准确地针对目标构建适当的调焦窗口,处理720pixel×576pixel的目标图像耗时小于130ms。该方法能够满足靶场的实际要求,为整个调焦过程实时建立稳定、准确的调焦窗口,具有广泛的工程应用价值。 展开更多
关键词 图像处理 调焦 视觉感知 调焦窗口 特征提取
原文传递
基于稀疏表示的无参考型超分辨图像质量评价方法 被引量:3
12
作者 张婷悦 张凯兵 《西安工程大学学报》 CAS 2020年第5期20-26,33,共8页
针对无参考型超分辨图像质量评价(no-reference super-resolution image quality assessment,NR-SRIQA)与人眼主观感知一致性的问题,提出一种基于稀疏表示的NR-SRIQA方法。该方法将超分辨图像的视觉感知特征和对应的平均主观分数(mean o... 针对无参考型超分辨图像质量评价(no-reference super-resolution image quality assessment,NR-SRIQA)与人眼主观感知一致性的问题,提出一种基于稀疏表示的NR-SRIQA方法。该方法将超分辨图像的视觉感知特征和对应的平均主观分数(mean opinion score,MOS)进行组合构造超完备字典,测试超分辨图像的视觉感知特征,将其表示为该字典中基原子的稀疏线性组合,利用获得的稀疏表示系数加权相关字典原子的质量分数,实现对超分辨图像质量的预测。实验结果表明:相比于其他主流方法,所提出的质量评价方法能获得与主观感知质量更好的一致性。 展开更多
关键词 视觉感知特征 稀疏表示 超完备字典 无参考型超分辨图像质量评价 超分辨图像数据库
下载PDF
基于动态视觉运动特征的脉冲神经网络识别方法 被引量:1
13
作者 董峻妃 姜润皓 +1 位作者 燕锐 唐华锦 《电子与信息学报》 EI CSCD 北大核心 2023年第8期2731-2738,共8页
针对现有脉冲神经网络(SNN)对动态视觉事件流识别精度低与实时性差等问题,该文提出一种基于动态视觉运动特征的脉冲神经网络识别方法。首先利用基于事件的运动历史信息表示与梯度方向计算提取事件流中的动态运动特征;然后引入时空池化... 针对现有脉冲神经网络(SNN)对动态视觉事件流识别精度低与实时性差等问题,该文提出一种基于动态视觉运动特征的脉冲神经网络识别方法。首先利用基于事件的运动历史信息表示与梯度方向计算提取事件流中的动态运动特征;然后引入时空池化操作来消除事件在时间和空间上的冗余,保留显著的运动特征;最后,将特征事件流输入脉冲神经网络进行学习与识别。在基准的动态视觉数据集上的实验结果表明,动态视觉运动特征可显著提升SNN对于事件流的识别精度与计算速度。 展开更多
关键词 动态视觉感知 事件相机 脉冲神经网络 动作识别 运动特征提取
下载PDF
视频目标分割中帧间相似性传播的研究 被引量:2
14
作者 章雪瑞 孙凤铭 袁夏 《计算机工程与应用》 CSCD 北大核心 2022年第6期227-233,共7页
目前视频目标分割算法多是基于匹配和传播策略分割目标,常常以掩模或者光流的方式利用前一帧的信息,探索了新的帧间特征传播方式,利用短时匹配模块提取前一帧信息并传播给当前帧,提出一种面向视频序列数据的目标分割模型。通过长时匹配... 目前视频目标分割算法多是基于匹配和传播策略分割目标,常常以掩模或者光流的方式利用前一帧的信息,探索了新的帧间特征传播方式,利用短时匹配模块提取前一帧信息并传播给当前帧,提出一种面向视频序列数据的目标分割模型。通过长时匹配模块和短时匹配模块分别与第一帧和前一帧做相关操作进行像素级匹配,得到的全局相似性图和局部相似性图,以及前一帧的掩模和当前帧的特征图,经过两个优化网络后通过分割网络得到分割结果。在视频目标分割公开数据集上的实验表明,所提出方法在单目标和多目标上分别取得了86.5%和77.4%的区域相似度和轮廓精度均值,每秒可计算21帧。提出的短时匹配模块比仅使用掩模更有利于提取前一帧的信息,通过长时匹配模块和短时匹配模块的结合,不使用在线微调即可实现高效的视频目标分割,适合应用于移动机器人视觉感知。 展开更多
关键词 视觉感知 视频目标分割 特征传播 长-短时匹配
下载PDF
基于图像自身复杂视觉信息的特征提取算法与应用 被引量:2
15
作者 赵彦明 季圣杰 《计算机科学》 CSCD 北大核心 2014年第S1期234-238,共5页
针对现阶段特征提取方法忽视图像自身的视觉信息的问题,提出了基于图像自身复杂视觉信息的特征提取算法与应用。该算法分析了视觉皮层V1区4B层复杂细胞的视觉功能,揭示了复杂视觉细胞提取区域图像非线性、独立和平移不变性特征的能力,... 针对现阶段特征提取方法忽视图像自身的视觉信息的问题,提出了基于图像自身复杂视觉信息的特征提取算法与应用。该算法分析了视觉皮层V1区4B层复杂细胞的视觉功能,揭示了复杂视觉细胞提取区域图像非线性、独立和平移不变性特征的能力,建立了复杂视觉细胞的数学模型,并通过该模型提取了区域图像包含的复杂视觉信息。实验证明:所提算法依据图像自身包含的高级视觉信息,自适应提取区域图像的非线性、独立性和几何不变性特征,克服了常见特征提取算法忽视图像自身视觉特征的缺陷;在基于图像内容的图像检索领域,算法取得了良好的检索效果。 展开更多
关键词 视觉感知理论 几何不变性 非线性主成分分析 特征提取
下载PDF
基于感知偏序模型的图标视觉复杂度研究 被引量:1
16
作者 陆宏菊 崔嘉 《智能计算机与应用》 2023年第11期208-214,共7页
视觉复杂度分析是计算机视觉研究的重要分支。当前主流研究方法采用基于用户数据的统计概率模型进行定量评估,这样虽能获得统计型结论,但由于缺少对潜在逻辑规则的考虑而无法逼近用户真实模型。用户感知评价的不稳定性常常导致训练模型... 视觉复杂度分析是计算机视觉研究的重要分支。当前主流研究方法采用基于用户数据的统计概率模型进行定量评估,这样虽能获得统计型结论,但由于缺少对潜在逻辑规则的考虑而无法逼近用户真实模型。用户感知评价的不稳定性常常导致训练模型收敛困难或者次最优现象的出现。本文针对此问题,结合用户感知评价特征与视觉特征的关系,提出基于用户感知偏序关系的视觉图标复杂度分析模型。针对感知数据难以获取和表示的困难,本文提出基于二比较的偏序关系表示用户感知特征;采用可信度预处理减少用户评价数据矛盾冲突对于模型预测的影响。通过提取特定的可视化特征,本文提出改进的SVM模型对基于偏序对的感知数据进行训练获得图标视觉复杂度感知模型。通过进行Pearson、Kendall和Spearman系数的对比,本文预测模型在中国大学图标数据库上与人工评价结果高度相似(>90%)。与最新算法的对比结果证实了本文算法的有效性和先进性。 展开更多
关键词 图标视觉复杂度 主观感知模型 主观特征表示 偏序关系 SVM
下载PDF
羌族刺绣审美文化探析 被引量:2
17
作者 王李羊 《浙江艺术职业学院学报》 2017年第2期130-134,共5页
羌族刺绣是羌族人民社会生活、历史文化、民族精神的集中体现之一,具有独特的审美价值,2008年6月被国务院列入《第二批国家级非物质文化遗产名录》。现代化、全球化趋势下,快速发展的社会经济加速了各民族之间的交流融合,羌族刺绣受到... 羌族刺绣是羌族人民社会生活、历史文化、民族精神的集中体现之一,具有独特的审美价值,2008年6月被国务院列入《第二批国家级非物质文化遗产名录》。现代化、全球化趋势下,快速发展的社会经济加速了各民族之间的交流融合,羌族刺绣受到现代生活和价值观念的冲击。深入分析、阐释羌族刺绣物化形象与视觉感知之间的联系及其审美特性,在创新发展中适应现代社会人们的审美趣味,有利于羌族刺绣的活态传承,探索羌绣"传承、融合、创新"的可持续发展之路。 展开更多
关键词 羌族刺绣 物化形象 视觉感知 审美特征 创新发展
下载PDF
多尺度时空特征聚合的全参考视频质量评价
18
作者 张威 赵世灵 +2 位作者 刘银豪 王鸿奎 殷海兵 《计算机工程与应用》 CSCD 北大核心 2023年第18期154-162,共9页
视频质量得分是观测者在多个时间尺度下对视频进行感知的结果,而当前质量评价模型普遍在某个固定尺度下对失真进行描述,单一粒度的特征对全局信息表征并不充足。为充分提取并聚合多粒度信息来刻画人类复杂的感知机制,提出一种基于多尺... 视频质量得分是观测者在多个时间尺度下对视频进行感知的结果,而当前质量评价模型普遍在某个固定尺度下对失真进行描述,单一粒度的特征对全局信息表征并不充足。为充分提取并聚合多粒度信息来刻画人类复杂的感知机制,提出一种基于多尺度时空特征聚合的全参考视频质量评价方法。为解决传统质量评价算法中固定间隔采样丢失关键帧的痛点,通过结合图像结构失真度与感知运动能量对序列自适应采样;为提取不同粒度特征对失真进行表征,并探究聚合多粒度特征的有效方式,利用堆叠的长短时记忆层对序列进行特征提取,模拟视觉神经的正反向感知迭代机制,对网络层特征融合;结合多通道自注意力网络回归预测得分。模型在多个数据集中的SRCC指标均达到0.93以上,取得最优或次优的性能。 展开更多
关键词 视频质量评价 自适应采样 视觉神经感知 特征金字塔 多尺度时空域特征 长短时记忆网络
下载PDF
视频质量评价研究综述
19
作者 鄢杰斌 方玉明 +2 位作者 刘学林 姚怡茹 眭相杰 《计算机学报》 EI CAS CSCD 北大核心 2023年第10期2196-2224,共29页
移动互联网时代每天都产生海量的质量参差不齐的视频数据,根据视频质量高效地过滤低质量视频对缓解设备存储压力起着至关重要的作用.此外,在视频的生成、处理、传输等过程中都不可避免地引入信号噪声,如何准确地预测视频质量,从而指导... 移动互联网时代每天都产生海量的质量参差不齐的视频数据,根据视频质量高效地过滤低质量视频对缓解设备存储压力起着至关重要的作用.此外,在视频的生成、处理、传输等过程中都不可避免地引入信号噪声,如何准确地预测视频质量,从而指导与监督视频处理与传输系统的优化具有重要的研究意义和实际价值.因此,视频质量评价受到越来越多的关注.视频质量评价旨在定量描述视频的视觉质量,包括主观质量评价和客观质量评价.主观质量评价通过开展视觉感知主观实验,研究各项因素对视觉质量的影响,并收集主观质量分数用于构建基准数据集;客观质量评价通过设计客观算法,自动预测视频的质量.本文首先介绍视频质量评价的基础知识,阐述视频质量评价的相关应用和问题;其次,重点介绍视频质量评价近二十年的发展现状,对比不同主观数据集的特点;然后,深入解析客观模型的建模思想,分层次对比不同的模型,详细分析各模型的优缺点;最后,指出未来发展方向并总结全文. 展开更多
关键词 视频质量评价 视觉感知 特征工程 机器学习 深度学习
下载PDF
引入视觉感知的视频镜头分割 被引量:1
20
作者 高尹 刘颖 +1 位作者 来毅 刘陆 《现代电子技术》 北大核心 2019年第18期73-76,共4页
视频的大数据时代已经到来,将视频序列分割成镜头来进行视频内容分析和视频检索是十分重要的研究方向.文中提出一种基于帧间一致(Frame Consistency,FC)模型和光流特征的视频镜头分割技术.利用基于视觉感知的"整体到局部"的思... 视频的大数据时代已经到来,将视频序列分割成镜头来进行视频内容分析和视频检索是十分重要的研究方向.文中提出一种基于帧间一致(Frame Consistency,FC)模型和光流特征的视频镜头分割技术.利用基于视觉感知的"整体到局部"的思想,首先浏览视频,除去视频的冗余信息,以降低计算成本,并通过提取视频的视觉特征构建帧间一致性函数,以此创建可能的镜头分割集合,并结合运动特征进一步优化分割结果.该技术在评估上,其精确度、召回率和F1值,都呈现出较好的效果. 展开更多
关键词 镜头分割 视觉感知 帧间一致模型 光流特征 模型评估 冗余信息去除
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部