期刊文献+
共找到12篇文章
< 1 >
每页显示 20 50 100
一种结构化道路的实时检测算法 被引量:4
1
作者 顾洁宇 叶秀清 顾伟康 《传感技术学报》 CAS CSCD 北大核心 2005年第3期514-518,共5页
提出了一种自动检测结构化道路边界的算法,此方法基于结构化道路环境的特点。它将边沿检测和道路环境知识相结合,并充分利用连续帧间信息,达到实时性的要求。实验结果表明,该方法简便且有效,能适应各种不同的结构化道路,具有一定的鲁棒性。
关键词 结构化道路 白线 直方图 边缘 帧间信息
下载PDF
基于深度学习的视频修复方法综述
2
作者 陈婧 王恺星 +2 位作者 左雨亭 林琦 曾焕强 《信号处理》 CSCD 北大核心 2024年第6期1171-1184,共14页
视频作为常见的媒体信息之一,目前已在各个领域得到广泛应用。尤其是以抖音等为代表的短视频软件的兴起,使得与视频相关的技术不断迭代更新。其中,视频修复技术是视频处理研究中的一个热点。视频修复技术是利用视频帧内的像素信息和帧... 视频作为常见的媒体信息之一,目前已在各个领域得到广泛应用。尤其是以抖音等为代表的短视频软件的兴起,使得与视频相关的技术不断迭代更新。其中,视频修复技术是视频处理研究中的一个热点。视频修复技术是利用视频帧内的像素信息和帧间的时域参考信息对视频帧受损的区域进行内容推理并修复,在补全缺损视频、物体移除及视频伪造检测等场景中具有广泛应用前景。该技术可追溯到二十世纪末的老电影修复技术,该任务通常由专业的技术团队逐帧修复完成。而随着数字技术的发展,近年来已有一些人工智能技术用于视频修复,让老电影重获新生。目前,视频修复技术可分为传统方法和基于深度学习的两类方法。其中,传统方法由于缺少对高层语义信息的理解,在场景复杂、缺失区域较大的情况下修复效果不佳;而基于深度学习的方法随着算法框架的优化和图形处理器性能的提升展现了出色的效果,对修复结果的语义结构准确性和时间一致性都有明显的提升。本文在简要回顾传统视频修复方法的基础上,重点分析四类基于深度学习视频修复方法的网络结构、参数模型、性能表现与优缺点;介绍视频修复领域中常用的数据集和评价指标;最后,对视频修复领域现存的问题进行总结并展望未来可能的研究方向。 展开更多
关键词 视频修复 视频缺损 深度学习 帧间信息 评价指标
下载PDF
减小H.264帧间漂移失真的鲁棒性视频隐写算法 被引量:2
3
作者 王林 段宁璐 《计算机系统应用》 2018年第6期140-145,共6页
针对H.264/AVC(Advanced Video Coding)视频信息隐藏过程中产生的不可感知性、嵌入容量、鲁棒性三方面不平衡的问题,提出一种通过选取不同优先级顺序的DCT(Discrete Cosine Transform)系数集合实现嵌入,进而减少帧间漂移失真的信息隐藏... 针对H.264/AVC(Advanced Video Coding)视频信息隐藏过程中产生的不可感知性、嵌入容量、鲁棒性三方面不平衡的问题,提出一种通过选取不同优先级顺序的DCT(Discrete Cosine Transform)系数集合实现嵌入,进而减少帧间漂移失真的信息隐藏算法.首先对秘密信息M进行卷积编码,得到编码后的信息,以此提高视频的鲁棒性;然后通过分析帧间漂移失真产生的原因,计算出不同DCT系数优先级顺序的分类集合,优先在失真小的系数集合中嵌入数据从而减小帧间漂移失真;最后根据预先定义的嵌入规则,将嵌入在所选择4×4亮度块的DCT系数集合中,提高嵌入容量.最终在解码端能够正确提取秘密信息同时恢复原始信息.实验结果表明,本文提出的算法能在很好的保证视频质量的前提下,增加视频的嵌入容量,提高鲁棒性. 展开更多
关键词 帧间预测 漂移失真 鲁棒性 信息隐藏 H.264/AVC
下载PDF
基于深度学习的视频超分辨率重构进展综述 被引量:2
4
作者 冷佳旭 王佳 +2 位作者 莫梦竟成 陈泰岳 高新波 《计算机科学》 CSCD 北大核心 2022年第2期123-133,共11页
视频超分辨率是根据给定的低分辨率视频序列恢复其对应的高分辨率视频帧的过程。近年来,VSR在深度学习的驱动下取得了重大突破。为了进一步促进VSR的发展,文中对基于深度学习的VSR算法进行了归类、分析和比较。首先,根据网络结构将现有... 视频超分辨率是根据给定的低分辨率视频序列恢复其对应的高分辨率视频帧的过程。近年来,VSR在深度学习的驱动下取得了重大突破。为了进一步促进VSR的发展,文中对基于深度学习的VSR算法进行了归类、分析和比较。首先,根据网络结构将现有方法分为两大类,即基于迭代网络的VSR和基于递归网络的VSR,并对比分析了不同网络模型的优缺点。然后,全面介绍了VSR数据集,并在一些常用的公共数据集上对已有算法进行了总结和比较。最后,对VSR算法中的关键问题进行了分析,并对其应用前景进行了展望。 展开更多
关键词 视频超分辨率 深度学习 卷积神经网络 帧间信息
下载PDF
基于运动信息分布的帧间预测模式选择算法 被引量:2
5
作者 王英坤 徐伯庆 杨华 《计算机工程》 CAS CSCD 北大核心 2011年第17期250-251,255,共3页
多模式预测可以提高H.264标准的编码效率和率失真性能,但会增加编码复杂度。针对上述情况,分析多预测模式帧间预测的复杂度,提出一种基于运动信息分布的帧间预测模式选择算法,以宏块中全零子块的分布情况、各子块的绝对误差和及运动向... 多模式预测可以提高H.264标准的编码效率和率失真性能,但会增加编码复杂度。针对上述情况,分析多预测模式帧间预测的复杂度,提出一种基于运动信息分布的帧间预测模式选择算法,以宏块中全零子块的分布情况、各子块的绝对误差和及运动向量的大小作为缩小待选模式集的判据,从而提高编码速度。实验结果表明,该算法的编码质量与全搜索算法相当,编码速度提高了37%~93%。 展开更多
关键词 视频编码 模式选择 帧间预测 运动信息 率失真性能
下载PDF
改进的神经干细胞序列图像分割方法
6
作者 汤春明 段华 崔颖 《计算机仿真》 CSCD 2008年第8期205-209,共5页
为了准确分割神经干细胞显微图像,尤其是成簇的正在分裂的细胞以获得神经干细胞分裂谱系,提出了一种改进的分割方法。在利用Otsu阈值法和简单快速的区域吞没法获取二值图像后,利用形态学迭代算法分割成簇的细胞。在二值图像中对每个成... 为了准确分割神经干细胞显微图像,尤其是成簇的正在分裂的细胞以获得神经干细胞分裂谱系,提出了一种改进的分割方法。在利用Otsu阈值法和简单快速的区域吞没法获取二值图像后,利用形态学迭代算法分割成簇的细胞。在二值图像中对每个成分进行特征提取和分析,噪声、欠分割和过分割的细胞以及成簇的细胞分别被提取出来进行处理。利用对起始帧的人机交互式修正及帧间信息可以提高分割正确率。统计结果表明,改进后的方法相比于传统的阈值结合分水岭的方法不论在节省时间还是正确率方面都有所提高,特别是针对成簇细胞和正在分裂的细胞效果尤为显著。 展开更多
关键词 分割 迭代形态学算法 成簇细胞 帧间信息
下载PDF
低可见度环境下基于改进YOLOv3的井下人员定位方法
7
作者 路晓亚 李海芳 《工矿自动化》 CSCD 北大核心 2024年第9期130-137,共8页
煤矿井下光照不足、粉尘遮挡,井下视频监控系统采集的人员目标在二维图像中表现为小目标或低可见度目标时,原始YOLOv3网络的Darknet53特征金字塔结构无法充分提取和保留目标的细节信息,导致定位结果不准确。针对上述问题,提出了一种低... 煤矿井下光照不足、粉尘遮挡,井下视频监控系统采集的人员目标在二维图像中表现为小目标或低可见度目标时,原始YOLOv3网络的Darknet53特征金字塔结构无法充分提取和保留目标的细节信息,导致定位结果不准确。针对上述问题,提出了一种低可见度环境下基于改进YOLOv3的井下人员定位方法。首先,结合β函数映射和帧间信息增强技术,提升低可见度环境下煤矿井下监控视频的清晰度。然后,采用更轻量级的Darknet-19替代YOLOv3中的Darknet53,并引入CIoU作为损失函数,利用改进YOLOv3识别增强后视频中的井下人员目标。最后,基于映射模型将识别到的目标从二维空间投影至三维空间,结合三维定位结果完成井下人员定位。选用某煤矿一段低可见度环境下井下监控视频进行实验,结果表明:①经过基于改进YOLOv3的井下人员定位方法处理后的视频帧亮度、可见度和各项评价指标(平均灰度、平均对比度、信息熵与灰度谱带宽)较原始视频均有明显提升,整体光照条件得到显著改善,且处理后的视频帧对比度得到增强,目标和背景之间更易区分,证明了采用的图像增强技术的有效性。②改进YOLOv3模型能准确识别视频帧中的井下工作人员,不存在漏识别问题。③采用已知位置的标定物或人工标注的的真实三维位置作为基准,计算投影结果与真实位置之间的偏差(偏差计算涵盖X,Y,Z方向上的距离偏差),其中X方向和Y方向上的偏差均小于0.2 m,Z方向上的偏差小于0.002 m,表明构建的映射模型的映射效果好且定位精度较高。 展开更多
关键词 低可见度环境 井下人员定位 改进YOLOv3 三维空间定位 β函数映射 帧间信息增强 映射模型
下载PDF
基于网络流跟踪的信号灯检测方法
8
作者 武悦 陈海华 于乔烽 《计算机应用研究》 CSCD 北大核心 2024年第2期609-615,622,共8页
结合信号灯信息对机动车行进速度进行引导,减少机动车启停次数,可有效减少废气排放,缓解其造成的污染问题。针对信号灯转换时刻的获取问题,提出了一种基于网络流跟踪的信号灯检测方法。首先,该方法在数据集中引入辅助信号灯类别进行训练... 结合信号灯信息对机动车行进速度进行引导,减少机动车启停次数,可有效减少废气排放,缓解其造成的污染问题。针对信号灯转换时刻的获取问题,提出了一种基于网络流跟踪的信号灯检测方法。首先,该方法在数据集中引入辅助信号灯类别进行训练,将视频序列中该类目标检测结果关联为踪片,并通过踪片建模多目标跟踪任务。其次,该方法将多目标跟踪任务转换为最小费用流优化任务,以踪片作为节点建立最小费用流网络,提出了适合于信号灯的费用构建方式,通过最短路径算法求解,得到视频序列中辅助信号灯的多条轨迹。最后,基于求解的轨迹结果和图像分类技术,实现信号灯检测性能的提升。该方法的跟踪性能相较于对比算法有大幅提升,并将小目标信号灯检测响应的mAP提升至94.35%。实验结果表明,基于网络流的建模方式能极大地提升信号灯的跟踪准确率,结合跟踪轨迹还能大幅提高视频序列中小目标信号灯的检测准确率,并可有效确定信号灯状态的转换时刻。 展开更多
关键词 信号灯检测 帧间信息联合 多目标跟踪 费用流网络
下载PDF
一种引入帧间相关信息的HMM语音识别方法 被引量:2
9
作者 赵力 邹采荣 吴镇扬 《电子与信息学报》 EI CSCD 北大核心 2001年第4期327-331,共5页
该文提出了一种基于复数帧段输入HMM的语音识别方法,它采用相继的复数帧组成的特征参数向量作为语音识别HMM的输入,能有效地在语音识别HMM中引入帧间相关信息。为了进一步改善复数帧段输入HMM的输出概率分布函数,作者还提出了用MGDF和RB... 该文提出了一种基于复数帧段输入HMM的语音识别方法,它采用相继的复数帧组成的特征参数向量作为语音识别HMM的输入,能有效地在语音识别HMM中引入帧间相关信息。为了进一步改善复数帧段输入HMM的输出概率分布函数,作者还提出了用MGDF和RBF函数作为复数帧段输入HMM的输出概率分布函数的方法。通过对非特定人汉语孤立数字和连续数字语音识别试验,证实了该文提出的引入帧间相关信息方法的有效性。 展开更多
关键词 语音识别 隐马尔可夫模型 帧间相关信息 复数帧段输入
下载PDF
局部熵差图像帧间动态位移信息并行滤波 被引量:2
10
作者 黄伟建 王月兴 黄远 《计算机仿真》 北大核心 2020年第7期296-300,共5页
针对当前滤波方法存在滤波后图像视觉效果不佳,信噪比和保真度不高等问题,提出了基于局部熵差的图像帧间动态位移信息并行滤波方法。在运动目标图像粗分割基础上,将运动区域和非运动区域分离,并采用背景差分法对分离出来的运动区域做进... 针对当前滤波方法存在滤波后图像视觉效果不佳,信噪比和保真度不高等问题,提出了基于局部熵差的图像帧间动态位移信息并行滤波方法。在运动目标图像粗分割基础上,将运动区域和非运动区域分离,并采用背景差分法对分离出来的运动区域做进一步分割,实现背景图像中的运动目标检测。为了提高后续目标跟踪和检测准确率,在HSV颜色空间检测运动目标区域的阴影部分。在此基础上,将图像帧的熵值作为运动目标的一个全局特性,每个类别的中心帧被选取为运动目标区域一个镜头的关键帧,将提取获得的关键帧中的一个与其它剩余关键帧做比较,利用局部熵差法计算图像帧熵值标准偏离度,消除冗余帧影响,实现图像帧间动态位移信息并行滤波。仿真结果表明,提出方法滤波后图像信噪比高、保真度高,且具有较好的并行性能。 展开更多
关键词 局部熵差 图像 帧间动态位移信息 并行滤波
下载PDF
引入视觉感知的视频镜头分割 被引量:1
11
作者 高尹 刘颖 +1 位作者 来毅 刘陆 《现代电子技术》 北大核心 2019年第18期73-76,共4页
视频的大数据时代已经到来,将视频序列分割成镜头来进行视频内容分析和视频检索是十分重要的研究方向.文中提出一种基于帧间一致(Frame Consistency,FC)模型和光流特征的视频镜头分割技术.利用基于视觉感知的"整体到局部"的思... 视频的大数据时代已经到来,将视频序列分割成镜头来进行视频内容分析和视频检索是十分重要的研究方向.文中提出一种基于帧间一致(Frame Consistency,FC)模型和光流特征的视频镜头分割技术.利用基于视觉感知的"整体到局部"的思想,首先浏览视频,除去视频的冗余信息,以降低计算成本,并通过提取视频的视觉特征构建帧间一致性函数,以此创建可能的镜头分割集合,并结合运动特征进一步优化分割结果.该技术在评估上,其精确度、召回率和F1值,都呈现出较好的效果. 展开更多
关键词 镜头分割 视觉感知 帧间一致模型 光流特征 模型评估 冗余信息去除
下载PDF
轻量级双路卷积神经网络与帧间信息推理的人体姿态估计 被引量:1
12
作者 陈昱昆 汪正祥 于莲芝 《小型微型计算机系统》 CSCD 北大核心 2020年第10期2219-2224,共6页
为了提高视频中人体姿态估计检测效果,在保留结构化信息的同时弥补下采样导致的空间分辨率的损失,增加视频中检测效率,本文结合时序信息提出了一种轻量级双路神经网络帧间信息推理的视频人体姿态估计方法.首先,基于最新的人体关键点检... 为了提高视频中人体姿态估计检测效果,在保留结构化信息的同时弥补下采样导致的空间分辨率的损失,增加视频中检测效率,本文结合时序信息提出了一种轻量级双路神经网络帧间信息推理的视频人体姿态估计方法.首先,基于最新的人体关键点检测网络训练一个基于该方法两路融合全卷积网络,一路选用金字塔全卷积网络,并选用采用轻量级Inverted residuals作为网络模块,另外一路保持分辨率大小不变以减少空间分辨率的损失,然后提出了一种利用帧间关键点信息建立时序模型,从而推理预测帧的关键点信息.本文在PoseTrack数据集中与最新的方法进行比较,关键点检测mAP提高1.3%,速度提升20%,关键点跟踪MOT提高2.8%,经过实验验证,本文算法可以保留结构化信息的同时有效弥补空间分辨率的损失并提高检测精度,同时提高了视频检测中的速度. 展开更多
关键词 姿态估计 关键点检测 关键点跟踪 双路全卷积网络 轻量级 帧间信息
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部