-
题名小波-神经网络在视频文本自动检测中的应用
被引量:1
- 1
-
-
作者
李朝晖
余英林
张为
邹艳碧
-
机构
广州大学信息与机电学院
华南理工大学电信学院电子和通信工程系
-
出处
《广州大学学报(综合版)》
2001年第5期36-39,共4页
-
文摘
数字视频数据中的文本能提供重要的语义信息,用具有良好时频局部特性和变尺度特性的小波分析方法,提取图像中的尺度一空域特征,经神经网络分类器进行分类后,自动检测视频数据中的文本信息,为基于内容的视频检索提供索引.实验表明该检测方法效果良好。
-
关键词
文本检测
语义内容
视频索引
神经网络
小波分析
多媒体数据库检索
尺度-空域特征
-
Keywords
text detection
semantic content
video index
neural network
wavelet analysis
-
分类号
TP37
[自动化与计算机技术—计算机系统结构]
-
-
题名多尺度时空特征聚合的全参考视频质量评价
- 2
-
-
作者
张威
赵世灵
刘银豪
王鸿奎
殷海兵
-
机构
杭州电子科技大学通信工程学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2023年第18期154-162,共9页
-
基金
浙江省尖兵研发攻关计划项目(2022C01068)。
-
文摘
视频质量得分是观测者在多个时间尺度下对视频进行感知的结果,而当前质量评价模型普遍在某个固定尺度下对失真进行描述,单一粒度的特征对全局信息表征并不充足。为充分提取并聚合多粒度信息来刻画人类复杂的感知机制,提出一种基于多尺度时空特征聚合的全参考视频质量评价方法。为解决传统质量评价算法中固定间隔采样丢失关键帧的痛点,通过结合图像结构失真度与感知运动能量对序列自适应采样;为提取不同粒度特征对失真进行表征,并探究聚合多粒度特征的有效方式,利用堆叠的长短时记忆层对序列进行特征提取,模拟视觉神经的正反向感知迭代机制,对网络层特征融合;结合多通道自注意力网络回归预测得分。模型在多个数据集中的SRCC指标均达到0.93以上,取得最优或次优的性能。
-
关键词
视频质量评价
自适应采样
视觉神经感知
特征金字塔
多尺度时空域特征
长短时记忆网络
-
Keywords
video quality assessment
adaptive sampling
visual neural perception
feature pyramid
multi-scale spatio-temporal feature
long short-term memory network
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-