-
题名一种快速、鲁棒的唇动检测与定位方法
被引量:9
- 1
-
-
作者
王瑞
高文
马继涌
-
机构
哈尔滨工业大学计算机科学与工程系
中国科学院计算技术研究所
-
出处
《计算机学报》
EI
CSCD
北大核心
2001年第8期866-871,共6页
-
基金
国家自然科学基金 (6 978930 1)
中国科学院百人工程
国家"八六三"高技术研究发展计划"多功能感知机"项目基金资助
-
文摘
提出了一种利用唇色在彩色空间分布信息和唇在人脸区域的几何分布特性进行快速、鲁棒的唇动检测与定位的方法 .在该方法中 ,首先提出采用有约束的 Fisher变换进行嘴唇图像增强 ;然后利用嘴唇在人脸区域的几何分布特性 ,来提高唇动定位的速度和准确性 ,唇动定位主要利用两种几何分布特性 :(1)利用唇的区域面积和人脸的区域面积比值变化范围不大这一特性自适应确定区分唇色和肤色的阈值 .(2 )利用外唇参数与内唇参数之间有近似线性关系的假设 ,用外唇参数预测内唇参数 ,克服内唇定位经常陷于局部最小、定位不准的缺陷 .实验证明 ,该唇动检测与定位系统无论从速度还是从可靠性、准确性都能满足应用的要求 .
-
关键词
FISHER变换
多元线性回归分析
唇动检测
图像增强
定位
计算机
-
Keywords
Fisher transform, multivariate regression, lip detecting and locating
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-
-
题名基于图像信息的话者识别
被引量:2
- 2
-
-
作者
刘培培
杨祥来
-
机构
山东科技大学计算机科学与工程学院
中国科学院计算技术研究所
国家电网国网技术学院
-
出处
《中国科技论文》
CAS
北大核心
2018年第20期2388-2393,共6页
-
文摘
提出了一种使用图像信息进行话者识别的方案,建立了一个共计916个样本、每个样本包含连续20帧图片的实验数据集。将基于图像信息的话者识别分为借助人脸识别技术找出人脸的嘴唇部分并执行唇动检测和对被检测出唇动的人脸进行人脸识别2个阶段。唇动检测模型通过2种方法获得:计算样本中每帧图片的人脸上下嘴唇间距与鼻部宽度的比例,并将该比例作为该帧图像的特征,基于总体样本特征使用支持向量机进行模型训练;对人脸的嘴唇部分进行裁剪,使用卷积神经网络对裁剪后的嘴唇图片提取特征,并将特征作为长短时记忆网络的输入进行模型的训练。实验结果表明,基于图像信息的话者识别能够达到较高的准确率。
-
关键词
人脸识别
话者识别
唇动检测
支持向量机
卷积神经网络
长短时记忆网络
-
Keywords
face recognition
speaker recognition
lip movement detection
support vector machine(SVM)
convolutional neural network(CNN)
long and short time memory network(LSTM)
-
分类号
TP37
[自动化与计算机技术—计算机系统结构]
-