期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于多模态共享网络的自监督语音-人脸跨模态关联学习方法
1
作者 李俊屿 卜凡亮 +2 位作者 谭林 周禹辰 毛璟仪 《科学技术与工程》 北大核心 2024年第7期2804-2812,共9页
现有的语音-人脸跨模态关联学习方法在语义关联和监督信息方面仍然面临挑战,尚未充分考虑语音与人脸之间的语义信息交互。为解决这些问题,提出一种基于多模态共享网络的自监督关联学习方法。首先,将语音和人脸模态的特征映射到单位球面... 现有的语音-人脸跨模态关联学习方法在语义关联和监督信息方面仍然面临挑战,尚未充分考虑语音与人脸之间的语义信息交互。为解决这些问题,提出一种基于多模态共享网络的自监督关联学习方法。首先,将语音和人脸模态的特征映射到单位球面,构建一个公共的特征空间;接着,通过多模态共享网络的残差块来挖掘复杂的非线性数据关系,并利用其中权重共享的全连接层来增强语音与人脸特征向量之间的关联性;最后,使用K均值聚类算法生成的伪标签作为监督信号来指导度量学习,从而完成4种跨模态关联学习任务。实验结果表明,本文提出的方法在语音-人脸跨模态验证、匹配和检索任务上均取得了良好的效果,多项评价指标相较于现有基线方法提升1%~4%的准确率。 展开更多
关键词 语音-人脸跨模态 多模态共享网络 伪标签 关联学习
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部