基于多模态融合的视频情感分析技术被引量：1

Video Sentiment Analysis Technology based on Multimodal Fusion

下载PDF

导出

摘要介绍一种视频多模态情感识别方法。一个视频通常通过文本、声音和视觉图像等多模态信息来表达同一种情感主题,而如何将同一个视频中不同异构数据之间的信息融合并最大程度地利用是目前需要重点攻克的难题。通过互信息最大化的方法,高效融合视频中的文本、声音与视觉图像等多模态异构数据,尽可能多地消除模态之间的差异,最终实现对视频的情感进行识别分析。在公开的MOSEI多模态数据集上进行实验,实验结果显示MAE值达55.4。相比之前的一些模型,本模型效果更优,且实验模型构造不繁琐,为后面相关的研究打下良好的基础。 A method for multimodal sentiment recognition in video is introduced in this paper.A video usually expresses the same sentiment theme through multimodal information such as text,sound,and visual images,andfusingthe information between different modalities and make full use of them is the current key problems that need to be overcome.This paper uses the method of maximizing mutual information to efficiently fuse multimodal heterogeneous data such as text,sound and visual images in videos to eliminate as many differences between modalities as possible,and finally realize the recognition and analysis of video sentiment.Experiments are carried out on the public MOSEI multimodal dataset,and the results show that the MAE value reaches 55.4.Compared with conventional models,the effect of this model is better,and the construction of the experimental model is not cumbersome,which can provide reference for related research.

作者陈诗汉马洪江王婷何松泽 CHEN Shihan;MA Hongjiang;WANG Ting;HE Songze(College of Computer,Chengdu University of Information Technology,Chengdu 610200,China)

机构地区成都信息工程大学计算机学院

出处《成都信息工程大学学报》 2022年第6期656-661,共6页 Journal of Chengdu University of Information Technology

基金四川省科技厅重点研发资助项目(2021YFG0031、2022YFG0375) 四川省科技服务业示范资助项目(2021GFW130)

关键词多模态融合视频情感分析互信息最大化 multimodal fusion video sentiment analysis mutual information maximization

分类号 TP391.41 [自动化与计算机技术—计算机应用技术] TP391.1 [自动化与计算机技术—计算机科学与技术] TN912.3 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献8

1奚晨..基于表情、语音和文本的多模态情感分析[D].南京邮电大学,2021:
2王蝶..基于注意力机制的多模态融合技术研究[D].南京师范大学,2021:
3冯亚琴,沈凌洁,胡婷婷,王蔚.利用语音与文本特征融合改善语音情感识别[J].数据采集与处理,2019,34(4):625-631. 被引量：3
4秦放,曾维佳,罗佳伟,徐鹏.基于深度学习的多模态融合图像识别研究[J].信息技术,2022,46(4):29-34. 被引量：11
5牟智佳,符雅茹.多模态学习分析研究综述[J].现代教育技术,2021,31(6):23-31. 被引量：18
6薛其威,伍锡如.基于多模态特征融合的无人驾驶系统车辆检测[J].广西师范大学学报（自然科学版）,2022,40(2):37-48. 被引量：7
7颜增显,孔超,欧卫华.基于多模态融合的人脸反欺骗算法研究[J].计算机技术与发展,2022,32(4):63-68. 被引量：2
8黄欢,孙力娟,曹莹,郭剑,任恒毅.基于注意力的短视频多模态情感分析[J].图学学报,2021,42(1):8-14. 被引量：9

二级参考文献25

1郑少武,李巍华,胡坚耀.基于激光点云与图像信息融合的交通环境车辆检测[J].仪器仪表学报,2019,40(12):143-151. 被引量：39
2王楠,刘威,陈雪,袁淮,刘积仁.基于多线索混合的交通标志检测与跟踪[J].控制与决策,2010,25(8):1277-1280. 被引量：3
3韩文静,李海峰,阮华斌,马琳.语音情感识别研究进展综述[J].软件学报,2014,25(1):37-50. 被引量：167
4吴毅华,梁华为,王智灵,梅涛,辛煜,黄如林.基于激光雷达回波信号的自适应阈值车道线检测[J].机器人,2015,37(4):451-458. 被引量：10
5金琴,陈师哲,李锡荣,杨刚,许洁萍.基于声学特征的语言情感识别[J].计算机科学,2015,42(9):24-28. 被引量：9
6李华,屈丹,张文林,王炳锡,梁玉龙.结合全局词向量特征的循环神经网络语言模型[J].信号处理,2016,32(6):715-723. 被引量：10
7王肖,李克强,王建强,徐友春.基于三维激光雷达的智能车辆目标参数辨识[J].汽车工程,2016,38(9):1146-1152. 被引量：17
8陈鹏展,张欣,徐芳萍.基于语音信号与文本信息的双模态情感识别[J].华东交通大学学报,2017,34(2):100-104. 被引量：8
9皇甫璐雯,毛文吉.一种基于OCC模型的文本情感挖掘方法[J].智能系统学报,2017,12(5):645-652. 被引量：1
10李明磊,李广云,王力,宗文鹏.采用八叉树体素生长的点云平面提取[J].光学精密工程,2018,26(1):172-183. 被引量：16

共引文献43

1张兴旺,郝彦娜,王璐.面向听障用户的数字图书馆信息无障碍智能交互技术研究述评[J].图书馆学研究,2020(21):2-12. 被引量：6
2蒋雨肖,丁晟春,吴鹏.基于BiLSTM-VGG16的多模态信息特征分类研究[J].情报理论与实践,2021,44(11):180-186. 被引量：12
3陆吉健,周美美,张霞,何晚晴,张明敏.基于MR实验的“多模态+人机协同”教学及应用探索[J].远程教育杂志,2021,39(6):58-66. 被引量：20
4刘丰源,张香兰,张夫伟,孔玺.人工智能时代的知识教学:误用后果、归因与破局[J].中国电化教育,2022(3):69-74. 被引量：5
5何婷,郭力平,吕雪.空间定位技术应用于学习分析的现状与展望[J].远程教育杂志,2022,40(2):54-65. 被引量：1
6蒋艳双,崔璨,逯行,祁彬斌,包昊罡.双师课堂中的多模态学习情感分析:关键问题、逻辑理路与实施路线[J].现代教育技术,2022,32(4):13-20. 被引量：7
7炕留一,叶海智,张瑾,朱珂.基于多维数据的课堂教学行为评价研究[J].现代教育技术,2022,32(4):68-77. 被引量：20
8李瑞航,吴红兰,孙有朝,吴华聪.基于深度残差收缩网络多特征融合语音情感识别[J].数据采集与处理,2022,37(3):542-554. 被引量：2
9明志勇,杨顺吉.图像识别技术在变电站智能巡检中的应用综述[J].农村电气化,2022(7):40-45. 被引量：6
10刘哲雨,周继慧,周加仙.教育神经科学视角下促进心流体验的智慧教学活动设计[J].现代教育技术,2022,32(7):14-21. 被引量：13

同被引文献4

1程大雷,张代玮,陈雅茜.多模态情感识别综述[J].西南民族大学学报（自然科学版）,2022,48(4):440-447. 被引量：5
2顾煜,金赟,马勇,姜芳艽,俞佳佳.基于声学和文本特征的多模态情感识别[J].数据采集与处理,2022,37(6):1353-1362. 被引量：2
3王靖豪,刘箴,刘婷婷,王媛怡,柴艳杰.基于多层次特征融合注意力网络的多模态情感分析[J].中文信息学报,2022,36(10):145-154. 被引量：7
4魏嵬,孙雪松,李林峰,张云翔.基于文本的情感分析方法论述[J].数字技术与应用,2022,40(12):1-3. 被引量：5

引证文献1

1曹颖.基于跨模态Transformer的多模态细粒度情感分析方法[J].信息与电脑,2023,35(6):4-6.

1常志宏,郭子英,李永建,任朝阳.基于交通大数据的在途车辆安全防控预警系统[J].中国交通信息化,2023(3):129-133. 被引量：3
2姜蕾,孟凡曜.《青春是快乐的》中女性成长叙事的情感主题[J].沈阳师范大学学报（社会科学版）,2023,47(2):63-69.
3赵雪薇,丁宁,孙世豪.数字金融发展促进居民消费升级了吗?--来自中国家庭的微观证据[J].复印报刊资料（贸易经济）,2022(3):39-51.
4路璐,刘怡军,萧国镒.基于食品安全监管的高校智慧食堂管理平台的建设与研究[J].电脑知识与技术,2023,19(6):58-60. 被引量：3
5曾芳萍.初中语文大单元教学的策略探析[J].课堂内外（初中教研）,2022(S02):60-62. 被引量：1
6张建方.初中语文思乡怀人古诗词教学研究[J].中国科技经济新闻数据库教育,2021(1):114-115.
7《李商隐诗选》[J].古典文学知识,2022(4):74-74.
8新书架《李商隐诗选》[J].古典文学知识,2022(2):117-117.
9牛紫珩.全球经济政策不确定性对我国系统性金融风险的影响研究[J].金融,2023,13(2):343-353.
10舒怡.舒伯特艺术歌曲《格雷琴的祷告》音乐情感及演唱分析[J].大众文艺（学术版）,2023(5):92-94.

成都信息工程大学学报

2022年第6期

浏览历史

内容加载中请稍等...

基于多模态融合的视频情感分析技术被引量：1

参考文献8

二级参考文献25

共引文献43

同被引文献4

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于多模态融合的视频情感分析技术 被引量：1

参考文献8

二级参考文献25

共引文献43

同被引文献4

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于多模态融合的视频情感分析技术被引量：1