-
题名基于多文本特征融合的中文微博的立场检测
被引量:24
- 1
-
-
作者
奠雨洁
金琴
吴慧敏
-
机构
中国人民大学信息学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2017年第21期77-84,共8页
-
基金
国家重点研发计划项目(No.2016YFB1001202)
-
文摘
微博立场检测是判断微博作者对某一个话题的态度是支持、反对或中立。在基于监督学习的分类框架上,扩展并提出基于多文本特征融合的中文微博的立场检测方法。首先探究了基于词频统计的特征(词袋特征(Bag-ofWords,Bo W)、基于同义词典的词袋特征、考虑词与立场标签共现关系的特征)和文本深度特征(词向量、字向量)。之后使用支持向量机,随机森林和梯度提升决策树对上述特征进行立场分类。最后,结合所有特征分类器进行后期融合。实验表明,文中提出的特征对于不同话题下的微博立场检测的结果都有提升,且文本深度特征和基于词频统计的特征能够捕捉到文本的不同信息,在立场检测中是互补的。基于本文方法的微博立场检测系统在2016年自然语言处理与中文计算会议(NLPCC2016)的中文微博立场检测评测任务中取得了最好的结果。
-
关键词
立场检测
情感分析
文本特征表示
微博
文本分类
-
Keywords
stance detection
sentiment analysis
text feature representations
Chinese Microblogs
text classification
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名视听相关的多模态概念检测
被引量:1
- 2
-
-
作者
奠雨洁
金琴
-
机构
中国人民大学信息学院
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2019年第5期1071-1081,共11页
-
基金
国家自然科学基金项目(61772535)
国家重点研发计划基金项目(2016YFB1001202)~~
-
文摘
随着在线视频应用的流行,互联网上的视频数量快速增长.面对互联网上海量的视频,人们对视频检索的要求也越来越精细化.如何按照合适的语义概念对视频进行组织和管理,从而帮助用户更高效、更准确地获取所需视频,成为亟待解决的问题.在大量的应用场景下,需要声音和视觉同时出现才能确定某个视频事件.因此,提出具有视听信息的多模态概念的检测工作.首先,以名词-动词二元组的形式定义多模态概念,其中名词表达了视觉信息,动词表达了听觉信息,且名词和动词具有语义相关性,共同表达语义概念所描述的事件.其次,利用卷积神经网络,以多模态概念的视听相关性为目标训练多模态联合网络,进行端到端的多模态概念检测.实验表明:在多模态概念检测任务上,通过视听相关的联合网络的性能超过了单独的视觉网络和听觉网络.同时,联合网络能够学习到精细化的特征表示,利用该网络提取的视觉特征,在Huawei视频数据集某些特定的类别上超过ImageNet预训练的神经网络特征;联合网络提取的音频特征,在ESC50数据集上,也超过在Youtube8m上训练的神经网络音频特征约5.7%.
-
关键词
多模态信息
语义概念
视频概念检测
视频特征
视频语义理解
-
Keywords
multimodal information
semantic concepts
video concept detection
video representation
video semantic understanding
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-