-
题名面向短文本情感分类的特征拓扑聚合模型
被引量:3
- 1
-
-
作者
胡杨
冯旭鹏
黄青松
付晓东
刘骊
刘利军
-
机构
昆明理工大学信息工程与自动化学院
昆明理工大学教育技术与网络中心
云南省计算机技术应用重点实验室
-
出处
《中文信息学报》
CSCD
北大核心
2016年第5期28-35,共8页
-
基金
国家自然科学基金(81360230
61462056
61462051)
-
文摘
由于短文本极稀疏性和特征分散的特点,短文本的情感分类效果总是不及篇章文本的情感分类,针对此问题,该文提出面向短文本情感分类的特征拓扑聚合模型。模型首先从特征点互信息,情感指向相似度,主题归属差异值三个维度整合计算情感特征的关联度,然后根据特征关联度建立拓扑聚合图模型,通过在图上求解强联通分量聚合高关联度情感特征,从大量未标注语料中提取相似特征对训练集特征进行补充,同时降低训练空间维度。实验将模型应用于短文本情感分类,与基准算法对比能提高分类准确率和召回率分别达0.03和0.027。验证了模型在缓解短文本极稀疏性和特征分散问题上的效果。
-
关键词
短文本
情感分类
特征关联度
强联通分量
拓扑聚合
-
Keywords
short-text
sentiment classification
features correlation
strongly connected components
topological polymerization
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-