-
题名基于语义分类的比较句识别与比较要素抽取研究
被引量:9
- 1
-
-
作者
周红照
侯明午
侯敏
滕永林
-
机构
中国传媒大学国家语言资源监测与研究有声媒体中心
-
出处
《中文信息学报》
CSCD
北大核心
2014年第3期136-141,149,共7页
-
基金
国家语委十二五规划重点项目(ZDI125-3)
-
文摘
比较是人们常用的评估不同事物优劣、异同的表达方式,利用机器识别比较句并进一步抽取比较要素是语言信息处理领域一项新颖又有实用价值的课题。该文依据比较句与比较要素之间是一种"你中有我,我中有你"的共生关系,将比较句识别与比较要素抽取两个任务合二为一完成;根据词意分类,构建由领域词典、情感词典、标记词典、普通词典构成的词典系统;根据汉语比较句句义分类,构建比较句识别与比较要素抽取规则库。以第四届中文倾向性评测(COAE2012)发布的测试语料为实验对象,该系统取得了较好的实验(评测)结果。
-
关键词
语义分类
词典与规则
比较句识别
比较要素抽取
-
Keywords
semantic classification
lexicons and rules
comparative sentences identification
comparative elementsextraction
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于文本特征的短文本倾向性分析研究
被引量:7
- 2
-
-
作者
程南昌
侯敏
滕永林
-
机构
中国科学院自动化研究所模式识别国家重点实验室
中国传媒大学国家语言资源监测与研究中心有声媒体语言中心
-
出处
《中文信息学报》
CSCD
北大核心
2015年第2期163-169,共7页
-
基金
国家语委十二五规划重点项目(ZDI125-3)
-
文摘
语篇倾向性分析是倾向性分析的较高层次领域。根据文本篇幅和结构可以将语篇分为短文本和长文本。该文以网络商品评论作为样本研究短文本倾向性分析的特点和策略。根据倾向极性在文中的决定性因素的不同表现,短文本可以分为含显性归总句、含隐性归总句、含特征词以及一般文本四类,针对不同类别文本采用不同的处理策略。在此基础上,运用词典、规则的方法构建了语篇倾向性分析系统CUCsas,该方法在第四届中文倾向性分析评测(COAE2012)中取得了较好成绩。
-
关键词
短文本
文本特征
归总句
倾向性分析
词典与规则
-
Keywords
short text
textual characteristics
summary sentencer attitude analysis
dictionary and rules
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-