-
题名采用无标注语料的动词和形容词主观性评级
- 1
-
-
作者
徐戈
蒙新泛
王厚峰
-
机构
北京大学计算语言学研究所
计算语言学教育部重点实验室(北京大学)
闽江学院计算机科学系
-
出处
《软件学报》
EI
CSCD
北大核心
2013年第5期1036-1050,共15页
-
基金
国家自然科学基金(91024009)
国家高技术研究发展计划(863)(2012AA011101)
国家社会科学基金(12&ZD227)
-
文摘
为了自动区分中文主观词和客观词,采用主观性线索和汉字的主观性两种手段对动词和形容词进行主观性度量.主观性的线索进一步被分成级差(gradability)线索和主体(subject)线索;根据这些线索,使用基于图的算法进行评级(ranking).在汉语主观性词表构建中,提出使用主体线索和汉字主观性.5个标注人员对随机选择的500个单词进行主观性标注,据此构建主客观标准集,并将其用于各种设置下的实验结果评估.实验结果显示,当被标注的单词出现频率较高时,所提出的方法能够超过或者匹配人工标注.此外,尽管文中只使用了无标注的数据,但还有更多的先验知识(如语义词典等)可以被引入到该方法中.
-
关键词
主观性
无标注语料
级差线索
主体线索
评级
汉字主观性
-
Keywords
subjectivity
unlabeled corpus
gradability clue
subject clue
ranking
subjectivity of Chinese characters
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-