-
题名基于多维语义关系的谐音双关语识别模型
被引量:1
- 1
-
-
作者
徐琳宏
林鸿飞
祁瑞华
杨亮
-
机构
大连外国语大学软件学院
大连理工大学计算机系
-
出处
《中国科学:信息科学》
CSCD
北大核心
2018年第11期1510-1520,共11页
-
基金
国家自然科学基金重点项目(批准号:61632011)
国家自然科学基金(批准号:61772103
+5 种基金
61702080)
国家社会科学基金一般项目(批准号:15BYY028)
辽宁省自然基金(批准号:20170540230
2015020017
20170540232)
辽宁省优秀人才项目(批准号:LJQ2014127)资助
-
文摘
谐音双关语的识别是幽默研究领域的一个重要分支,并逐渐发展为一个新兴的研究领域.本文提出一种基于4个维度特征集的谐音双关语识别模型,其中4个维度包括语义透明度、语义相关度、语音扩展性和语法特征集.语义透明度包括词项统计和语句字符长度两个特征,语法特征集包括人名、大写、时态、词性和位置5个特征.将这4个维度的9个特征加入到二叉判定树中,使用K-Means聚类获取阈值,完成双关语的识别.本文的实验数据来自于SemEval2017任务7的语料,取得了较好的效果, F1值高于参赛队中的第一名,实验证明基于4个维度特征的二叉判定树分类方法在谐音双关语识别中是有效的,并且在多个特征中,语音扩展性和语法特征集的效果比较明显,这也符合谐音双关语识别中语音作用较大的预测.
-
关键词
谐音双关语
情感分析
二叉判定树
语义特征集
聚类
-
Keywords
heterographic pun
sentiment analysis
binary decision tree
semantic feature set
cluster
-
分类号
H315
[语言文字—英语]
-