-
题名汉语委婉语语言资源建设
被引量:1
- 1
-
-
作者
张辰麟
王明文
谭亦鸣
肖文艳
-
机构
江西师范大学计算机信息工程学院
东南大学网络空间安全学院
-
出处
《中文信息学报》
CSCD
北大核心
2020年第8期32-40,共9页
-
基金
国家自然科学基金(61876074)。
-
文摘
委婉语是语言交流中不可或缺的交际手段,委婉语研究一直是语言学界的热门话题之一,但在自然语言处理领域,尚未有委婉语相关研究。该文借助现有纸质词典,基于语料库检索和专家人工判别的方式,初步构建了规模为63000余条语料的汉语委婉语语言资源;并根据自然语言处理的相关任务需求,结合词典释义对委婉语进行分类。该文提出了利用同类委婉语的上下文语境辅助进行标注的方法。经过实验,对简单语义委婉语的语义判别准确率达89.71%,对语义复杂的兼类委婉语的语义判别准确率达74.65%,初步验证了利用计算机辅助人工标注构建委婉语语言资源的可行性。
-
关键词
委婉语
语义辨析
语言资源构建
-
Keywords
euphemism
semantic discrimination
language resource construction
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-