为了提高汉语词义消歧的性能,提出了一种基于滑动语义串匹配(Sliding Match of Semantic String,SMOSS)的汉语词义消歧方法.首先,从标注词义的训练语料中提取N元语义模板,建立N元语义模板库;之后,从待消歧句子中提取N元语义码串与N元语...为了提高汉语词义消歧的性能,提出了一种基于滑动语义串匹配(Sliding Match of Semantic String,SMOSS)的汉语词义消歧方法.首先,从标注词义的训练语料中提取N元语义模板,建立N元语义模板库;之后,从待消歧句子中提取N元语义码串与N元语义模板库中的语义模板匹配,通过计算匹配成功的多个模板的得分来确定歧义词的最终词义.该方法具有好的弹性匹配能力和宽的匹配范围,能够有效减少数据稀疏问题.实验采用了SemEval2007-Task#5中文词义消歧的评测标准,消歧正确率为75.06%,与目前已知的最好系统性能相近.展开更多
文摘为了提高汉语词义消歧的性能,提出了一种基于滑动语义串匹配(Sliding Match of Semantic String,SMOSS)的汉语词义消歧方法.首先,从标注词义的训练语料中提取N元语义模板,建立N元语义模板库;之后,从待消歧句子中提取N元语义码串与N元语义模板库中的语义模板匹配,通过计算匹配成功的多个模板的得分来确定歧义词的最终词义.该方法具有好的弹性匹配能力和宽的匹配范围,能够有效减少数据稀疏问题.实验采用了SemEval2007-Task#5中文词义消歧的评测标准,消歧正确率为75.06%,与目前已知的最好系统性能相近.