期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
中文合成词识别及分词修正 被引量:4
1
作者 刘兴林 郑启伦 马千里 《计算机应用研究》 CSCD 北大核心 2011年第8期2905-2908,共4页
提出一种中文合成词识别及分词修正方法。该方法先采用词性探测从文本中提取词串,进而由提取到的词串生成词共现有向图,借鉴Bellman-Ford算法思想,设计了运行在词共现有向图中识别合成词的算法,即搜索多源点长度最长、权重值满足给定条... 提出一种中文合成词识别及分词修正方法。该方法先采用词性探测从文本中提取词串,进而由提取到的词串生成词共现有向图,借鉴Bellman-Ford算法思想,设计了运行在词共现有向图中识别合成词的算法,即搜索多源点长度最长、权重值满足给定条件的路径,则该路径所对应的词串为合成词。最后,采用核心属性渗透理论对合成词标注词性,同时修正分词结果。实验结果表明,合成词识别正确率达到了91.60%,且分词修正效果良好。 展开更多
关键词 合成词 词共现有向图 词性标注 分词修正 自然语言处理
下载PDF
基于词共现有向图的中文合成词提取算法 被引量:4
2
作者 刘兴林 郑启伦 马千里 《计算机工程》 CAS CSCD 北大核心 2011年第23期177-180,共4页
分词系统由于未将合成词收录进词典,因此不能识别合成词。针对该问题,提出一种基于词共现有向图的中文合成词提取算法。采用词性探测方法从文本中获取词串,由所获词串生成词共现有向图,并借鉴Bellman-Ford算法思想,从词共现有向图中搜... 分词系统由于未将合成词收录进词典,因此不能识别合成词。针对该问题,提出一种基于词共现有向图的中文合成词提取算法。采用词性探测方法从文本中获取词串,由所获词串生成词共现有向图,并借鉴Bellman-Ford算法思想,从词共现有向图中搜索多源点长度最长且权重值满足给定条件的路径,该路径所对应的词串即为合成词。实验结果显示,该算法的合成词提取正确率达到91.16%。 展开更多
关键词 合成词提取 词性探测 词共现有向图 自然语言处理 Bellman-Ford算法
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部