期刊文献+

一种GIS的中文分词算法研究 被引量:2

Research of Chinese Word Segmentation Algorithms for GIS
下载PDF
导出
摘要 提出了一种应用于GIS领域的中文分词算法.采用将首字和尾种类词用哈希表管理,其余中间字串用Trie树来实现的"首位Hash-Trie树"结构作为词典载体来实现地学词典的高效率存取操作,简化了Trie树的深度,并基于一种改进的正向最大匹配的算法,很好的解决了切分歧义和未登录词的问题.实验结果表明,该算法为GIS中文查询语句的正确理解提供了有效的语义信息. This article proposes a new segmentation algorithm which will be used in the field of GIS. It uses first Hash-Trie tree, two hash table manage the first word and the last word of a geo-item and the reaming words are built on Trie tree whose degree has decreased in that way, as the dictionary and based on an improved MM segmentation algorithm, deal with the ambiguity division and the unregistered words. The experiment indicates that the segmentation method can offer effective semantic information for the field of GIS about the understanding of Chinese query.
出处 《微电子学与计算机》 CSCD 北大核心 2010年第7期173-176,180,共5页 Microelectronics & Computer
关键词 地理信息系统 中文分词 TRIE树 哈希结构 分词词典 GIS Chinese segmentation Trie tree Hash structure dictionary mechanism
  • 相关文献

参考文献5

二级参考文献29

共引文献178

同被引文献9

引证文献2

二级引证文献18

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部