中文分词歧义识别算法的优化被引量：2

Optimization of Chinese words' ambiguity recognition algorithm

下载PDF

导出

摘要中文分词系统性能的好坏直接影响到后续的工作,而歧义字段的处理更是衡量一个分词系统好坏的重要标志。解决歧义问题前首先就要找到歧义字段,本文在之前的增字最大匹配算法基础上,提出了一种结合逐字扫描算法和逆向最大匹配算法的歧义字段识别方法。实验结果表明,这里提出的算法执行效率要比增字最大匹配算法效率高,速度更快。 The performance of Chinese word segmentation system directly influences the subsequent work,in which the ambiguity words should be recognized and processed accurately.The processing effect is a very important sign of measuring a segmentation system.In order to solve the ambiguity problem,the ambiguity words have to be found first.An algorithm combining literal scanning algorithm with reverse maximum matching algorithm is proposed on the basis of increasing maximum matching algorithm.It can be proved that the efficiency of this algorithm is better than the increasing maximum matching algorithm.

作者胡阿明王卫东

机构地区江苏科技大学计算机科学与工程学院

出处《现代电子技术》 2012年第8期107-109,共3页 Modern Electronics Technique

关键词中文分词逆向最大匹配算法歧义识别算法优化 Chinese word segmentation reverse maximum matching algorithm ambiguity recognition algorithm optimization

分类号 TN911-34 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献10

1孙晓,黄德根.基于最长次长匹配分词的一体化中文词法分析[J].大连理工大学学报,2010,50(6):1028-1034. 被引量：3
2罗智勇,宋柔.现代汉语通用分词系统中歧义切分的实用技术[J].计算机研究与发展,2006,43(6):1122-1128. 被引量：19
3李天侠,戴新宇,陈家骏.基于混合模型的交集型歧义消歧策略[J].计算机工程与应用,2008,44(21):5-8. 被引量：2
4谭琼,史忠植.分词中的歧义处理[J].计算机工程与应用,2002,38(11):125-127. 被引量：29
5张彩琴,袁健.改进的正向最大匹配分词算法[J].计算机工程与设计,2010,31(11):2595-2597. 被引量：11
6翟凤文,赫枫龄,左万利.基于统计规则的交集型歧义处理方法[J].吉林大学学报（理学版）,2006,44(2):223-228. 被引量：9
7金在全,赵照,杜秀全,张东.一种改进的增字最大匹配算法[J].科学技术与工程,2007,7(18):4761-4764. 被引量：12
8王思力,王斌.基于双字耦合度的中文分词交叉歧义处理方法[J].中文信息学报,2007,21(5):14-17. 被引量：17
9许高建,胡学钢,路遥,王庆人.一种改进的中文分词歧义消除算法研究[J].合肥工业大学学报（自然科学版）,2008,31(10):1622-1625. 被引量：6
10姚继伟,赵东范.基于短语匹配的中文分词消歧方法[J].吉林大学学报（理学版）,2010,48(3):427-432. 被引量：6

二级参考文献77

1张恒,杨文昭,屈景辉,卢虹冰,张亮,赵飞.基于词典和词频的中文分词方法[J].微计算机信息,2008,24(3):239-240. 被引量：19
2刘春辉,金顺福,刘国华,李颖.基于优化最大匹配与统计结合的汉语分词方法[J].燕山大学学报,2009,33(2):124-129. 被引量：9
3侯敏,孙建军.汉语自动分词中的歧义问题[J].语言文字应用,1996(1):68-72. 被引量：8
4张云秋.汉语短语的分类问题[J].语文研究,1994(4):35-41. 被引量：4
5刘群,张华平,俞鸿魁,程学旗.基于层叠隐马模型的汉语词法分析[J].计算机研究与发展,2004,41(8):1421-1429. 被引量：198
6孙茂松,肖明,邹嘉彦.基于无指导学习策略的无词表条件下的汉语自动分词[J].计算机学报,2004,27(6):736-742. 被引量：37
7李凯,左万利,吕巍.汉语文本中交集型切分歧义的分类处理[J].小型微型计算机系统,2004,25(8):1486-1490. 被引量：3
8孙茂松,邹嘉彦.汉语自动分词研究评述[J].当代语言学,2001,3(1):22-32. 被引量：101
9张长利,赫枫龄,左万利.一种基于后缀数组的无词典分词方法[J].吉林大学学报（理学版）,2004,42(4):548-553. 被引量：14
10刘迁,贾惠波.中文信息处理中自动分词技术的研究与展望[J].计算机工程与应用,2006,42(3):175-177. 被引量：68

共引文献90

1徐吉,朱兰娟.用于网络搜索引擎的中文分词消岐算法[J].微型电脑应用,2011(4):52-54.
2崔岩.脚本测试技术在列控中心开发测试中的运用[J].铁路通信信号工程技术,2013,10(S1):149-153. 被引量：2
3张春霞,郝天永.汉语自动分词的研究现状与困难[J].系统仿真学报,2005,17(1):138-143. 被引量：60
4金立旺.亚齐采访思考断片[J].新闻记者,2005(2):32-32.
5马晓娜,杨承磊.基于面向对象的受限自然语言查询系统的设计与实现[J].计算机工程与应用,2005,41(10):165-168. 被引量：5
6赵成龙,薛欣.基于Web的智能答疑系统的设计与实现[J].计算机工程与科学,2005,27(8):31-34. 被引量：13
7瞿锋,陈纪元.汉语自动分词算法综述[J].福建电脑,2006,22(4):23-25. 被引量：8
8翟凤文,赫枫龄,左万利.基于统计规则的交集型歧义处理方法[J].吉林大学学报（理学版）,2006,44(2):223-228. 被引量：9
9翟凤文,赫枫龄,左万利.字典与统计相结合的中文分词方法[J].小型微型计算机系统,2006,27(9):1766-1771. 被引量：42
10路永刚,赵伟.一种改进的MM分词方法的研究与实现[J].长春工业大学学报,2006,27(4):320-323. 被引量：3

同被引文献20

1郑逢斌,付征叶,乔保军,毋琳.HENU汉语自动分词系统中歧义字段消除算法[J].河南大学学报（自然科学版）,2004,34(4):49-52. 被引量：5
2张培颖,李村合.一种改进的上下文相关的歧义字段切分算法[J].计算机系统应用,2006,15(5):46-48. 被引量：6
3张培颖,李村合.基于知识库的交集型歧义字段切分系统[J].计算机系统应用,2006,15(8):42-43. 被引量：1
4曲维光,吉根林,穗志方,周俊生.基于语境信息的组合型分词歧义消解方法[J].计算机工程,2006,32(17):74-76. 被引量：10
5张利,张立勇,张晓淼,耿铁锁,岳宗阁.基于改进BP网络的中文歧义字段分词方法研究[J].大连理工大学学报,2007,47(1):131-135. 被引量：12
6张严虎,潘璐璐,彭子平,张靖波,于中华.基于规则挖掘和Nave Bayes方法的组合型歧义字段切分[J].计算机应用,2008,28(7):1686-1688. 被引量：5
7岳晓光,梁晓诚,麦范金,赵子强.基于.NET的中文分词系统设计与实现[J].微计算机信息,2010,26(12):215-216. 被引量：7
8奉国和,郑伟.国内中文自动分词技术研究综述[J].图书情报工作,2011,55(2):41-45. 被引量：104
9肖侃,谭长庚,丁玲.基于中文分词的文本相似度动态规划算法[J].现代电子技术,2011,34(8):72-74. 被引量：3
10杨鹤标,陈力.自然语言向SQL代码的转化方法[J].计算机工程,2011,37(23):72-74. 被引量：4

引证文献2

1张昭楠,马亚蕾.基于SQL Server的中文分词系统设计及应用[J].电子设计工程,2016,24(17):39-41. 被引量：2
2杨凡,任丹.基于知识图谱的自然语言中歧义字段切分系统设计[J].现代电子技术,2020,43(1):44-47.

二级引证文献2

1张楠,李洪敏,柯明敏.试验器材库房管理系统的设计与实现[J].计算机测量与控制,2017,25(6):195-198. 被引量：6
2丁宪生,陆大春,汪玮,张世国,王毛翠.基于SQL Server的气象技术装备动态管理系统设计[J].气象水文海洋仪器,2019,36(3):40-44. 被引量：6

1贺飞扬,高俊,高道恩.基于DSP的π/4-DQPSK调制解调器的实现[J].电子器件,2006,29(3):688-690. 被引量：1
2赵捷,张倩.中文词库在组织机构基础信息检索引擎中的应用[J].标准科学,2009(2):85-89. 被引量：2
3顾佼佼,杨志宏,姜文志,胡文萱.基于条件随机场的中文分词算法改进[J].信息与电子工程,2012,10(2):184-187. 被引量：3
4赵庆平,姜恩华,李峥.通信工程专业通信基础理论课程群建设与实践[J].韶关学院学报,2015,36(12):73-76.
5张晓梅,苏斌,王竹林,杨柳.基于搜索引擎的有害信息监控系统的设计与实现[J].铁路计算机应用,2007,16(12):38-41. 被引量：1
6郑天宏,许杭杰,董黎刚.中文文本抄袭检查技术的研究[J].杭州电子科技大学学报（自然科学版）,2010,30(5):117-120.
7王晓艳,李国才.基于广播电台数字音频资料库元数据项的智能分析与检索[J].广播电视信息,2013,20(3):111-114. 被引量：2
8肖侃,谭长庚,丁玲.基于中文分词的文本相似度动态规划算法[J].现代电子技术,2011,34(8):72-74. 被引量：3
9王志勇,杨鹏飞.匹配理论中Konig定理的新证明方法[J].空军雷达学院学报,2003,17(2):15-16.
10王怀球,邹峥嵘.基于Internet的工程专业教学网络智能答疑系统[J].科技资讯,2008,6(33):148-149. 被引量：2

现代电子技术

2012年第8期

浏览历史

内容加载中请稍等...

中文分词歧义识别算法的优化被引量：2

参考文献10

二级参考文献77

共引文献90

同被引文献20

引证文献2

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

中文分词歧义识别算法的优化 被引量：2

参考文献10

二级参考文献77

共引文献90

同被引文献20

引证文献2

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

中文分词歧义识别算法的优化被引量：2