中文校对系统中纠错知识库的构造及纠错建议的产生算法被引量：11

The Structuring Method of Correcting Knowledge Sets and the Producing Algorithm of Correcting Suggestion in the Chinese Text Proofreading System

下载PDF

导出

摘要本文依据待校对文本中的常见错误类型介绍了纠错知识库的构造方法以及基于该纠错知识库的自动纠错算法。该算法通过利用出错字串的特征 ,结合上下文启发信息 ,可有效地对文本中的别字、漏字、多字、易位、多字替换等错误提供纠错建议。 According to common error types in pre proofreading text,this paper introduce the method to structure correcting knowledge sets and a automatic correcting algorithm based on this correcting knowledge sets.The algorithm makes a full use of the characteristics of wrong strings and context heuristic information.It can provide correcting suggestions for such errors as ghost word,missed Chinese characters,superfluous Chinese characters,reversed Chinese characters and substituted Chinese characters etc.The method of sorting the correcting suggestions is also discussed.

作者张仰森

机构地区山西大学计算机科学系

出处《中文信息学报》 CSCD 北大核心 2001年第5期33-39,共7页 Journal of Chinese Information Processing

基金山西省自然科学基金 (9810 31)

关键词纠错知识库纠错建议纠错算法似然匹配中文校对系统排序方法 correcting knowledge sets correcting suggestion, correcting algorithm likelihood match

分类号 TP391.12 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献3

1于勐,姚天顺.一种混合的中文文本校对方法[J].中文信息学报,1998,12(2):31-36. 被引量：21
2张仰森,丁冰青.中文文本自动校对技术现状及展望[J].中文信息学报,1998,12(3):50-56. 被引量：14
3张仰森,丁冰青,龙一飞.一种英文单词拼写自动侦错与纠错的方法──骨架键法[J].电脑开发与应用,1999,12(2):9-10. 被引量：2

二级参考文献21

1赵明.手写印刷体汉字识别方法综述[J].计算机研究与发展,1993,30(4):59-64. 被引量：14
2许嘉璐.中文信息处理技术现状及相关语言文字研究[J].软件世界,1996(4):13-16. 被引量：3
3文韬.校对人员的好帮手——方正金山中文校对系统VCorrect试用报告[J].中国计算机用户,1996(10):23-25. 被引量：1
4严蔚敏吴伟民.数据结构[M].北京:清华大学出版社,1993.. 被引量：13
5慕勇，汉语文本自动查错与确认纠错系统的研究，1995年被引量：1
6姚天顺，自然语言理解，1995年被引量：1
7张照煌，Commun COLIPS，1994年，4卷，2期，143页被引量：1
8郭进，ICCC’94Tutorial Notes，1994年被引量：1
9施得胜，电脑与通讯，1992年，8期，19页被引量：1
10黄昌宁，语言文字应用，1997年，1期被引量：1

共引文献30

1张仰森,曹元大,徐波.基于统计的纠错建议给出算法及其实现[J].计算机工程,2004,30(11):106-109. 被引量：7
2张虎,郑家恒,刘江.语料库词性标注一致性检查方法研究[J].中文信息学报,2004,18(5):11-16. 被引量：9
3张仰森,俞士汶.文本自动校对技术研究综述[J].计算机应用研究,2006,23(6):8-12. 被引量：39
4玛依热.依布拉音,米吉提.阿不里米提,艾斯卡尔.艾木都拉.基于最小编辑距离的维语词语检错与纠错研究[J].中文信息学报,2008,22(3):110-114. 被引量：11
5李蓉.一个用于OCR输出的中文文本的拼写校对系统[J].中文信息学报,2009,23(5):92-97. 被引量：3
6斯.劳格劳.基于不确定有限自动机的蒙古文校对算法[J].中文信息学报,2009,23(6):110-115. 被引量：8
7伊力亚尔.基于2-gram语言模型的哈萨克文语料库校对研究[J].伊犁师范学院学报（自然科学版）,2010,4(3):50-53. 被引量：1
8任智军,扈林芳.专利文献OCR校对方法研究[J].情报杂志,2011,30(3):182-184. 被引量：2
9安见才让.基于分段的藏字校对算法研究[J].中文信息学报,2013,27(2):58-64. 被引量：12
10刘亮亮,王石,王东升,汪平仄,曹存根.领域问答系统中的文本错误自动发现方法[J].中文信息学报,2013,27(3):77-83. 被引量：19

同被引文献99

1赵作鹏,尹志民,王潜平,许新征,江海峰.一种改进的编辑距离算法及其在数据处理中的应用[J].计算机应用,2009,29(2):424-426. 被引量：51
2曹犟,邬晓钧,夏云庆,郑方.基于拼音索引的中文模糊匹配算法[J].清华大学学报（自然科学版）,2009(S1):1328-1332. 被引量：14
3车万翔,刘挺,秦兵,李生.基于改进编辑距离的中文相似句子检索[J].高技术通讯,2004,14(7):15-19. 被引量：63
4张仰森,曹元大,徐波.基于统计的纠错建议给出算法及其实现[J].计算机工程,2004,30(11):106-109. 被引量：7
5张磊,周明,黄昌宁,潘海华.中文文本自动校对[J].语言文字应用,2001(1):19-26. 被引量：23
6冯志伟.汉字和汉语的计算机处理[J].当代语言学,2001,3(1):1-21. 被引量：23
7张仰森,曹元大,徐波.中文文本自动校错系统中知识库及其构造方法研究[J].小型微型计算机系统,2004,25(12):2237-2242. 被引量：3
8陈笑蓉,秦进,汪维家,陆汝占.中文文本校对技术的研究与实现[J].计算机科学,2003,30(11):53-55. 被引量：6
9蔡增玉,谷文祥.汉字双向有穷自动机的研究[J].中文信息学报,2005,19(3):40-44. 被引量：4
10张仰森,俞士汶.文本自动校对技术研究综述[J].计算机应用研究,2006,23(6):8-12. 被引量：39

引证文献11

1斯·劳格劳,白斯勤,白庆格勒图.一种传统蒙古文拼写检查系统的实现[J].中央民族大学学报（哲学社会科学版）,2021,48(1):158-168. 被引量：1
2陈笑蓉,秦进,汪维家,陆汝占.中文文本校对技术的研究与实现[J].计算机科学,2003,30(11):53-55. 被引量：6
3张仰森,俞士汶.文本自动校对技术研究综述[J].计算机应用研究,2006,23(6):8-12. 被引量：39
4斯.劳格劳.基于不确定有限自动机的蒙古文校对算法[J].中文信息学报,2009,23(6):110-115. 被引量：8
5郭充,张仰森.基于《知网》义原搭配的中文文本语义级自动查错研究[J].计算机工程与设计,2010,31(17):3924-3928. 被引量：12
6王静婷.基于规则的中文字符串近似匹配研究[J].网络安全技术与应用,2010(12):41-44. 被引量：1
7关白,洛藏,才科扎西.现代藏文自动校对现状分析[J].西藏科技,2011(8):78-80. 被引量：7
8安见才让.基于分段的藏字校对算法研究[J].中文信息学报,2013,27(2):58-64. 被引量：12
9施恒利,刘亮亮,王石,符建辉,张再跃,曹存根.汉字种子混淆集的构建方法研究[J].计算机科学,2014,41(8):229-232. 被引量：7
10邵清,叶琨.基于编辑距离和相似度改进的汉字字符串匹配[J].电子科技,2016,29(9):7-11. 被引量：17

二级引证文献98

1斯·劳格劳,白斯勤,白庆格勒图.一种传统蒙古文拼写检查系统的实现[J].中央民族大学学报（哲学社会科学版）,2021,48(1):158-168. 被引量：1
2华旦扎西,才智杰,班玛宝.一种基于TC_LSTM的藏文词拼写检查方法[J].中文信息学报,2020,34(5):50-55. 被引量：5
3陈笑蓉,秦进.特征和语言模型结合的中文文本查错[J].计算机应用,2004,24(B12):259-261. 被引量：1
4陈翔,徐平先,张玉志.面向文本数字化的自动纠错方法[J].计算机应用研究,2008,25(5):1434-1436. 被引量：3
5王永景,刘功申,李生红,荆涛.用于文本校对的分词与词性标注一体化算法[J].计算机技术与发展,2008,18(8):1-3. 被引量：1
6李斌,姚建民,朱巧明.英文作文的自动拼写检查研究[J].郑州大学学报（理学版）,2008,40(3):48-51. 被引量：5
7林晖,林劼.基于Markov模型的改进型疑错窗口算法[J].实验科学与技术,2008,6(4):40-42. 被引量：1
8潘昊,颜军.基于中文分词的文本自动校对算法[J].武汉理工大学学报,2009,31(3):18-20. 被引量：4
9才让卓玛,才智杰.藏文文本自动校对系统开发研究[J].西北民族大学学报（自然科学版）,2009,30(1):25-28. 被引量：10
10斯.劳格劳.基于不确定有限自动机的蒙古文校对算法[J].中文信息学报,2009,23(6):110-115. 被引量：8

1张仰森,曹元大,徐波.中文文本自动校错系统中知识库及其构造方法研究[J].小型微型计算机系统,2004,25(12):2237-2242. 被引量：3
2张仰森,曹元大,徐波.基于统计的纠错建议给出算法及其实现[J].计算机工程,2004,30(11):106-109. 被引量：7
3宋涛,李鸥,刘广怡,崔弘亮.基于改进协作目标外观模型的在线视觉跟踪[J].电子学报,2017,45(2):384-393. 被引量：2
4王霞.Word2013输入错别字[J].微电脑世界,2013(10):81-81.
5左艳芳,林加华.基于矩阵易位的可逆加密算法分析与设计[J].江南大学学报（自然科学版）,2011,10(6):676-680.
6文韬.校对人员的好帮手——方正金山中文校对系统VCorrect试用报告[J].中国计算机用户,1996(10):23-25. 被引量：1
7别字造就“文曲星”[J].传奇故事（百家讲坛）（红版）,2009(3):78-78.
8李文桢.分子过孔数据处理方法的设计与实现[J].信息化研究,2014,40(5):51-54.
9梁志烽.浅谈数据加密技术[J].福建行政学院福建经济管理干部学院学报,2005(B11):206-207.
10李荣.能识别字迹的智能笔[J].艺术科技,1999,12(4):12-12. 被引量：1

中文信息学报

2001年第5期

浏览历史

内容加载中请稍等...

中文校对系统中纠错知识库的构造及纠错建议的产生算法被引量：11

参考文献3

二级参考文献21

共引文献30

同被引文献99

引证文献11

二级引证文献98

相关作者

相关机构

相关主题

浏览历史

中文校对系统中纠错知识库的构造及纠错建议的产生算法 被引量：11

参考文献3

二级参考文献21

共引文献30

同被引文献99

引证文献11

二级引证文献98

相关作者

相关机构

相关主题

浏览历史

中文校对系统中纠错知识库的构造及纠错建议的产生算法被引量：11