基于Mealy机的蒙古文排序算法被引量：1

A Mongolian Word-sorting Algorism Based on Mealy Machine

下载PDF

导出

摘要排序是语言文字信息处理中的重要工作之一,它的目的是将单词(或词组)的任意序列重新排列成按关键字有序的序列,从而优化存储结构,提高检索速度.但由于蒙古文排序习惯和其"UCS"编码的特殊性,单词排序不能完全依靠字符编码的自然顺序.单词的排列顺序不仅与字符编码有关,而且与字符状态有着密切的关系.因此先给出字符状态和词状态的定义,然后提出一种基于Mealy机的字符串排序算法.该算法是传统的字符串排序算法的一种扩展,主要解决了编码相同状态不同情况下词的排序问题,并且在传统蒙古文排序中的应用证实了算法的有效性.该算法具有很好的适应性,能够解决其它一些复杂文本语言的排序问题. Word-sorting plays a very important role in language information processing.It is the main task for word-sorting to reorder the random array of words （or the phrases） into a key word array,so that it can optimize the storage structures of word-list and improve the searching speed.But because of the sorting custom and special characteristics of Mongolian ＂UCS＂ code system,word-sorting cannot depend on natural orders of character-codes solely.The sorting order of words is determined by a character-code and its state synchronously.Firstly,the definition of character-state and word-state is given,then a word-sorting algorithm based on Mealy machine is introduced.This algorithm extends the ability of traditional word-sorting method to solve the problem of sorting two words with the same character sequence but at different word-states.The algorithm′s validity is proved by its application in the traditional Mongolian sorting program MIPT（Mongolian Information Processing Tools）.The algorithm has very good adaptability,so it can solve the same problems of some other complex scripts.

作者斯.劳格劳吴常福

机构地区内蒙古大学蒙古学学院

出处《内蒙古大学学报（自然科学版）》 CAS CSCD 北大核心 2008年第4期465-468,共4页 Journal of Inner Mongolia University：Natural Science Edition

基金内蒙古自然科学基金项目(200607010812)资助

关键词蒙古文排序复杂文本 UCS Mongolian sort complex scripts UCS

分类号 TP391.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献6

1确精扎布著..蒙古文编码[M].呼和浩特:内蒙古大学出版社,2000:302.
2那顺乌日图,确精扎布.蒙古文国际标准编码诸规则[J].内蒙古大学学报（哲学社会科学版）,1998,30(4):77-84. 被引量：6
3Wuu Y. Mealy machines are a better model of lexical analyzers [J]. Computer Languages, 1996,22(1):27-38. 被引量：1
4任磊,谷文祥.基于Mealy机的汉字输入有穷自动机及其应用[J].计算机应用研究,2003,20(4):15-17. 被引量：4
5JE霍普克罗夫特,JD厄尔曼.自动机理论、语言和计算导引[M].北京:科学出版社,1986. 被引量：1
6Sidhu D P, Leung T K. Formal methods for protocol testing:a detailed study [J]. Software Engineering, 1989, 15(4) :413-426. 被引量：1

二级参考文献5

1钱培德,陆建明,朱巧明.汉字信息输入处理数学模型的研究[J].计算机研究与发展,1993,30(6):1-5. 被引量：7
2谷文祥.关于计算机汉字信息输入处理的一个新模型[J].计算机研究与发展,1995,32(7):61-65. 被引量：8
3谷文祥.汉字有穷自动机研究[J].计算机研究与发展,1995,32(9):21-26. 被引量：6
4JE霍普克罗夫特 JD厄尔曼.自动机理论、语言和计算导引[M].北京：科学出版社,1986.. 被引量：1
5石立新.Web服务器的繁简体转换代理[J].内蒙古大学学报（自然科学版）,1999,30(6):782-784. 被引量：1

共引文献8

1李爽.汉字输入数学模型的研究[J].中国科教创新导刊,2007(13):66-67.
2蔡增玉,谷文祥.汉字双向有穷自动机的研究[J].中文信息学报,2005,19(3):40-44. 被引量：4
3娜步青.基于统计的蒙汉机器翻译系统研究[J].内蒙古农业大学学报（自然科学版）,2005,26(4):151-154. 被引量：2
4娜步青.基于统计的蒙汉机器翻译系统研究[J].内蒙古农业大学学报（社会科学版）,2006,8(2):153-155.
5蔡增玉,刘书如,张建伟,张保威.汉字模糊有穷自动机的研究[J].计算机技术与发展,2008,18(3):89-91. 被引量：4
6斯.劳格劳.蒙古文编码转换通用算法研究[J].内蒙古大学学报（哲学社会科学版）,2009,41(2):133-136. 被引量：2
7杨吉雅图,毕力格巴图.传统蒙古文字体设计方法研究[J].内蒙古大学艺术学院学报,2017,14(2):85-90. 被引量：3
8阿日木扎,林民,马占新.一类蒙文词切分方法构造及智能词切分系统设计[J].内蒙古师范大学学报（自然科学汉文版）,2019,48(5):393-399.

同被引文献7

1蔡增玉,谷文祥.汉字双向有穷自动机的研究[J].中文信息学报,2005,19(3):40-44. 被引量：4
2张仰森,俞士汶.文本自动校对技术研究综述[J].计算机应用研究,2006,23(6):8-12. 被引量：39
3Wuu Y. Mealy machines are a better model of lexical analyzers [J]. Computer Languages, 1996, 22 ( 1 ) : 27-38. 被引量：1
4Jian hua, Wang Xiaolong. Study on Automatic Spelling Check and Correction[J]. Journal of Chinese Language and Computing, 2003,1 (1) : 25-36. 被引量：1
5Karen Kukich. Techniques for Automatically Correcting Words in Text [J]. ACM Computing Surveys, 1992, 24(4): 377-438. 被引量：1
6张仰森,丁冰青.中文文本自动校对技术现状及展望[J].中文信息学报,1998,12(3):50-56. 被引量：14
7张仰森.中文校对系统中纠错知识库的构造及纠错建议的产生算法[J].中文信息学报,2001,15(5):33-39. 被引量：11

引证文献1

1斯.劳格劳.基于不确定有限自动机的蒙古文校对算法[J].中文信息学报,2009,23(6):110-115. 被引量：8

二级引证文献8

1斯·劳格劳,白斯勤,白庆格勒图.一种传统蒙古文拼写检查系统的实现[J].中央民族大学学报（哲学社会科学版）,2021,48(1):158-168. 被引量：1
2苏传捷,侯宏旭,杨萍,员华瑞.基于统计翻译框架的蒙古文自动拼写校对方法[J].中文信息学报,2013,27(6):175-179. 被引量：10
3包敏娜,斯.劳格劳.基于词典匹配的蒙古文命名实体识别研究[J].中央民族大学学报（哲学社会科学版）,2017,44(3):165-169. 被引量：3
4斯.劳格劳.蒙古语固定短语识别算法的设计与实现[J].中文信息学报,2017,31(5):85-91. 被引量：3
5娜仁图雅,白双成.蒙古语媒体资产编目问题研究[J].广西科学院学报,2018,34(1):72-77.
6包乌格德勒,李娟.蒙古文文本自动校对研究综述[J].电脑知识与技术（过刊）,2016,22(12X):227-229. 被引量：1
7杨利润,斯琴巴图.浅析蒙古文电子文档中的文本错误[J].电脑知识与技术,2019,15(4Z):211-213. 被引量：1
8杨利润,斯琴巴图,锡林宝力尔.关于解决蒙古文形对码错错误的研究综述[J].现代计算机,2020,26(4):29-31.

1牟学鹏,邵军.对ASP.NET实现复杂文本上载入库方法的研究[J].电脑知识与技术,2006,1(1):83-83.
2那孜古力,吾守尔·斯拉木,那斯尔江·土尔逊.基于天地网的同步实时授课系统的本地化研究及实现[J].电脑知识与技术（过刊）,2007(22):1008-1010.
3李平,李永明.伪加权Mealy机与伪加权Moore机的关系[J].模糊系统与数学,2011,25(6):134-139. 被引量：1
4斯.劳格劳,敖其尔.Windows环境下蒙古文复杂文本处理的研究[J].内蒙古大学学报（自然科学版）,2007,38(5):582-585. 被引量：6
5曹小阳,王琨.排序算法在某系统中的应用[J].商,2015,0(51):298-298.
6吴春波,苏厚勤.基于有限状态机模型的GUI设计及其应用[J].计算机应用与软件,2010,27(11):141-144. 被引量：6
7汲洋弘康,王飞,余婷.Mealy机的实时系统调度方法[J].华侨大学学报（自然科学版）,2014,35(5):503-508.
8李莉,缪成,吾守尔.斯拉木.基于红旗Linux的多语种操作系统的设计[J].计算机工程,2006,32(19):46-48. 被引量：1
9梁虹,金乃咏.基于Mealy机精化关系的验证算法[J].计算机应用与软件,2012,29(8):169-172.
10才让卓玛,李永明,才智杰.基于Mealy机的藏文字构件分解[J].电子学报,2015,43(5):935-939. 被引量：5

内蒙古大学学报（自然科学版）

2008年第4期

浏览历史

内容加载中请稍等...

基于Mealy机的蒙古文排序算法被引量：1

参考文献6

二级参考文献5

共引文献8

同被引文献7

引证文献1

二级引证文献8

相关作者

相关机构

相关主题

浏览历史

基于Mealy机的蒙古文排序算法 被引量：1

参考文献6

二级参考文献5

共引文献8

同被引文献7

引证文献1

二级引证文献8

相关作者

相关机构

相关主题

浏览历史

基于Mealy机的蒙古文排序算法被引量：1