多编码环境下藏字内码识别算法的研究被引量：2

Research of Tibetan Character Internal Codes Recognition Algorithm in the Multi-coded Environment

下载PDF

导出

摘要藏字内码向ISO/IEC 10646-1藏文编码过渡是实现计算机用文字编码统一的必然趋势,但目前在很长的一段时间内仍将存在多种藏字编码并存的情况,所以实现藏字内码的自动识别是保证藏字多内码并存的关键。主要探讨了如何在多内码并存的多编码环境中实现藏字内码自动识别的问题,并提供了两个藏字内码识别算法。在此基础上,对不同的识别算法进行分析和评估。在对目标样本的测试中,以上算法的识别率最高可以达到100%以上。 It s a general tendency that the tibetan Character Internal Codes used in computer should transfer to ISO/IEC 10646-1,but there are multi-tibetan Character Internal Codes used in the computer now,and this instance will stand a long time.So how to realize the tibetan Character Internal Codes auto recognition is the key to build a Multi-coded Environment.This paper mainly discusses the tibetan Character Internal Codes recognition algorithms in the Multilingual Environment,and provides two recognition algorithms, such as Internal Code Bound Recognition Algorithm, Interpunction Recognition Algorithm, tibetan Character Frequency Recognition Algorithm and Semantic Recognition Algorithm. This paper also evaluates the algorithms mentioned in this paper, and the rate of Recognition can reach 100% used these recognition algorithms on the test documents.

作者安见才让

机构地区青海民族学院计算机系

出处《微处理机》 2009年第5期69-71,共3页 Microprocessors

关键词计算机应用藏文信息处理多编码环境藏字内码识别算法 Computer application Tibtan information processing Multi-coded environment Tibetan character internal code Recognition algorith

分类号 TP391.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献3

1尼玛扎西等.GB16959-1997,1997-09-02,中华人民共和国国家标准,信息技术信息交换用藏文编码字符集基本集[s].北京:中国标准出版社,1998. 被引量：1
2于洪志.计算机藏文编码概述[J].西北民族学院学报（自然科学版）,1999,20(3):15-19. 被引量：9
3曹晖.字符集与字符编码标准[J].西北民族大学学报（自然科学版）,2006,27(3):36-42. 被引量：6

二级参考文献10

1于洪志.藏文编码字符集国家标准的讨论.国际第三届中文多文种信息处理学术交流会论文集[M].北京,1992,10.. 被引量：1
2于洪志.藏文中字符集编码的可行性.第六届少数民族文字信息处理全国学术交流会论文集[M].南宁,1995,5.. 被引量：1
3于洪志.藏文信息处理的问题与对策.中国中文信息学会汉字编码专业委员会第七届年会暨学术交流会论文集[M].,1996.. 被引量：1
4香港增补字符集:http://www.digital21.gov.hk/chi/hkscs/introduction.html. 被引量：1
5CJK 有关信息:ftp://ftp.ora.com/pub/examples/nutshell/ujip/doc/cjk.inf. 被引量：1
6藏文编码http://www.tibetaninfo.net/lyz/wl/zwxxjs.ht. 被引量：1
7The Unicode Consortium:http://www.Unicode.org. 被引量：1
8International Standard ISO/IEC 10646-1 Second Edition:Information technology-Universal Multiple-Octet Coded Character Set(UCS),2000. 被引量：1
9于洪志.计算机藏文编码性能指标分析[J].西北民族学院学报（自然科学版）,1997,18(2):15-20. 被引量：4
10于洪志.全藏文编码体系[J].西北民族大学学报（自然科学版）,1998,23(1):5-10. 被引量：4

共引文献13

1才华.藏文组字部件的自动识别与字排序研究[J].西藏大学学报（社会科学版）,2014,29(5):81-86. 被引量：1
2李永宏,何向真,艾金勇,于洪志.藏文编码方式及其相互转换[J].计算机应用,2009,29(7):2016-2018. 被引量：4
3艾金勇,于洪志,李永宏.藏文字形结构计量统计分析[J].计算机应用,2009,29(7):2029-2031. 被引量：6
4陈琪,李永宏,于洪志.藏文网页抓取及编码统一转换的系统研究[J].西北民族大学学报（自然科学版）,2009,30(2):22-26. 被引量：4
5武光利,于洪志,柳春.藏文同元码与基本集相互转换的规则与实现[J].计算机工程与应用,2009,45(29):134-136. 被引量：1
6蒋明原,孔令德.基于Lucene的藏文信息采集及检索系统研究[J].电脑开发与应用,2011,24(2):34-37. 被引量：2
7彭文惠,吴小刚,蒋华.基于柔性字符串匹配的校园BBS过滤系统[J].计算机与现代化,2011(2):145-147. 被引量：1
8章晟,张启飞,潘雪增,朱旭辉.搜索引擎中基于密度聚类的混合编码检测算法[J].数据采集与处理,2011,26(1):95-100.
9陈涛,吴敏,张彪.奇偶量化DCT系数实现文本信息隐藏[J].计算机工程与应用,2011,47(9):127-129. 被引量：5
10才让叁智,安见才让.藏汉英混合文档的字数统计研究[J].网络与信息,2011,25(7):44-44. 被引量：2

同被引文献17

1尼玛扎西,李志蜀,群诺,普顿,拥措,陈安龙.一种在移动电话上实现藏文处理的方法[J].四川大学学报（工程科学版）,2009,41(1):162-167. 被引量：9
2江荻.藏文信息处理基本属性分析[J].民族语文,1995(2):63-68. 被引量：5
3余东峰,孙兆林.基于贝叶斯网络不确定推理的研究[J].微型电脑应用,2004,20(8):6-8. 被引量：23
4高定国,龚育昌.现代藏字全集的属性统计研究[J].中文信息学报,2005,19(1):71-75. 被引量：32
5扎西次仁.《中华大藏经·丹珠尔》藏文对勘本字频统计分析[J].中国藏学,1997(2):122-133. 被引量：18
6黄日生.浅议垃圾短信之规制[J].通信与信息技术,2008(1):55-57. 被引量：4
7范晶,刘菊新,陈峰,徐从富.基于Hash函数和贝叶斯方法的垃圾短信在线过滤系统[J].计算机应用,2008,28(4):1084-1086. 被引量：7
8李辉,张琦,卢湖川.基于内容的垃圾短信过滤[J].计算机工程,2008,34(12):154-156. 被引量：17
9珠杰,欧珠,格桑多吉.基于DOM修剪的藏文Web信息提取[J].计算机工程,2008,34(24):58-60. 被引量：7
10尼玛扎西,李志蜀,拥措,群诺,普顿.实现计算机藏文快速输入的关键问题研究[J].电子科技大学学报,2009,38(1):102-107. 被引量：8

引证文献2

1拥措.基于朴素贝叶斯算法的藏文垃圾短信过滤初探[J].西藏大学学报（社会科学版）,2013,28(4):59-64.
2春燕,曲珍.藏文文本编码识别方法研究[J].计算机工程与应用,2013,49(1):141-144. 被引量：1

二级引证文献1

1刘城,黄鹤鸣,李继文.藏文字笔画编码排序的设想[J].计算机系统应用,2013,22(5):18-20. 被引量：1

1尤杰,堵爱平.物料编码在信息系统中统一技术的研究与实现[J].信息技术,2012,36(11):167-170. 被引量：2
2我国将开始构建物联网编码统一标识体系[J].中国防伪报道,2012(10):65-65. 被引量：1
3宋豫江.编码统一管控实现油运企业信息化集成[J].中国信息化,2010(16):70-71.
4胡燕,吴韦.IUC算法及其在Web编码中的应用研究[J].武汉理工大学学报,2009,31(3):150-153.
5周琳,杨娜.基于离线双字典学习算法的图像超分辨率重建研究[J].红外技术,2015,37(4):277-282. 被引量：1
6盛刚.高速公路机电联网编码探讨[J].公路交通科技,2003,20(z1):22-27. 被引量：3
7李培峰,朱巧明,钱培德.多文种环境下汉字内码识别算法的研究[J].中文信息学报,2004,18(2):73-79. 被引量：16
8刘白秋.图书馆自动识别技术应用现状与比较分析[J].集成电路应用,2010(4):26-28. 被引量：5
9黄永霞.基于Ecode的冷链物流单品追溯系统设计[J].中国自动识别技术,2017(2):57-64. 被引量：1
10苏宇,戴上静,石春,凌青,吴刚.基于插件的文本抽取系统的设计与实现[J].电子技术（上海）,2014(8):32-36.

微处理机

2009年第5期

浏览历史

内容加载中请稍等...

多编码环境下藏字内码识别算法的研究被引量：2

参考文献3

二级参考文献10

共引文献13

同被引文献17

引证文献2

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

多编码环境下藏字内码识别算法的研究 被引量：2

参考文献3

二级参考文献10

共引文献13

同被引文献17

引证文献2

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

多编码环境下藏字内码识别算法的研究被引量：2