-
题名基于国际标准的错字处理方案设计与实现
被引量:1
- 1
-
-
作者
李小庆
林民
塔娜
田寄远
-
机构
内蒙古师范大学计算机与信息工程学院
-
出处
《计算机工程与设计》
CSCD
北大核心
2010年第10期2388-2391,2395,共5页
-
基金
国家自然科学基金项目(60863007)
内蒙古师范大学研究生科研创新基金项目(CXJJS08021)
-
文摘
为了帮助汉语教学研究人员使用计算机有效处理错字,分析了汉语教学界对错字分类的研究成果,建立了一种适合计算机处理、以字形为依据的错字分类体系。基于Unicode5.1标准中表意文字变体序列标准(ideographic variation sequences,IVS),设计并实现了以正字为中心组织和管理错字,使用正字加IVS变体选择符表示错字编码,应用OpenType字体技术解决了错字的输入输出问题。实验结果表明,该错字处理方案是可行的,而且能够较好地支持错字的传输、共享和检索,以及错字与标准字符集内汉字同文显示。
-
关键词
汉字
错字处理
统一字符编码标准
表意文字变体序列
OpenType字体
-
Keywords
Chinese character
wrongly written Chinese characters processing
Unicode
ideographic variation sequences
OpenType font
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名Unicode数据仓库ETL的设计与实现
被引量:1
- 2
-
-
作者
许威
李茂青
-
机构
厦门大学自动化系
-
出处
《计算机工程》
CAS
CSCD
北大核心
2008年第11期74-76,共3页
-
基金
国家"985"工程二期基金资助项目(0000-X07204)
福建省自然科学基金资助项目(E0520001)
-
文摘
在Unicode数据装载过程中,如源字符集中的某个字符在目标字符集中没有定义,将会出现错误,产生信息丢失的现象。针对这种情况,该文提出一种从源Oracle数据库到目标Teradata数据仓库字符集转换的ETL设计方法和实现。实践表明该方案有效可行,能提高ETL过程的容错率。
-
关键词
字符集
数据仓库
统一字符编码标准
-
Keywords
character set
data warehouse
Unicode
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-