-
题名CBMdisc中MeSH字段汉字缺失问题探讨
- 1
-
-
作者
陈万福
-
机构
江苏职工医科大学[江苏省医学情报研究所]
-
出处
《医学信息学杂志》
CAS
2007年第6期617-620,共4页
-
文摘
首先概述中国生物医学文献数据库(CBMdisc)中主题词(MeSH)字段汉字缺失问题的成因,然后对该数据库中所有缺失汉字的主题词作具体解析,并提议在逐步更新数据库时:①优先使用GBK字库中隐含的标准化既有汉字批量替换大部分用汉语拼音表达的缺失汉字;②升级数据库的开发和应用平台,使之完全支持GB18030大字符集;③提议从长远角度考虑,把数据库整体迁移到以Unicode为信息交换标准的Web平台,使之能无障碍地运行于不同语言版本的操作系统,并能完全支持7万字以上的SuperCJK超大字符集。
-
关键词
中国生物医学文献数据库
医学主题词
汉字缺失
GBl8030
UNICODE
-
分类号
G254.2
[文化科学—图书馆学]
-
-
题名CMCC数据库的汉字缺失现象及其解决方案
- 2
-
-
作者
陈万福
-
机构
江苏职工医科大学江苏省医学情报研究所
-
出处
《中华医学图书情报杂志》
CAS
2007年第4期61-64,共4页
-
文摘
总结了《中文生物医学期刊数据库》(CMCC)的汉字缺失现象及其成因,提议:在逐步更新数据库时,立即使用GBK扩充汉字批量替换大部分缺失汉字;安装微软GB18030支持包及Surrogate更新,升级数据库的开发和应用平台,使之完全支持GB18030大字符集;将来采用ISO10646为构建CMCC数据库的中文字符编码标准,从而完全支持7万字以上的SuperCJK超大字符集等。
-
关键词
中文生物医学期刊数据库
汉字缺失
GB18030
ISO10646
-
Keywords
CMCC
Lack of the Chinese characters
GB18030
ISO10646
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-