-
题名基于双字哈希结构的最大匹配算法机制改进
被引量:6
- 1
-
-
作者
刘勇
魏光泽
-
机构
青岛科技大学
-
出处
《电子设计工程》
2017年第16期11-15,共5页
-
文摘
中文分词是计算机进行文本分析的关键技术。基于提高分词效率以满足日益增长的文本分析需求,通过分析常用的基于词典的机械分词算法与词典机制的优缺点,在对最大匹配算法进行改进的同时,采用双字哈希词典设计了适合此算法的双字哈希余字分组的词典结构,提出了基于双字哈希结构的最大匹配改进算法。该算法在保证原最大匹配算法分词精度的前提下,大大提高了分词速度。经实验证明,改进后的算法性能明显提升。
-
关键词
中文分词
最大正向匹配算法
词典
哈希结构
哈希函数
-
Keywords
Chinese segmentation
forward maximum matching algorithm
dictionary
Hash structure
Hash function
-
分类号
TP301
[自动化与计算机技术—计算机系统结构]
-
-
题名一种海图英语地名机器翻译方法
被引量:2
- 2
-
-
作者
乔晶
李鹤元
-
机构
西安外国语大学出国留学人员培训部
西安测绘中心
-
出处
《海洋测绘》
CSCD
北大核心
2022年第5期73-77,82,共6页
-
基金
国家自然科学基金(42171456)。
-
文摘
针对目前海图英语地名机器翻译研究薄弱、传统人工翻译效率低等问题,提出了一种语料库和规则驱动相结合的海图英语地名机器翻译方法:首先分析海图英语地名组成特点及翻译难点,在此基础上设计英汉海图地名双语语料库及通名表,实现对现有海图地名资料的继承和地名通名的自动识别与翻译;而后结合英语地名译音表及译写细则开展音节切分,进而采用正向最大匹配算法完成待译字符串与英汉音译表的匹配,实现英语地名专名音译;最后组合输出地名通名及专名译写结果。经过对海图英语地名翻译实验,验证了该机器翻译方法的有效性,为大规模海图英语地名翻译奠定基础。
-
关键词
海图英语地名
语料库
翻译规则库
音节切分
最大正向匹配算法
-
Keywords
English place names for charts
corpus
translation rules
syllable division
forward maximum matching
-
分类号
U675.81
[交通运输工程—船舶及航道工程]
-