-
题名可编程并行接口在isp1032E芯片上的实现
- 1
-
-
作者
倪耀群
肖梓祥
-
机构
河南郑州信息工程大学信息工程学院
-
出处
《微型机与应用》
2003年第7期19-21,共3页
-
文摘
分析了在系统可编程器件和二类8255接口芯片的特点,在此基础上重点介绍了用VHDL描述8255芯片时可能出现的问题及其改进方法,给出了用isp1032E芯片实现8255的部分程序和结果。
-
关键词
isp1032E芯片
可编程并行接口
中断方式
计算机
-
分类号
TP334.7
[自动化与计算机技术—计算机系统结构]
-
-
题名网络维吾尔文判别及其文本长度下界的探讨
被引量:2
- 2
-
-
作者
倪耀群
曹鹏
许洪波
唐慧丰
程学旗
-
机构
中国科学院计算技术研究所
中国科学院研究生院
解放军外国语学院
-
出处
《中文信息学报》
CSCD
北大核心
2012年第6期109-115,共7页
-
基金
国家自然科学基金资助项目(60903139
60873243)
+2 种基金
自然基金重点资助项目(60933005)
国家863计划重点资助项目(2010AA012502
2010AA012503)
-
文摘
将维吾尔文从阿拉伯文、哈萨克文、柯尔克孜文等以阿拉伯字母为基础书写的类似文字中识别出来,是维文信息处理的基础。作者对维吾尔字符的编码优化后使用N元语法模型实现了维吾尔文的快速语种判别,准确率超过98%。经过错误分析,发现错误判别的文本主要集中在论坛和微博客中,这些文本有效字符数太少,语言特征不充分。最后作者计算了四种语言真实网络文本中的所有公共子串,并对文种判别所需要的最短字符串长度进行了分析。
-
关键词
老维文
语种识别
最大公共子串
-
Keywords
Arabic-Script Uyghur
language detection
longest common substring
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于多特征融合和图匹配的维汉句子对齐
被引量:2
- 3
-
-
作者
倪耀群
许洪波
程学旗
-
机构
中国科学院计算技术研究所网络数据科学与技术重点实验室
中国科学院大学
洛阳外国语学院语言工程系
-
出处
《中文信息学报》
CSCD
北大核心
2016年第4期124-133,共10页
-
基金
国家自然科学基金(61232010
61303156)
+2 种基金
国家973课题(2012CB316303)
国家863课题(2012AA011003)
国家科技支撑计划(2012BAH46B04)
-
文摘
维吾尔语新闻网页与对应的中文翻译网页在内容上往往并非完全可比,主要表现为双语句子序列的错位甚至部分句子缺失,这给维汉句子对齐造成了困难。此外,作为新闻要素的人名地名很多是未登录词,这进一步增加了维汉句子对齐的难度。为了提高维汉词汇的匹配概率,作者自动提取中文人名、地名并翻译为维吾尔译名,构造双语名称映射表并加入维汉双语词典。然后用维文句中词典词对应的中文译词在中文句中进行串匹配,以避免中文分词错误,累计所有匹配词对得到双语句对的词汇互译率。最后融合数字、标点、长度特征计算双语句对的相似度。在所有双语句子相似度构成的矩阵上,使用图匹配算法寻找维汉平行句对,在900个句对上最高达到95.67%的维汉对齐准确率。
-
关键词
句子对齐
人名、地名翻译
多特征融合
二部图最佳匹配
-
Keywords
sentence alignment
translation of human name and location name
multiple features blending
maximum weight matching in bipartite graph
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-