题名 基于机器翻译的原型句蜕及其包装研究
被引量:3
1
作者
李颖
池 毓 焕
机构
装甲兵工程学院信息工程系
中国科学院声学研究所
出处
《装甲兵工程学院学报》
2003年第3期7-13,共7页
基金
国家973项目(编号G1998030506)
中国科学院知识创新项目
文摘
首先简要介绍了HNC理论及其机器翻译观,结合机器翻译的难点与原型句蜕存在的普遍性,说明了解决原型句蜕变换的意义;接着对原型句蜕构成现象进行了描述,从汉英语义块构成对比分析中导出了汉英变换规则;从现有的机器翻译系统所暴露的问题中,说明原型句蜕变换对提高机器翻译质量的必要性和可行性;最后是对本文的结论和说明.
关键词
机器翻译
HNC
句类
原型句蜕
语义块构成变换
Keywords
machine translation (MT)
sentence category
formal degraded sentence (FDS)
semantic chunk transformation
Hierarchical Network of Concepts (HNC)
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
H085
[自动化与计算机技术—控制科学与工程]
题名 基于语义块的事件倾向性分析研究
被引量:5
2
作者
韦向峰
张全
缪建明
池 毓 焕
机构
中国科学院声学研究所
出处
《中文信息学报》
CSCD
北大核心
2012年第3期44-48,共5页
基金
国家语委"十二五"科研项目(YB125-53)
中国科学院学部咨询项目(Y129091211)
文摘
事件的倾向性分析对网络舆情分析和事件趋势分析都具有重要意义。该文把影响倾向性分析的词语分为四类:对象词、褒贬词、逻辑词和程度词,建立了语句倾向性分析的二元模型和三元模型,在语句语义块分析的基础上实现对语句和篇章的倾向性获取。实验中首先确定三个事件实例的关键对象和立场,然后根据语句倾向性分析获得文章对于对象的褒贬态度和立场。实验表明语义块的范围限制有助于提高事件倾向性分析的准确性,立场分析则是事件倾向性分析的关键所在。
关键词
倾向性
语义块
立场分析
Keywords
opinion
semantic chunks
standpoint decision
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 对偶性概念的HNC阐释
被引量:3
3
作者
李颖
池 毓 焕
机构
中国科学院声学研究所
装甲兵工程学院
出处
《中文信息学报》
CSCD
北大核心
2004年第3期39-46,共8页
基金
国家重点基础研究发展规划资助项目(G19980 30 5 0 6 )
文摘
本文首先从计算语言学的角度对传统语义学和古典哲学进行了反思 ,提出了对偶性概念思想 ,并指出 ,区分两类对偶 (黑氏对偶与非黑氏对偶 )对自然语言处理中揭示概念之间关联性有重要意义 ;然后对两类对偶的内涵分别进行了范定 ,特别是非黑氏对偶的 12种子类给出了详细的定义 ;接着从语言概念空间和对偶空间的相互映射中 ,说明了对偶性概念在HNC概念基元表示中的地位。这些多侧面多角度的对偶性概念阐释 。
关键词
人工智能
自然语言处理
HNC理论
黑氏对偶
非黑氏对偶
Keywords
artificial intelligence
natural language processing
HNC theory
Hegel Antithesis and Non Hegel Antithesis.
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
题名 句类分析准则在作战文书地名识别中的应用
被引量:3
4
作者
李颖
王青海
池 毓 焕
机构
装甲兵工程学院科研部
中国科学院声学研究所
出处
《计算机工程与设计》
CSCD
北大核心
2013年第8期2903-2907,共5页
文摘
针对军用要图自动标绘对地名识别高精度的要求,紧扣"作战文书行文规范"这一特点,将句类分析之标点准则(语句的首尾边界是首块和末块的天然首尾边界)、介词准则(汉语的语块移位标志符由介词充当)、动词准则(充当特征块的动词是其它语块的天然边界)等应用于作战文书地名识别,采用基于规则的方法加以实现,实验结果F值在88%-97%之间。因此,作为作战文书向军用要图自动转换的预处理,地名识别这一结果是可用的。
关键词
中文地名识别
语块边界感知
句类分析
作战文书
概念层次网络理论
Keywords
chinese place name recognition
perception of chunks' boundaries
SCA(sentence category analysis)
operation document
HNC theory
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 基于HNC语义分析模型的文图转换研究
被引量:1
5
作者
李颖
池 毓 焕
机构
装甲兵工程学院科研部
中国科学院声学研究所
出处
《计算机工程与应用》
CSCD
2013年第11期135-139,共5页
基金
装甲兵工程学院创新基金重点项目(No.2011CJ072)
文摘
军事文书转换为要图通常需要耗时费力的人工工作,文图的自动转换将大大促进军事指挥的自动化水平。基于HNC理论及其语义模型提出并实现了一个文图自动转换系统,通过对军事文书中部队番号的自动识别、时间地点要素的自动获取,以及语句的句类分析可以获得句群文本的语义情景框架,根据情景框架中的要素可以直接转换为要图标绘所需的信息。实验表明军事文书的文本自动分析系统具有较高的准确率和召回率,为实现军事文书的文图自动转换提供了一种可靠方法。
关键词
语义分析
句类分析
军事文书
要图标绘
文图转换
Keywords
semantic analysis
analysis of sentence category
military document
map depicting
document-map transferring
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 富媒体环境下语音和文本内容的对齐研究
被引量:1
6
作者
韦向峰
袁毅
张全
池 毓 焕
机构
中国科学院声学研究所
出处
《情报工程》
2019年第2期17-27,共11页
基金
富媒体数字出版内容组织与知识服务重点实验室开放基金项目(ZD2018-07/03):“面向语音与文本内容的富媒体关联研究与技术实现”
文摘
语音媒体和文本媒体是富媒体中重要的两种媒体,本文试图解决富媒体内容关联中语音和文本的自动对应和关联问题。本文通过自动语音识别、语音纠错处理、文本相似度计算等技术和方法,把语音和文本的对齐问题转化为文本之间相似和对齐的问题,通过从语音到文本、从文本到语音两种应用场景,用实验证明了该方法的可行性和有效性。本文的语音文本对齐技术将是富媒体融合特别是语音媒体和文本媒体之间进行融合的重要支撑技术,同时也为文本媒体和语音媒体的进一步关联重组和应用提供坚实的技术基础。
关键词
富媒体
语音识别
锚点词
编辑距离
最长递增子序列
Keywords
Rich media
speech recognition
anchor words
edit distance
maximum incremental subsequence
分类号
TP37
[自动化与计算机技术—计算机系统结构]
TP391.1
[自动化与计算机技术—计算机科学与技术]
题名 汉语原型句蜕向英语多元逻辑组合的变换
7
作者
池 毓 焕
李颖
机构
中国科学院声学研究所
装甲兵工程学院信息工程系
出处
《装甲兵工程学院学报》
2004年第1期74-78,共5页
基金
国家973项目(编号G1998030506)
中国科学院知识创新项目
文摘
汉语原型句蜕的英译形式多种多样,其中变换成英语的多元逻辑组合是涉及比较复杂变换细节的一种,因而成为颇具特色的语义块构成变换子类.文章从概念阐释入手,详尽分析了这种变换的语言现象、变换的必要性以及实施变换的技术准备.
关键词
HNC理论
原型句蜕
要素句蜕
多元逻辑组合
语义块构成变换
Keywords
hierarchical network of concepts
cormal degraded sentence
degraded elements
plural logical combination
semantic chunk transformation
分类号
H085
[语言文字—语言学]
TP18
[自动化与计算机技术—控制理论与控制工程]
题名 基于HNC的汉语词语知识库改进
被引量:1
8
作者
王青海
马海慧
池 毓 焕
李颖
董凌冲
机构
装甲兵工程学院信息工程系
中国人民解放军
中国科学院声学研究所
中国人民解放军
出处
《中文信息学报》
CSCD
北大核心
2012年第2期35-39,共5页
文摘
汉语词语知识库是HNC知识库系统的重要组成部分,目前其结构设计简单,加大了对HNC符号解析的难度。该文在分析了HNC的编码特点的基础上,改进了汉语词语知识库模型,阐述了改进后汉语词语知识库实体属性的设计方法和知识库的填写原则,并用实例说明了改进后的词语知识库可以提高自然语言处理的效率。
关键词
汉语词语知识库
HNC理论
关系数据库
Keywords
Chinese lexical knowledge base
HNC theory
relational database
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 基于HNC概念框架的检索模型
被引量:1
9
作者
李颖
韦向峰
池 毓 焕
机构
装甲兵工程学院科研部
中国科学院声学研究所
出处
《情报杂志》
CSSCI
北大核心
2013年第6期127-130,120,共5页
文摘
针对目前搜索引擎难以按用户个性需求给出精确答案的现状,把概念层次网络理论的语义分析技术应用到搜索引擎中,在概念层次网络理论的基础上将自然语言的词、句和句群映射为概念符号、句类和概念框架,通过比较用户输入与网页文本的概念符号和概念框架,给出与用户输入语义上相同或相近的搜索结果,可以使搜索结果更加准确、更加符合用户意图,这有助于推动和促进下一代搜索引擎的个性化和智能化研究。
关键词
自然语言理解
语义分析
概念框架
HNC理论
搜索引擎
Keywords
natural language understanding semantic parsing concept frame the Theory of HNC search engine
分类号
TP301.2
[自动化与计算机技术—计算机系统结构]
题名 面向英汉机器翻译的英语特征语义块处理
被引量:1
10
作者
董凌冲
李颖
池 毓 焕
机构
装甲兵工程学院信息工程系
中国科学院声学研究所
出处
《计算机工程与设计》
CSCD
北大核心
2010年第14期3260-3263,3267,共5页
基金
国家科技支撑计划基金项目(2007BAH05B02-05)
文摘
针对当前英汉机器翻译软件未能充分理解源语句的问题,基于概念层次网络理论(hierarchical network of concepts,HNC理论),详细分析了在语句理解中起重要作用的英语特征语义块,分类讨论了其核心部分构成特点,并提出了相应的计算机处理算法。与在线机器翻译结果的比较表明,该算法对源语句进行了更加深入的分析与理解,能够为英汉机器翻译提供技术支持。
关键词
特征语义块构成
概念层次网络理论
英汉机器翻译
自然语言处理
句类分析
Keywords
eigen chunk structure
hierarchical network of concepts
English-Chinese machine translation
natural language processing
sentence category analysis
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 基于概念基元的句群情景框架抽取研究
被引量:1
11
作者
韦向峰
缪建明
张全
池 毓 焕
机构
中国科学院声学研究所
出处
《微计算机应用》
2010年第4期21-24,共4页
基金
国家973项目"自然语言理解的交互引擎研究"(2004CB318104)
国家科技支撑计划课题"搜索引擎中的语言翻译基础研究"(2007BAH05B02-05)
+2 种基金
中科院声学所知识创新工程项目"句群理解处理理论及其应用"(O654091431)
中国科学院声学研究所"所长择优基金"(GS13SJJ04)
中国科学院青年人才领域前沿项目(O754021432)的资助
文摘
句群的构成要素是领域、情景和背景,领域是核心。领域关联的情景框架主要依据领域句类知识库的描述,从句群语句的语义块中抽取。本文介绍了在语言概念空间中对句群情景框架的概念符号描述,通过匹配整合句群情景框架中语义块的概念约束和句类分析结果中的语义块,给出了从自然语言空间的句群中抽取情景框架要素的方法,并根据实验结果总结了句群情景框架抽取中需要加强和完善的地方。
关键词
句群
情景框架
领域句类
语义块
句类分析
Keywords
Sentence Group, Situation Framework, Sentence Category of Domain, Semantic Chunk, Analysis of Sentence Category
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
题名 利用语句结构信息的机器翻译自动评测初探
12
作者
丁泽亚
张全
缪建明
池 毓 焕
臧翰芬
机构
中国科学院研究生院
中国科学院声学研究所中科信利实验室
出处
《微计算机应用》
2010年第4期59-62,共4页
基金
国家973项目"自然语言理解的交互引擎研究"(2004CB318104)
国家科技支撑计划课题"搜索引擎中的语言翻译基础研究"(2007BAH05B02-05)
+2 种基金
中科院声学所知识创新工程项目"句群理解处理理论及其应用"(O654091431)
中国科学院声学研究所"所长择优基金"(GS13SJJ04)
中国科学院青年人才领域前沿项目(O754021432)的资助
文摘
机器翻译评测对机器翻译有着极其重要的意义,它对翻译系统性能的提高做出了很大的贡献,同时促进了机器翻译的发展。本文在HNC机器翻译策略的基础上,对翻译语料的句类转换和句式转换做了初步的研究,并利用句类转换和句式转换的理论,建立了基于句类信息的自动评测的打分机制。
关键词
机器翻译自动评测
句类转换
句式转换
Keywords
Automatic Evaluation of Machine Translation, Sentence Category Transfer, Sentence Format Transfer
分类号
TP391.2
[自动化与计算机技术—计算机应用技术]
题名 句群情景框架在搜索引擎中的应用
13
作者
李颖
韦向峰
池 毓 焕
机构
装甲兵工程学院科研部
中国科学院声学研究所
出处
《现代计算机(中旬刊)》
2013年第3期3-6,27,共5页
文摘
在搜索引擎中要精确地给出用户需要的答案是一个十分困难的任务。通过比较用户输入和文本之间的语境框架,把概念层次网络理论的语义分析模型应用到搜索引擎中。在概念层次网络理论的基础上,自然语言的词、句和句群可以映射为概念符号、句类和语境框架,通过比较用户输入与网页文本的概念符号和情景框架给出与用户输入语义上相同或相近的答案,这将大大提高下一代搜索引擎的智能性和灵活性。
关键词
自然语言处理
语义分析模型
情景框架
HNC理论
搜索引擎
Keywords
Natural Language Processing
Semantic Parsing Model
Conceptual Structures
HNC Theory
Search Engine
分类号
TP393.4
[自动化与计算机技术—计算机应用技术]