-
题名跨语种信息检索中的文本比较及结果生成算法
被引量:1
- 1
-
-
作者
吴晨
缪建明
张全
-
机构
中国科学院研究生院
中国科学院声学研究所北京
中国科学院声学研究所
-
出处
《计算机工程与应用》
CSCD
北大核心
2005年第29期11-15,共5页
-
基金
国家973基础研究规划项目:自然语言理解的交互引擎研究(编号:2004CB318104)
中科院声学所知识创新工程项目:HNC语言知识处理理论及技术
-
文摘
提出了一种基于语义的跨语种信息检索中的文本比较及结果生成的算法,算法从语义入手,以形式化的语境单元框架结构来表示被检索的内容和检索请求,它从文本语义表示的三个方面:领域(静态范畴)、情景(动态范畴)、背景(参照)来对检索请求和被检索文档数据之间的语义相关度进行计算和排序,根据建立在语境单元框架上的语义符号间的匹配和生成机制来实现文本检索。与传统CLIR技术相比,它可以避免以语言空间中的词语作为检索的中间量而带来的语义模糊。实验证明,这一算法在解决基于语义的跨语种信息检索中的文本比较和结果生成上具有良好的处理能力。
-
关键词
跨语种信息检索
语境单元框架
领域情景
背景
语义相关度
-
Keywords
Cross-Language Information Retrieval,sentences group unit frameworks,domain,situation,background,wordsemantic relativity
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于语言概念空间的跨语种信息检索模型
- 2
-
-
作者
吴晨
张全
缪建明
-
机构
中国科学院研究生院
中国科学院声学研究所
-
出处
《计算机工程》
EI
CAS
CSCD
北大核心
2006年第18期9-11,19,共4页
-
基金
国家"973"计划基金资助项目"自然语言理解的交互引擎研究"(2004CB318104)
中科院声学所知识创新工程基金资助项目"HNC语言知识处理理论及技术"
-
文摘
提出了一种基于语言概念空间的跨语种信息检索模型,该模型以建立在语言概念空间中的形式化语境单元框架表示处理所需的中间信息,通过用以描述语境单元框架的语义符号间的匹配和生成机制来实现文本的跨语种检索,有助于避开用形式多样的具体语言作为处理中介存在的模糊消解问题。实验证明,这一模型显著改善了检索系统的性能。
-
关键词
跨语种信息检索
语言概念空间
语境单元框架
-
Keywords
Cross-language information retrieval
Language concept space
Sentences group unit framework
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-