期刊文献+
共找到104篇文章
< 1 2 6 >
每页显示 20 50 100
跨语言信息检索研究进展 被引量:17
1
作者 张俊林 曲为民 +1 位作者 杜林 孙玉芳 《计算机科学》 CSCD 北大核心 2004年第7期16-19,共4页
随着互联网资源的多语言性和用户所使用语言的日益多样性,跨语言信息检索成为越来越重要的研究领域。本文介绍了该领域为解决语言间的翻译障碍而研究的各种解决方法并且对汉英跨语言信息检索所面对的独特难点进行了分析,同时本文对国际... 随着互联网资源的多语言性和用户所使用语言的日益多样性,跨语言信息检索成为越来越重要的研究领域。本文介绍了该领域为解决语言间的翻译障碍而研究的各种解决方法并且对汉英跨语言信息检索所面对的独特难点进行了分析,同时本文对国际上重要的跨语言信息检索系统评测会议进行了简单介绍。 展开更多
关键词 跨语言信息检索 汉英跨语言检索 中文信息处理 受控词汇检索
下载PDF
基于伪相关反馈的跨语言查询扩展 被引量:19
2
作者 吴丹 何大庆 王惠临 《情报学报》 CSSCI 北大核心 2010年第2期232-239,共8页
相关反馈是一种重要的查询重构技术,本文分析了两类相关反馈技术,一是按用户是否参与可分为伪相关反馈和交互式相关反馈,二是按作用于查询的方式可分为查询扩展与检索词重新加权。在此基础上,本文重点探讨了将相关反馈技术应用于跨... 相关反馈是一种重要的查询重构技术,本文分析了两类相关反馈技术,一是按用户是否参与可分为伪相关反馈和交互式相关反馈,二是按作用于查询的方式可分为查询扩展与检索词重新加权。在此基础上,本文重点探讨了将相关反馈技术应用于跨语言信息检索,提出了翻译前查询扩展、翻译后查询扩展、翻译前与翻译后相结合的查询扩展三种方法。最后,本文通过伪相关反馈实验对这三种方法进行了比较,实验结果显示,三种跨语言查询扩展方法都能够有效地提高检索结果的精度,其中翻译后查询扩展方法相对更优越。此外,查询式的长度对不同跨语言查询扩展方法产生着不同程度的影响。 展开更多
关键词 相关反馈 伪相关反馈 跨语言信息检索 查询扩展
下载PDF
跨语言信息检索技术应用与进展研究 被引量:12
3
作者 吴丹 李瑞芬 《情报科学》 CSSCI 北大核心 2006年第9期1435-1440,共6页
本文介绍了跨语言信息检索技术的基本方法和相关的重要国际会议,并对跨语言信息检索的研究热点难点、应用概况、最新的中文的跨语言信息检索系统的研究情况进行了分析,最后提出其发展趋势和应用前景。
关键词 跨语言信息检索 交叉语言信息检索 CLIR 信息检索
下载PDF
重新审视跨语言信息检索 被引量:10
4
作者 闵金明 孙乐 张俊林 《中文信息学报》 CSCD 北大核心 2006年第4期33-40,共8页
阻碍互联网资源在世界范围内广泛共享的一个主要障碍是多语言问题,而跨语言信息检索是解决这个问题的有效方法之一。本文从定义跨语言信息检索系统开始,给出了一个标准的跨语言信息检索系统框架和评价方法,对主流研究方法进行了重新审视... 阻碍互联网资源在世界范围内广泛共享的一个主要障碍是多语言问题,而跨语言信息检索是解决这个问题的有效方法之一。本文从定义跨语言信息检索系统开始,给出了一个标准的跨语言信息检索系统框架和评价方法,对主流研究方法进行了重新审视,进一步明确指出了跨语言信息检索中必须解决的核心问题,最后通过分析研究现状给出了未来可能的重点研究方向。 展开更多
关键词 计算机应用 中文信息处理 跨语言信息检索 未登录词 词义消歧 多语言信息检索
下载PDF
基于英汉机译实现跨语言信息检索 被引量:10
5
作者 张玥杰 郭依昆 +1 位作者 连理 吴立德 《小型微型计算机系统》 CSCD 北大核心 2004年第7期1135-1140,共6页
随着日益增长的大量信息成为可利用的、用户面对查询一个多语种文本集合的情形 ,变得越来越普遍 .这就产生一个非常重要的问题—以一种语言描述的用户查询与以不同语言书写的文本之间的匹配问题 ,也就是一种如何跨越语言界限的问题 ,即... 随着日益增长的大量信息成为可利用的、用户面对查询一个多语种文本集合的情形 ,变得越来越普遍 .这就产生一个非常重要的问题—以一种语言描述的用户查询与以不同语言书写的文本之间的匹配问题 ,也就是一种如何跨越语言界限的问题 ,即跨语言信息检索 (Cross- L anguage Information Retrieval,CL IR) .针对该项任务建立了一个面向英汉的跨语言信息检索系统 ,并以此为基础提交了相关的几组运行结果 .同时 ,结合所构建的汉语 IR系统 ,实现完整的英—汉 CL 展开更多
关键词 信息检索 跨语言信息检索 机器翻译 语料库 语言学资源
下载PDF
跨语言信息检索研究与应用 被引量:9
6
作者 郭华庚 赵英 《现代情报》 北大核心 2008年第9期142-145,共4页
本文在介绍跨语言信息检索(CLIR)的相关概念、实现步骤和方式的基础上,重点阐述CLIR的关键问题和对策以及相关翻译技术,并就其在元搜索引擎中的应用进行探讨,将CLIR的技术平台与元搜索引擎的系统结构相结合,设计出基于CLIR的元搜索引擎... 本文在介绍跨语言信息检索(CLIR)的相关概念、实现步骤和方式的基础上,重点阐述CLIR的关键问题和对策以及相关翻译技术,并就其在元搜索引擎中的应用进行探讨,将CLIR的技术平台与元搜索引擎的系统结构相结合,设计出基于CLIR的元搜索引擎系统模型。 展开更多
关键词 跨语言信息检索 CLIR 元搜索引擎
下载PDF
2004—2014年我国多语言信息组织与检索研究进展与启示 被引量:10
7
作者 司莉 贾欢 《情报学报》 CSSCI 北大核心 2015年第6期662-672,共11页
本文通过对国内近十年多语言信息组织与检索相关领域进行文献调研,发现该领域研究主要涉及多语言信息需求、语言转换策略、语言转换方法、辅助技术方法、信息组织与检索模型、系统评测会议、多语言信息组织及工具、跨语言搜索引擎及信... 本文通过对国内近十年多语言信息组织与检索相关领域进行文献调研,发现该领域研究主要涉及多语言信息需求、语言转换策略、语言转换方法、辅助技术方法、信息组织与检索模型、系统评测会议、多语言信息组织及工具、跨语言搜索引擎及信息检索系统以及多语言信息组织与检索的应用9个方面。笔者认为应该加强用户需求及用户行为研究、加快研发以应用为导向的多语言信息检索平台、注重基于语义的信息组织与检索研究、合并相关性检索结果,提高检索性能、重视将可视化技术用于多语言信息组织与检索系统。 展开更多
关键词 多语言信息组织 多语言信息检索 跨语言信息检索 信息检索技术 综述
下载PDF
国内外记忆工程的历史与现状 被引量:9
8
作者 赵新力 李雪 杨开荆 《徐州师范大学学报(哲学社会科学版)》 北大核心 2009年第1期135-143,共9页
记忆工程是联合国教科文组织发起的对正在逐渐老化、损毁、消失的文献记录,通过使用最佳技术手段进行抢救,从而使人类的记忆更加完整的文化工程。数字化和网络化是记忆工程的重要内容。加拿大记忆没有直接冠以记忆的字眼,但是水平很高;... 记忆工程是联合国教科文组织发起的对正在逐渐老化、损毁、消失的文献记录,通过使用最佳技术手段进行抢救,从而使人类的记忆更加完整的文化工程。数字化和网络化是记忆工程的重要内容。加拿大记忆没有直接冠以记忆的字眼,但是水平很高;美国记忆注重知识的教育和学习的推动;中国的记忆工程起步较晚,与世界先进水平和我国文明古国的地位还有差距,但是北京记忆、台湾记忆和民间记忆工程都非常有特色。在全球一体化的今天,记忆工程的多语言采编和跨语言检索成为了难点。为此,作者研发了动态的多语言解决方案:将页面上输出的语言文字设为语言变量,再根据用户不同的语言环境给语言变量赋予不同的值,从而实现在不同的语言环境下即时输出不同的语言信息。在跨语言信息检索方面,作者采用提问式和受控词表相结合的方案,既可以迅速地完成用户响应,又能够使用受控词表准确地查找信息。这些方案在澳门记忆研究中验证效果良好。 展开更多
关键词 记忆工程 世界文化遗产 WEB平台 多语言变换 跨语言信息检索
下载PDF
跨语言信息检索可视化研究 被引量:10
9
作者 张会平 周宁 陈立孚 《情报科学》 CSSCI 北大核心 2007年第1期134-138,共5页
语言的多样性限制了人们利用信息的自由,也影响了信息价值的充分发挥。因此,跨语言信息检索成为当今的研究热点。本文将信息可视化的相关方法和技术应用到跨语言信息检索领域当中,提出了跨语言信息检索可视化模型,并介绍了一个实例——... 语言的多样性限制了人们利用信息的自由,也影响了信息价值的充分发挥。因此,跨语言信息检索成为当今的研究热点。本文将信息可视化的相关方法和技术应用到跨语言信息检索领域当中,提出了跨语言信息检索可视化模型,并介绍了一个实例——澳门法律信息可视化系统。 展开更多
关键词 跨语言信息检索 可视化 模型 实例
下载PDF
跨语言信息检索理论与应用研究 被引量:9
10
作者 郭宇锋 黄敏 《图书与情报》 CSSCI 2006年第2期79-81,84,共4页
随着互联网的全球化发展趋势,跨语言信息检索日益成为信息检索领域中的重要课题,跨语言检索可用一种提问语言检索出用另一种语言书写的信息。文章主要对跨语言信息检索理论应用研究进行了探讨,并对其在专业领域数据库中的应用提出一种... 随着互联网的全球化发展趋势,跨语言信息检索日益成为信息检索领域中的重要课题,跨语言检索可用一种提问语言检索出用另一种语言书写的信息。文章主要对跨语言信息检索理论应用研究进行了探讨,并对其在专业领域数据库中的应用提出一种思路。 展开更多
关键词 跨语言 信息检索 查询翻译 机器人信息数据库
下载PDF
信息检索模型及其在跨语言信息检索中的应用进展 被引量:7
11
作者 吴丹 齐和庆 《现代情报》 2009年第7期215-221,共7页
信息检索发展中的一个重要理论问题是如何对查询与文档进行匹配,由此形成了不同的信息检索模型。跨语言信息检索是信息检索研究的一个分支,也是近年来的热点问题。本文主要对信息检索模型的研究进展,及其在跨语言信息检索中的应用进展... 信息检索发展中的一个重要理论问题是如何对查询与文档进行匹配,由此形成了不同的信息检索模型。跨语言信息检索是信息检索研究的一个分支,也是近年来的热点问题。本文主要对信息检索模型的研究进展,及其在跨语言信息检索中的应用进展进行分析与综述。 展开更多
关键词 信息检索 跨语言信息检索 检索模型
下载PDF
个性化跨语言信息检索中结果重排序研究 被引量:8
12
作者 周栋 赵文玉 +1 位作者 伍璇 刘建勋 《计算机工程与科学》 CSCD 北大核心 2017年第10期1923-1929,共7页
目前,Web的不断发展使得针对其内容搜索的精确度有所降低,尤其在不同的语言中进行搜索时,情况变得愈发复杂。跨语言信息检索提供了一种跨越语言障碍、获取信息的有效方法。以往的跨语言信息检索研究大多采取以检索系统为中心的研究方法... 目前,Web的不断发展使得针对其内容搜索的精确度有所降低,尤其在不同的语言中进行搜索时,情况变得愈发复杂。跨语言信息检索提供了一种跨越语言障碍、获取信息的有效方法。以往的跨语言信息检索研究大多采取以检索系统为中心的研究方法,并未考虑到用户在翻译和检索过程中发挥的作用。结果重排序技术已经广泛应用于单语个性化信息检索,但是在个性化跨语言信息检索中还较少有相关研究。通过结果重排序技术来研究个性化跨语言信息检索,提出了两种个性化跨语言结果重排序方法。一种基于隐含语义,而另外一种则基于外部语义进行,将首轮搜索结果根据用户的偏好进一步进行处理和优化,使用户感兴趣的内容置于搜索结果列表的前列。在真实用户搜索日志数据上的实验结果表明,结果重排序能够有效提高个性化跨语言信息检索的搜索准确率。 展开更多
关键词 结果重排序 个性化 跨语言信息检索 隐含语义 外部语义
下载PDF
基于跨语言词向量模型的蒙汉查询词扩展方法研究 被引量:7
13
作者 马路佳 赖文 赵小兵 《中文信息学报》 CSCD 北大核心 2019年第6期27-34,共8页
跨语言信息检索指以一种语言为检索词,检索出用另一种或几种语言描述的一种信息的检索技术,是信息检索领域重要的研究方向之一。近年来,跨语言词向量为跨语言信息检索提供了良好的词向量表示,受到很多学者的关注。该文首先利用跨语言词... 跨语言信息检索指以一种语言为检索词,检索出用另一种或几种语言描述的一种信息的检索技术,是信息检索领域重要的研究方向之一。近年来,跨语言词向量为跨语言信息检索提供了良好的词向量表示,受到很多学者的关注。该文首先利用跨语言词向量模型实现汉文查询词到蒙古文查询词的映射,其次提出串联式查询扩展、串联式查询扩展过滤、交叉验证筛选过滤三种查询扩展方法对候选蒙古文查询词进行筛选和排序,最后选取上下文相关的蒙古文查询词。实验结果表明:在蒙汉跨语言信息检索任务中引入交叉验证筛选方法对信息检索结果有很大的提升。 展开更多
关键词 查询扩展 跨语言词向量 信息检索
下载PDF
跨语言信息检索的知识图谱研究 被引量:7
14
作者 赵蓉英 陈瑞 《情报理论与实践》 CSSCI 北大核心 2011年第10期96-100,共5页
在ISI的Web of Science中以"跨语言信息检索"为主题进行检索,利用共引分析、共词分析、信息可视化等方法和技术,借助CiteSpaceⅡ信息可视化软件绘制跨语言信息检索研究领域的文献共引网络图谱、热点词汇图谱以及前沿词汇图谱... 在ISI的Web of Science中以"跨语言信息检索"为主题进行检索,利用共引分析、共词分析、信息可视化等方法和技术,借助CiteSpaceⅡ信息可视化软件绘制跨语言信息检索研究领域的文献共引网络图谱、热点词汇图谱以及前沿词汇图谱,直观地展示和分析不同时期跨语言信息检索领域的代表人物及代表文献,揭示其研究热点,探测其研究前沿及发展趋势。 展开更多
关键词 跨语言信息检索 知识图谱 研究热点 共词分析
原文传递
基于双语主题模型和双语词向量的跨语言知识链接 被引量:6
15
作者 余圆圆 巢文涵 +1 位作者 何跃鹰 李舟军 《计算机科学》 CSCD 北大核心 2019年第1期238-244,共7页
跨语言知识链接是指在描述相同内容的不同语言的在线百科文章之间建立联系。跨语言知识链接可分为候选集选择和候选集排序两部分。首先,把候选集选择问题转换为跨语言信息检索问题,提出一种将标题与关键词相结合从而生成查询的方法,该... 跨语言知识链接是指在描述相同内容的不同语言的在线百科文章之间建立联系。跨语言知识链接可分为候选集选择和候选集排序两部分。首先,把候选集选择问题转换为跨语言信息检索问题,提出一种将标题与关键词相结合从而生成查询的方法,该方法将候选集选择的召回率大幅提高至93.8%;在候选集排序部分,提出一种融合双语主题模型及双语词向量的排序模型,实现了英文维基百科和中文百度百科之间军事领域的跨语言知识链接。实验结果表明,该模型取得了75%的准确率,显著提高了跨语言知识链接的性能,并且提出的方法不依赖于语言特性和领域特性,因此可以很容易地扩展至其他语言和其他领域的跨语言知识链接。 展开更多
关键词 跨语言知识链接 跨语言信息检索 双语主题模型 双语词向量
下载PDF
面向跨语言信息检索的蒙汉语义词典构建初探 被引量:6
16
作者 塔娜 林民 李小庆 《计算机与数字工程》 2010年第8期42-45,54,共5页
以跨语言信息检索需求为背景,介绍了目前语义词典及应用的概况,根据蒙古文互联网发展的现状,从应用需求出发,提出构建面向跨语言信息检索的蒙汉双语语义词典的重要性,并利用构建领域本体的方法给出蒙汉双语计算机术语语义词典的初步设... 以跨语言信息检索需求为背景,介绍了目前语义词典及应用的概况,根据蒙古文互联网发展的现状,从应用需求出发,提出构建面向跨语言信息检索的蒙汉双语语义词典的重要性,并利用构建领域本体的方法给出蒙汉双语计算机术语语义词典的初步设计方法。 展开更多
关键词 语义词典 跨语言信息检索 多语语义词典应用 蒙汉双语语义词典
下载PDF
中英文跨语言信息检索中平行语料库的构建及性能评价研究
17
作者 张宇辉 张雪萍 《情报科学》 北大核心 2024年第3期80-88,共9页
【目的/意义】语料库是一种十分重要跨语言信息检索领域实现翻译的数据来源。在CLIR中对语料库进行性能评测、翻译抽取双语词典和语义消歧等工作,能够满足人们获取知识和信息需求。【方法/过程】本文通过从华尔街日报、金融时报和中国... 【目的/意义】语料库是一种十分重要跨语言信息检索领域实现翻译的数据来源。在CLIR中对语料库进行性能评测、翻译抽取双语词典和语义消歧等工作,能够满足人们获取知识和信息需求。【方法/过程】本文通过从华尔街日报、金融时报和中国香港政府等新闻网站搜集中英文网页,使用开源软件HTML Parser过滤掉非文本内容,经过格式转换,最终生成XML文件,自行建立平行语料库,利用CL-LSI和TDS模型,并对其性能进行评价。【结果/结论】在建立CLIR评测语料库上进行的验证,TDS模型在双语配对检索过程中,能够充分客观的提取语义关联的语义双语主题特征,通过双语配对搜索,CLIR的性能上将超过CL-LSI模型检索效率。【创新/局限】本文针对语料库深入研究,提出一种基于平行语料库中对偶空间的跨语言信息检索模型(TDS),并对给定的主题分别进行中英文语料采集,对获得的关键词应用于TDS模型上,通过双语词项的共现语义信息分析,最终实现在平行语料库的构建和性能评价的目标。不足之处在于双语主题数较少时,翻译的准确率较低,而主题数量逐渐增大时,翻译的准确率更高。 展开更多
关键词 跨语言信息检索 平行语料库 对偶空间 TDS模型 CL-LSI模型
原文传递
少数民族语言信息资源计算机辅助阅读系统架构设计 被引量:6
18
作者 赵生辉 《图书馆理论与实践》 CSSCI 北大核心 2016年第10期72-76,112,共6页
利用信息技术消减语言文字的差异性所带来的沟通障碍是民族地区信息资源管理迫切需要解决的问题。在机器翻译技术之外,计算机辅助跨语言阅读系统(CARS-IRMLC)是民族地区政府公共服务机构为只掌握了国家通用语言服务对象所特别设计的跨... 利用信息技术消减语言文字的差异性所带来的沟通障碍是民族地区信息资源管理迫切需要解决的问题。在机器翻译技术之外,计算机辅助跨语言阅读系统(CARS-IRMLC)是民族地区政府公共服务机构为只掌握了国家通用语言服务对象所特别设计的跨语言阅读环境,该系统以"简化通用语义代码体系"作为多种少数民族语言同义语素的定位、关联、检索的逻辑基础和语义信息转换的逻辑中介。目前CARS-IRMLC在我国民族地区政府机关和图书馆、档案馆、博物馆等公共文化机构具有广泛的应用前景。 展开更多
关键词 少数民族语言 信息资源共享 计算机辅助阅读 跨语言信息检索 机器翻译
下载PDF
基于领域知识图谱和对比学习的汉越跨境民族文本检索方法 被引量:1
19
作者 刘思源 毛存礼 张勇丙 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2023年第4期610-619,共10页
汉越跨境民族文本检索是一类面向领域的跨语言检索任务,旨在以一种语言作为问题查询,检索出另一种语言对应的民族、宗教、文化习俗等跨境民族文档.但在汉越跨境民族文本检索任务中存在大量不常见的领域实体,实体表达形式多样,且中文和... 汉越跨境民族文本检索是一类面向领域的跨语言检索任务,旨在以一种语言作为问题查询,检索出另一种语言对应的民族、宗教、文化习俗等跨境民族文档.但在汉越跨境民族文本检索任务中存在大量不常见的领域实体,实体表达形式多样,且中文和越南语两种语言领域实体没有直接对应关系,导致跨语言领域词对齐和语义对齐困难,进而影响汉越跨境民族文本检索模型性能.基于此,提出一种基于领域知识图谱和对比学习的汉越跨境民族文本检索方法.首先,利用多头注意力机制将汉越跨境民族领域知识图谱融入查询和文档,丰富查询和文档中不常见的跨境民族领域实体信息;然后,引入对比学习来解决跨语言查询和文档的语义表征对齐困难问题;最后,将融入知识图谱的查询和文档表征之间的相似度计算作为相关性分数.实验表明,提出的方法和基线模型相比,性能提高了4.1%. 展开更多
关键词 跨境民族文化 跨境民族知识图谱 跨语言检索 对比学习 信息检索
下载PDF
汉蒙跨语言检索系统设计与实现 被引量:5
20
作者 鲍玉来 白淑霞 +1 位作者 飞龙 王炜华 《情报理论与实践》 CSSCI 北大核心 2017年第4期128-132,144,共6页
[目的/意义]基于汉蒙间跨语言检索系统发展现状,设计并实现通过汉文、传统蒙古文关键词检索西里尔蒙古文文档的系统。[方法/过程]汉蒙跨语言检索系统包括机器翻译和文档检索。在机器翻译方面,实现了基于词典的汉文到西里尔蒙古文机器翻... [目的/意义]基于汉蒙间跨语言检索系统发展现状,设计并实现通过汉文、传统蒙古文关键词检索西里尔蒙古文文档的系统。[方法/过程]汉蒙跨语言检索系统包括机器翻译和文档检索。在机器翻译方面,实现了基于词典的汉文到西里尔蒙古文机器翻译,并实现了基于规则和统计的传统蒙古文到西里尔蒙古文转换;在文档检索方面,基于Lucene全文索引工具包对大量的西里尔蒙古文文档建立索引,并根据向量空间模型对查询和文档的相似度进行排序,得到与查询最为匹配的文档集。[结果/结论]本系统响应速度较快,准确率较高,达到可用水平。一方面促进中国与蒙古国之间的科技、文化、教育的交流;另一方面对我国西里尔蒙古文的研究有一定的促进作用。 展开更多
关键词 跨语言信息检索 信息检索系统 检索方法
原文传递
上一页 1 2 6 下一页 到第
使用帮助 返回顶部