期刊文献+
共找到13篇文章
< 1 >
每页显示 20 50 100
关联数据及DBpedia实例分析 被引量:35
1
作者 白海燕 《现代图书情报技术》 CSSCI 北大核心 2010年第3期33-39,共7页
基于关联数据的基本原则和发布方法,分析介绍DBpedia的实现技术:通过对WikiText格式数据进行语法解析和流程控制,实现对自由文本进行的结构化数据抽取和RDF表达,并基于URI参引、SPARQL查询和RDF文件转存等多种方法,实现多样化的Web数据... 基于关联数据的基本原则和发布方法,分析介绍DBpedia的实现技术:通过对WikiText格式数据进行语法解析和流程控制,实现对自由文本进行的结构化数据抽取和RDF表达,并基于URI参引、SPARQL查询和RDF文件转存等多种方法,实现多样化的Web数据获取;采用基于属性和基于模式的自动关联算法,与众多数据集之间实现关联。 展开更多
关键词 语义网 关联数据 dbpedia
原文传递
国内外主要本体库比较分析研究 被引量:14
2
作者 白如江 于晓繁 王效岳 《现代图书情报技术》 CSSCI 北大核心 2011年第1期3-13,共11页
介绍4种国内外主要的通用本体库W ordNet、DBped ia、Cyc、HowNet和两个比较成功的专业领域本体库生物医学和企业领域本体库,从描述语言、存储方式、查询语言、构建平台和应用领域5个方面分别对4种通用本体库和领域本体库进行比较分析,... 介绍4种国内外主要的通用本体库W ordNet、DBped ia、Cyc、HowNet和两个比较成功的专业领域本体库生物医学和企业领域本体库,从描述语言、存储方式、查询语言、构建平台和应用领域5个方面分别对4种通用本体库和领域本体库进行比较分析,为国内外学者在本体库及其应用研究方面提供帮助。 展开更多
关键词 本体库 WORDNET dbpedia Cyc HOWNET 生物医学本体企业 管理本体
原文传递
DBpedia及其典型应用 被引量:14
3
作者 朝乐门 张勇 邢春晓 《现代图书情报技术》 CSSCI 北大核心 2011年第3期80-87,共8页
基于文献研究和案例分析,提炼出DBpedia的6个特征,即大规模人机协同、语义Web知识组织、跨领域知识库、多语言知识库、实时动态知识库和关联数据中枢。在此基础上,探讨DBpedia的4种典型应用(用户界面、语义标注、数据挖掘、跨域共享与服... 基于文献研究和案例分析,提炼出DBpedia的6个特征,即大规模人机协同、语义Web知识组织、跨领域知识库、多语言知识库、实时动态知识库和关联数据中枢。在此基础上,探讨DBpedia的4种典型应用(用户界面、语义标注、数据挖掘、跨域共享与服务)与6个基本特征之间的内在联系。 展开更多
关键词 dbpedia 典型应用 关联数据 语义WEB
原文传递
基于图方法的命名实体消歧 被引量:7
4
作者 杨光 刘秉权 刘铭 《智能计算机与应用》 2015年第5期52-55,共4页
名实体歧义是机器对自然语言进行理解时经常遇到的问题,为使机器能够正确地分析自然语言文本,对名实体消除歧义亟待解决。近年来,随着Wikipedia等语义知识库的出现,大量基于知识库的消歧方法被提出。命名实体消歧的任务是将文本中具有... 名实体歧义是机器对自然语言进行理解时经常遇到的问题,为使机器能够正确地分析自然语言文本,对名实体消除歧义亟待解决。近年来,随着Wikipedia等语义知识库的出现,大量基于知识库的消歧方法被提出。命名实体消歧的任务是将文本中具有多个含义的实体指称去除歧义,并将其链接到知识库中的唯一实体。本文采用DBpedia作为知识库,基于图的方法进行实体消歧。 展开更多
关键词 实体消歧 图方法 知识库 dbpedia
下载PDF
关联数据驱动的查询扩展技术研究 被引量:6
5
作者 田野 杨眉 +1 位作者 祝忠明 张静蓓 《图书情报工作》 CSSCI 北大核心 2015年第4期122-128,共7页
[目的/意义]针对当前查询扩展技术面临的瓶颈,提出一种关联数据驱动的查询扩展方法,改善检索系统的查全率、查准率。[方法/过程]将扩散激活理论应用到关联数据集中,使得在输入查询词搜索潜在语义实体时,对提取的查询词的语义特征在知识... [目的/意义]针对当前查询扩展技术面临的瓶颈,提出一种关联数据驱动的查询扩展方法,改善检索系统的查全率、查准率。[方法/过程]将扩散激活理论应用到关联数据集中,使得在输入查询词搜索潜在语义实体时,对提取的查询词的语义特征在知识库中进行有特定机制的扩散和激活,最后对这些语义关联的候补概念进行收集,并利用推理机制进行筛选,得到更优的概念集。[结果/结论]该方法能有效提高检索系统的查全率、查准率,证明了本文提出的技术的可行性、有效性。 展开更多
关键词 查询扩展 关联数据 激活扩散模型 dbpedia WORDNET
原文传递
基于DBpedia的领域本体进化方法研究 被引量:5
6
作者 刘紫玉 杨雨佳 +1 位作者 张晓明 瞿英 《情报杂志》 CSSCI 北大核心 2017年第6期160-166,共7页
[目的/意义]领域本体是规范描述和语义化组织领域核心知识的模型,领域本体需要随着领域知识的变化而变化,自动化或半自动化的进化方法是领域本体动态更新的一个研究热点。在领域本体进化的相关研究中,大部分是基于非结构化的领域语料库... [目的/意义]领域本体是规范描述和语义化组织领域核心知识的模型,领域本体需要随着领域知识的变化而变化,自动化或半自动化的进化方法是领域本体动态更新的一个研究热点。在领域本体进化的相关研究中,大部分是基于非结构化的领域语料库,使用中文或英文分词工具来进行模式匹配实现本体进化,此种方法相对复杂,该研究提出利用结构化的数据作为基础实现本体进化。[方法/过程]DBpedia是从维基百科中提取的综合而庞大的结构化数据集,其数据结构能有效的和本体数据对接,为领域本体的半自动进化提供了一种可行的数据获取途径。采用DBpedia结构化的数据集作为领域本体进化源,提出了基于DBpedia的领域本体进化方法,主要步骤包括DBpedia信息抽取和优化、获取进化信息、本体的变更操作和一致性检查。[结果 /结论]以高速铁路动车组领域本体为实验对象,实现了动车组领域中英文本体的同时进化,该方法将为基于DBpedia的中文领域本体进化提供借鉴作用。 展开更多
关键词 领域本体 本体进化 dbpedia 动车组领域
下载PDF
基于本体和语义距离的DBpedia领域知识抽取方法 被引量:4
7
作者 张志申 王会勇 +2 位作者 张晓明 艾青 孟明明 《现代电子技术》 北大核心 2018年第13期128-132,137,共6页
关联开放数据(LOD)中蕴藏着大量不同领域的知识,但是目前抽取其中特定领域知识的方法大多需要人工参与。为了能自动地抽取领域知识,提出根据领域本体抽取DBpedia中特定领域知识的方法。使用领域本体、Wikipedia和主题提取算法获得用于... 关联开放数据(LOD)中蕴藏着大量不同领域的知识,但是目前抽取其中特定领域知识的方法大多需要人工参与。为了能自动地抽取领域知识,提出根据领域本体抽取DBpedia中特定领域知识的方法。使用领域本体、Wikipedia和主题提取算法获得用于抽取领域知识的种子关键词集。在直接链接子图语义距离算法中,添加能够代表边指向性权值的参数,用于领域知识的抽取,并基于本体和字符串相似度比较的筛选策略对抽取的知识进行筛选。通过实验表明,该方法不仅能够获得较好的抽取效果,而且不需要人为地挑选关键词和参与筛选过程,极大地节省了时间和精力。 展开更多
关键词 dbpedia 领域本体 直接链接子图语义距离算法 知识抽取 抽取策略 筛选
下载PDF
基于关联数据的集成信息平台语义化实现方法研究 被引量:4
8
作者 汤怡洁 张敏 丁晓芹 《现代情报》 CSSCI 北大核心 2016年第6期66-73,共8页
首先,针对关联数据的国内外发展现状和相关技术进展进行研究,并且调研了目前主要的关联数据集,并深入研究了DBPedia数据集、DBLP数据集和CORDIS数据集。接着基于中国科学院集成信息平台CASIIP,同时结合中国科学院研究所群组集成知识平... 首先,针对关联数据的国内外发展现状和相关技术进展进行研究,并且调研了目前主要的关联数据集,并深入研究了DBPedia数据集、DBLP数据集和CORDIS数据集。接着基于中国科学院集成信息平台CASIIP,同时结合中国科学院研究所群组集成知识平台项目一期、二期的建设情况,充分分析平台语义化扩展方面的需求和可行性,并且在关联数据的基础上提出了CASIIP语义化的扩展解决方案。最后在CASIIP的内容管理组件、搜索组件和综合资源管理组件中利用DBPedia的lookup和Spotlight分别实现了组件语义化扩展。实验证明,该方法合理可行,为CASIIP实现从基础内容发布建站平台软件到语义化集成资源的平台软件发展奠定了基础。 展开更多
关键词 关联数据 IIP 信息平台 语义化 dbpedia 关联数据集
下载PDF
DBpedia Spotlight上的命名实体识别优化 被引量:1
9
作者 付宇新 王鑫 +1 位作者 冯志勇 徐强 《计算机科学与探索》 CSCD 北大核心 2017年第7期1044-1055,共12页
命名实体识别任务能够搭建知识库与自然语言之间的桥梁,为关键字提取、机器翻译、主题检测与跟踪等研究工作提供支撑。通过对目前命名实体识别领域的相关研究进行分析,提出了一套通用的命名实体识别优化方案。首先,设计并实现了利用候... 命名实体识别任务能够搭建知识库与自然语言之间的桥梁,为关键字提取、机器翻译、主题检测与跟踪等研究工作提供支撑。通过对目前命名实体识别领域的相关研究进行分析,提出了一套通用的命名实体识别优化方案。首先,设计并实现了利用候选集的增量式扩展方法,降低了对训练集的依赖性;其次,通过点互信息率对实体上下文进行特征选择,大幅度降低了上下文空间,同时提高了标注性能;最后,提出了基于主题向量的二次消歧方法,进一步增强了标注准确率。通过在广泛使用的开源命名实体识别系统DBpedia Spotlight上进行多种比较实验,验证了所提优化方案与已有系统相比具有较优的性能指标。 展开更多
关键词 命名实体识别 链接数据 dbpedia SPOTLIGHT
下载PDF
面向中文用户生成内容的关联数据混搭系统模型及应用 被引量:1
10
作者 张自然 杨东升 张瑞娜 《图书馆学研究》 CSSCI 2017年第8期51-58,共8页
中文用户生成内容大量产生,其随意性、不规范及含义模糊等特征带来信息组织与利用的难题。文章构建面向中文用户生成内容的关联数据混搭系统模型,利用数据层、查询层、整合层和应用层功能,将豆瓣网电影评论信息与DBPedia数据集、Linked... 中文用户生成内容大量产生,其随意性、不规范及含义模糊等特征带来信息组织与利用的难题。文章构建面向中文用户生成内容的关联数据混搭系统模型,利用数据层、查询层、整合层和应用层功能,将豆瓣网电影评论信息与DBPedia数据集、LinkedMDB数据集进行有效关联。实验表明该系统能够利用关联开放数据减少用户生成内容的含混和不确定,帮助用户获取丰富的外链数据。 展开更多
关键词 用户生成内容 关联数据 混搭 dbpedia 中文
原文传递
基于DBpedia的动画情节规划
11
作者 杜艮魁 《软件导刊》 2019年第11期90-94,99,共6页
手机动画自动生成系统将中文短信作为输入,经过信息抽取、情节规划、定量计算和实时渲染之后,生成一段可以表现短信内容的动画。其中情节规划决定了动画对短信内容的表现方式,是动画系统的重要组成部分。当前动画系统情节规划模块仅仅... 手机动画自动生成系统将中文短信作为输入,经过信息抽取、情节规划、定量计算和实时渲染之后,生成一段可以表现短信内容的动画。其中情节规划决定了动画对短信内容的表现方式,是动画系统的重要组成部分。当前动画系统情节规划模块仅仅基于动画课题组建立的动画本体库,实体及实体关系较少,能够进行的情节规划十分有限。为丰富情节规划可使用的语义信息,构建了DBpedia数据集与动画本体库之间的实体链接,并在情节规划过程中以DBpedia数据集作为背景知识,实现基于DBpedia的动画情节规划。实验表明,平均每条短信获取备选场景的数量提升了33%,获取短信相关模型的数量提升了37%,基于DBpedia的情节规划能够显著提高情节规划的多样性。 展开更多
关键词 动画自动生成 情节规划 实体链接 dbpedia 背景知识
下载PDF
DBpedia本体知识库关键技术及应用展望 被引量:2
12
作者 邢美凤 《图书馆理论与实践》 CSSCI 北大核心 2013年第1期43-46,共4页
从语义网本体知识库的角度,分析了DBpedia知识库从维基百科中抽取内容的关键技术,包括抽取方法、内容和特点。在此基础上,论述了DBpedia应用于数字图书馆Web和自然语言处理两个方面的前景。
关键词 dbpedia 知识库 维基百科
下载PDF
知识社区环境下的DBpedia研究 被引量:1
13
作者 李秀敏 张久珍 《图书馆》 CSSCI 北大核心 2013年第4期27-30,共4页
DBpedia利用知识抽取框架从维基百科中抽取信息,并通过语义网的RDF、本体等技术描述资源,从而形成一个跨领域、多语言、大规模的庞大数据集。文章分析了DBpedia的信息组织及其特点,结合实例介绍了该数据集可以建立的应用,并分析了DBpedi... DBpedia利用知识抽取框架从维基百科中抽取信息,并通过语义网的RDF、本体等技术描述资源,从而形成一个跨领域、多语言、大规模的庞大数据集。文章分析了DBpedia的信息组织及其特点,结合实例介绍了该数据集可以建立的应用,并分析了DBpedia的意义。 展开更多
关键词 dbpedia 知识社区 关联数据
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部