期刊文献+
共找到252篇文章
< 1 2 13 >
每页显示 20 50 100
基于Stacking集成学习的水稻表型组学实体分类研究 被引量:21
1
作者 袁培森 杨承林 +2 位作者 宋玉红 翟肇裕 徐焕良 《农业机械学报》 EI CAS CSCD 北大核心 2019年第11期144-152,共9页
为研究整合水稻表型组学相关知识,系统地建立水稻表型组学知识图谱,通过分布式爬虫框架从国家水稻数据中心网站获取水稻表型组学数据集,并以互动百科为辅助数据源获取水稻表型组学数据。对水稻表型组学数据采用TF-IDF技术结合潜在语义... 为研究整合水稻表型组学相关知识,系统地建立水稻表型组学知识图谱,通过分布式爬虫框架从国家水稻数据中心网站获取水稻表型组学数据集,并以互动百科为辅助数据源获取水稻表型组学数据。对水稻表型组学数据采用TF-IDF技术结合潜在语义模型进行预处理,并对水稻表型组学实体进行人工分类和标注。为实现水稻表型组学实体分类,研究了基于堆叠式两阶段集成学习的分类器组合模型,结合K-近邻算法、支持向量机、随机森林、梯度提升决策树机器学习方法,提升水稻表型组学实体数据分类的性能。研究表明,基于堆叠式两阶段集成学习的分类器组合模型对不同类别的水稻表型组学数据都具有较好的多分类能力,对于不平衡的水稻表型组学数据集,本文方法的分类器组合模型对水稻表型组学数据分类效果最佳,Gene类别的F1为90.47%,总体准确率达80.55%,比支持向量机、K-近邻、随机森林和梯度提升决策树4种基分类器的分类准确率平均高6.78个百分点。 展开更多
关键词 水稻表型组学 实体分类 堆叠式集成学习 知识图谱 潜在语义模型
下载PDF
基于联合神经网络模型的中文医疗实体分类与关系抽取 被引量:15
2
作者 张玉坤 刘茂福 胡慧君 《计算机工程与科学》 CSCD 北大核心 2019年第6期1110-1118,共9页
近年来,医疗健康领域的实体分类与关系抽取引起了广泛关注。以往工作大多采用流水线模型,此类模型容易忽略任务间联系并造成错误传播,而联合学习则能够很好地避免这2个问题。为此,把卷积神经网络与支持向量机、条件随机场相结合,构建了... 近年来,医疗健康领域的实体分类与关系抽取引起了广泛关注。以往工作大多采用流水线模型,此类模型容易忽略任务间联系并造成错误传播,而联合学习则能够很好地避免这2个问题。为此,把卷积神经网络与支持向量机、条件随机场相结合,构建了联合神经网络模型。在此模型基础上,以参数共享的方式,分别通过任务联合、模型联合以及特征联合对实体分类与关系抽取2个任务进行联合学习,在药品说明书语料库中取得了非常不错的效果,实体分类和关系抽取的 F 值分别达到了98.0%和98.3%。实验表明,联合神经网络模型对于实体分类和关系抽取是非常有效的。 展开更多
关键词 实体分类 关系抽取 参数共享 联合学习
下载PDF
基于实体分类的数据库模式匹配方法 被引量:8
3
作者 于波 唐世渭 +1 位作者 张鹏 童云海 《计算机科学》 CSCD 北大核心 2004年第10期157-159,F004,共4页
模式匹配在诸如数据集成、数据仓库、信息共享和计算机网络交换等许多应用领域起到关键作用。目前,自动模式匹配方法也不能解决复杂模式情况下的匹配问题。本文提出一种基于关系模式领域中实体分类的数据库模式匹配方法。该方法通过朴... 模式匹配在诸如数据集成、数据仓库、信息共享和计算机网络交换等许多应用领域起到关键作用。目前,自动模式匹配方法也不能解决复杂模式情况下的匹配问题。本文提出一种基于关系模式领域中实体分类的数据库模式匹配方法。该方法通过朴素贝叶斯学习将实体分为不同的类(子模式),然后以同样的类来匹配子模式之间的模式元素。本方法在复杂模式条件下可有效提高匹配效率,减少匹配工作量,节省人力资源。 展开更多
关键词 数据库模式 模式匹配 子模式 朴素贝叶斯 匹配方法 关系模式 计算机网络 实体分类 关键作用 工作量
下载PDF
基于Att_GCN模型的知识图谱推理算法 被引量:11
4
作者 王红 林海舟 卢林燕 《计算机工程与应用》 CSCD 北大核心 2020年第9期183-189,共7页
针对目前知识图谱推理方法中,传统神经网络方法不能有效考虑实体之间的相关性问题,提出了一种将图卷积神经网络(GCN)与注意力机制(Attention)相结合的知识图谱推理方法。该方法利用注意力机制对知识图谱中的实体与其邻域实体进行相关性... 针对目前知识图谱推理方法中,传统神经网络方法不能有效考虑实体之间的相关性问题,提出了一种将图卷积神经网络(GCN)与注意力机制(Attention)相结合的知识图谱推理方法。该方法利用注意力机制对知识图谱中的实体与其邻域实体进行相关性计算,得到实体特征向量。通过图卷积神经网络的参数共享技术学习实体的所有邻域实体特征。将实体特征和关系特征进行特征融合,得到每个实体的隐性特征向量。通过实体分类实验和链接预测实验进行分析,结果表明,该方法的准确率较传统神经网络方法有进一步提高,为搜索、问答、推荐以及数据集成等领域提供了方法支持。 展开更多
关键词 知识图谱推理 实体分类 链接预测 图卷积神经网络(GCN) Attention机制
下载PDF
信息化转型背景下机关档案分类研究——以《机关档案管理规定》中一级类目划分方法为分析对象 被引量:8
5
作者 孟祥喜 《档案管理》 北大核心 2021年第3期83-85,87,共4页
《机关档案管理规定》作为新形势下机关档案工作必须遵守的部门规章,其一级类目分类逻辑不统一的问题,不但反映了机关档案分类工作的现状,而且导致部分档案内容割裂,档案人员工作量增加。究其原因,既存在为方便电子档案管理及资源共享... 《机关档案管理规定》作为新形势下机关档案工作必须遵守的部门规章,其一级类目分类逻辑不统一的问题,不但反映了机关档案分类工作的现状,而且导致部分档案内容割裂,档案人员工作量增加。究其原因,既存在为方便电子档案管理及资源共享而顾此失彼的主观因素,又体现了客观上机关档案管理中长期存在的分类庸俗化特点。就此提出统一一级类目的分类逻辑,小处着手,优化检索的解决思路。 展开更多
关键词 机关档案 档案分类 实体分类 分类标准 档案信息化
下载PDF
基于中文知识图谱的人物实体识别 被引量:8
6
作者 李薇 肖仰华 汪卫 《计算机工程》 CAS CSCD 北大核心 2017年第3期225-231,240,共8页
分类是知识图谱构建中的一个重要问题,但是目前多数中文百科都采用人工编辑的方式为词条添加分类,耗费人力并且存在漏标和标错等问题。为此,提出一种自动识别百度百科人物领域下全部实体并添加分类的方法。对百度百科词条已有的分类、... 分类是知识图谱构建中的一个重要问题,但是目前多数中文百科都采用人工编辑的方式为词条添加分类,耗费人力并且存在漏标和标错等问题。为此,提出一种自动识别百度百科人物领域下全部实体并添加分类的方法。对百度百科词条已有的分类、属性和副标题进行实体集拓展,使用马尔科夫逻辑网络方法联合推断词条的分类。实验结果表明,与支持向量机和逻辑回归算法相比,该方法在实体识别的精确度和召回率方面性能均有所提升。 展开更多
关键词 实体分类 实体集拓展 马尔科夫逻辑网络 知识图谱 机器学习 联合推断
下载PDF
基于多任务学习的短文本实体链接方法 被引量:6
7
作者 詹飞 朱艳辉 +4 位作者 梁文桐 张旭 欧阳康 孔令巍 黄雅淋 《计算机工程》 CAS CSCD 北大核心 2022年第3期315-320,共6页
实体链接是明确文本中实体指称的重要手段,也是构建知识图谱的关键技术,在智能问答、信息检索等领域中具有重要作用,但由于短文本的上下文语境不丰富、表达不正式、语法结构不完整等特点,现有的短文本实体链接方法准确率较低。提出一种... 实体链接是明确文本中实体指称的重要手段,也是构建知识图谱的关键技术,在智能问答、信息检索等领域中具有重要作用,但由于短文本的上下文语境不丰富、表达不正式、语法结构不完整等特点,现有的短文本实体链接方法准确率较低。提出一种新的短文本实体链接方法,将多任务学习方法引入短文本实体链接过程中,从而增强短文本实体链接方法的效果。在此基础上,构建多任务学习模型,将短文本实体链接作为主任务,并引入实体分类作为辅助任务,促使模型学习到更加通用的底层表达,提高模型的泛化能力,优化模型在短文本实体链接任务中的表现。在CCKS2020测评任务2提供的数据集上的实验结果表明,辅助任务的引入能够缓解短文本实体链接过程中信息不充分的问题,且该多任务学习模型的F值为0.894 9,优于基于BERT编码器的单任务实体链接模型。 展开更多
关键词 短文本实体链接 多任务学习 实体分类 辅助任务 底层表达
下载PDF
利用类型语义表示进行标签降噪的细粒度实体分类
8
作者 席鹏弼 靳小龙 +1 位作者 白硕 程学旗 《高技术通讯》 CAS 北大核心 2024年第2期111-122,共12页
细粒度实体分类(FET)任务的训练数据往往利用已有知识库中的知识通过远程监督方法进行生成,生成过程中不可避免地引入多余的噪音标签。现有考虑训练数据中噪音问题的工作通常只建模训练数据和标注类型的概率分布,对细粒度类型的语义信... 细粒度实体分类(FET)任务的训练数据往往利用已有知识库中的知识通过远程监督方法进行生成,生成过程中不可避免地引入多余的噪音标签。现有考虑训练数据中噪音问题的工作通常只建模训练数据和标注类型的概率分布,对细粒度类型的语义信息学习不足,造成在标注了多个细粒度类型的训练数据上选择了与实体上下文不相关的类型进行模型的学习。本文提出一种利用细粒度类型的语义表示进行标签降噪的细粒度实体分类方法。首先利用训练数据中具有唯一细粒度类型路径的数据学习一部分细粒度类型的表示,进而结合细粒度类型间的关系信息学习其他细粒度类型的表示;其次在标注了细粒度类型的训练数据中选取与实体上下文的语义信息最相似的细粒度类型为目标类型,从数据集中选择Top-K个相似数据进行细粒度类型语义信息的聚合;最后在聚合信息上学习最终的细粒度实体分类模型。实验结果表明,该方法可以有效地从标注了细粒度类型的训练数据中选出与实体上下文的语义信息最相符的细粒度类型,达到提升细粒度实体分类准确率的效果。 展开更多
关键词 实体分类 细粒度类型 多标签降噪 多标签分类
下载PDF
对高校外事档案管理工作的思考 被引量:6
9
作者 邸家琴 《兰台内外》 2007年第5期5-6,共2页
高校外事档案管理乃是高校档案管理实体分类中的一类。高校外事档案是指学校在与外国团体或个人在学术研究、科技合作、人才交流、友好往来等活动中直接形成的具有保存价值的文字、图表及声像载体材料。由于高校外事档案自身固有的特殊... 高校外事档案管理乃是高校档案管理实体分类中的一类。高校外事档案是指学校在与外国团体或个人在学术研究、科技合作、人才交流、友好往来等活动中直接形成的具有保存价值的文字、图表及声像载体材料。由于高校外事档案自身固有的特殊性,外事档案的管理已越来越受到各方面的高度重视。 展开更多
关键词 档案管理工作 外事 高校 实体分类 学术研究 科技合作 人才交流 保存价值
下载PDF
KBLCC:融合实体关键字特征的医疗领域实体分类方法 被引量:4
10
作者 王星予 吕学强 游新冬 《小型微型计算机系统》 CSCD 北大核心 2022年第1期27-34,共8页
实体抽取是自然语言处理中的一项基础任务,基于实体抽取的医疗领域实体分类是医疗知识图谱构建的基础,现有的实体抽取方法鲜有基于字符级的特征.文中提出了KBLCC方法,一种融合实体关键字特征的医疗领域实体分类方法.通过对医疗领域文本... 实体抽取是自然语言处理中的一项基础任务,基于实体抽取的医疗领域实体分类是医疗知识图谱构建的基础,现有的实体抽取方法鲜有基于字符级的特征.文中提出了KBLCC方法,一种融合实体关键字特征的医疗领域实体分类方法.通过对医疗领域文本的语言特点进行分析与总结,发现医疗领域实体通常包含一些明显的关键字特征,能够辅助实体分类任务.融合实体关键字特征构建了BERT-BILSTM-CNN-CRF混合模型对医疗领域实体进行抽取,并将医疗实体分为检验指标、疾病、症状这三大类.实验结果表明,使用KBLCC模型进行医疗领域实体分类能够提高实验效果,准确率、召回率和F1值分别达到89.38%、92.46%和90.89%. 展开更多
关键词 实体抽取 实体分类 KBLCC 关键字 混合模型
下载PDF
融合生成式模型的知识增强实体链指方法
11
作者 乔胤博 杨志豪 林鸿飞 《广西科学》 CAS 北大核心 2023年第1期61-70,共10页
未链接实体分类是实体链指(Entity Linking,EL)任务中的重要研究内容之一。现有方法存在上下文语义信息不充分、分类准确率低等问题,导致实体链指任务表现不佳。本研究提出一种融合生成式模型的知识增强实体链指方法。该方法将实体链指... 未链接实体分类是实体链指(Entity Linking,EL)任务中的重要研究内容之一。现有方法存在上下文语义信息不充分、分类准确率低等问题,导致实体链指任务表现不佳。本研究提出一种融合生成式模型的知识增强实体链指方法。该方法将实体链指分为两个子模块,即候选实体排序模块和未链接实体分类模块。本研究基于高精度的候选实体排序模块,获得高质量的知识扩展信息,并对未链接实体分类任务进行知识增强;针对未链指实体提及的分类问题,提出一套生成式框架,该框架能够取得超过基线模型的性能。本研究方法在2020年全国知识图谱与语义计算大会(CCKS2020)评测任务二的中文短文本实体链指数据集上取得了目前最佳性能(整体F值为91.76%),证明知识增强和生成式框架的引入能提高模型的泛化能力,缓解未链接实体分类中的信息不充分问题。 展开更多
关键词 生成式 实体链指 知识增强 实体分类 实体排序
下载PDF
结合近邻分析的小样本命名实体识别方法
12
作者 江汀莹 线岩团 王红斌 《现代电子技术》 2023年第19期88-94,共7页
小样本命名实体识别通过少量标注样本构建可应用于未知类别的实体识别模型,是命名实体识别的新兴研究方向。小样本实体识别具有实体边界检测不准确以及训练数据数量少、可见实体类别少的特点,导致模型性能表现不佳,模型极易过拟合。针... 小样本命名实体识别通过少量标注样本构建可应用于未知类别的实体识别模型,是命名实体识别的新兴研究方向。小样本实体识别具有实体边界检测不准确以及训练数据数量少、可见实体类别少的特点,导致模型性能表现不佳,模型极易过拟合。针对这个问题,提出结合近邻分析的小样本命名实体识别方法,将命名实体识别任务分成实体范围检测和实体类别预测两部分完成,其中实体范围检测部分使用片段打分的方法,实体类别预测部分使用近邻分析的方法。此外,为了缓解训练数据少带来的模型过拟合问题,还在实体特征的隐空间上进行Mixup数据增强以扩增伪样本。实验结果表明,所提出的结合近邻分析的小样本命名实体识别方法有效地提高了小样本实体识别的性能。 展开更多
关键词 小样本 实体识别 实体分类 过拟合 近邻分析算法 数据增强 泛化性能 深度神经网络
下载PDF
基于类型间关系学习的细粒度实体分类
13
作者 席鹏弼 靳小龙 白硕 《高技术通讯》 CAS 2023年第3期231-242,共12页
细粒度实体分类旨在为构建知识图谱过程中所抽取的实体或实体提及确定一个或多个层次化、细粒度的类型,以便更好地为下游任务提供支持。现有细粒度实体分类方法存在细粒度分类精度不高、部分实体难以有效分类的问题。另一方面,直观来说... 细粒度实体分类旨在为构建知识图谱过程中所抽取的实体或实体提及确定一个或多个层次化、细粒度的类型,以便更好地为下游任务提供支持。现有细粒度实体分类方法存在细粒度分类精度不高、部分实体难以有效分类的问题。另一方面,直观来说,掌握细粒度类型之间的语义区别有助于实体的细粒度分类。但由于已有面向该任务的数据集缺少可用于学习细粒度类型间语义差别的数据,因此目前没有将细粒度类型之间的语义区别应用于细粒度实体分类的研究。为此,本文提出一种基于Freebase知识库学习细粒度类型语义区别的方法,并将学习到的语义信息应用在细粒度实体分类任务中。具体地,利用SPARQL从Freebase中获取类型之间的关系数据,据此学习细粒度实体类型之间的语义区别信息,进而结合实体提及及其上下文的文本信息进行细粒度实体分类。实验表明,本文提出的方法可以有效学习细粒度类型之间的语义区别,能够达到提升细粒度实体分类准确率的效果。 展开更多
关键词 实体分类 细粒度类型 知识图谱构建 关系学习 多标签分类
下载PDF
档案实体分类与档案信息分类的比较及成因探讨 被引量:2
14
作者 鲁汉蓉 《西藏民族学院学报(哲学社会科学版)》 2003年第4期90-92,共3页
档案实体分类与档案信息分类具有不统一性,二者并存于档案管理过程中,这是档案管理工作的特点之一。本文从分类对象、思路、结果等方面对二者进行比较,并分析了两种分类体系并存的原因。
关键词 档案 实体分类 信息分类 分类 管理机制
下载PDF
谈谈档案的两种分类 被引量:3
15
作者 冯惠玲 《图书情报知识》 CSSCI 北大核心 1989年第3期56-58,共3页
档案的两种分类是档案的实体分类和档案的信息分类,这是档案管理与其它文献管理的重要区别之一。一、两种分类的不同涵义和形成过程对档案进行两种分类,人们提法不一,诸如“分类整理”与“分类编目”、“档案分类”与“档案检索分类”、“
关键词 档案 实体分类 信息分类 分类
下载PDF
机关档案实体一级类目分类研究——兼对《机关档案管理规定》一级类目划分方法商榷 被引量:3
16
作者 孟祥喜 《档案学研究》 CSSCI 北大核心 2021年第2期30-35,共6页
《机关档案管理规定》(以下简称《规定》)中一级类目划分存在分类逻辑不统一的问题,这一问题不但反映了当前机关档案分类工作的现状,而且带来了分类混乱、内容割裂、工作量增加、误导相关规章标准的分类整理方法制定等问题。究其原因,... 《机关档案管理规定》(以下简称《规定》)中一级类目划分存在分类逻辑不统一的问题,这一问题不但反映了当前机关档案分类工作的现状,而且带来了分类混乱、内容割裂、工作量增加、误导相关规章标准的分类整理方法制定等问题。究其原因,既存在为方便电子档案管理及资源共享而顾此失彼的主观因素,又体现了客观上机关档案管理中长期存在的分类庸俗化倾向,就此提出统一一级类目的分类逻辑,小处着手,优化检索的解决思路。 展开更多
关键词 机关档案 档案分类 实体分类 分类标准
原文传递
对《高等学校档案实体分类法》的实践反思与修订建议 被引量:4
17
作者 晋平 《档案管理》 北大核心 2010年第6期40-42,共3页
在《高等学校档案实体分类法》修订之际,本文结合实践经验与教训,总结分析了"分类法"实施中的问题与对策,对进一步完善高校档案实体分类方法提出建议。
关键词 高校档案 实体分类 修订意见
下载PDF
基于机器学习的比特币实体分类方法研究综述
18
作者 秦璐 李易 +1 位作者 林仙铖 罗自强 《海南师范大学学报(自然科学版)》 CAS 2023年第1期38-45,52,共9页
比特币是一种去中心化的电子加密货币,交易地址的匿名性隐藏了交易用户的真实身份,导致比特币被一些不法分子应用于各类非法活动中。通过分析已知实体的交易属性和行为特征,利用机器学习的方法可以对未知实体的交易类别进行预测。本文... 比特币是一种去中心化的电子加密货币,交易地址的匿名性隐藏了交易用户的真实身份,导致比特币被一些不法分子应用于各类非法活动中。通过分析已知实体的交易属性和行为特征,利用机器学习的方法可以对未知实体的交易类别进行预测。本文首先概述了比特币实体类别及分类标签的来源;其次,分析和归纳了基于机器学习的比特币实体分类方法;最后,分析了现阶段面临的主要问题,并对未来的发展趋势进行了展望。 展开更多
关键词 区块链 比特币 机器学习 实体分类
下载PDF
基于全连接神经网络的基础测绘实体分类方法
19
作者 苏海滨 《测绘技术装备》 2023年第2期68-73,共6页
由于基础测绘实体包含建筑物、道路、植被、水系等多种类型,因此在分类时需采集的数据较多。为了达到理想的分类效果,本文提出基于全连接神经网络的基础测绘实体分类方法。首先,通过基础测绘实体采集融合多源数据,实现不同层次地理实体... 由于基础测绘实体包含建筑物、道路、植被、水系等多种类型,因此在分类时需采集的数据较多。为了达到理想的分类效果,本文提出基于全连接神经网络的基础测绘实体分类方法。首先,通过基础测绘实体采集融合多源数据,实现不同层次地理实体的数据集成;其次,基于全连接神经网络检测实体影像边缘,将边缘构成特征线,划分不同类型实体特征;再次,分割实体结构提取特征,使属性相同的点从属于相同的实体结构;最后,建立基础测绘实体分类模型,定义各类别语义准则,输出分类结果。试验结果表明,本文所提方法具有较好的分割效果,能提取可区分度较低的特征,在基础测绘实体分类中优势明显,具有一定的可行性。 展开更多
关键词 全连接神经网络 基础测绘 特征点 实体分类
下载PDF
基于BERT-CNN的数据标准化方法
20
作者 周冰洁 王培培 +2 位作者 王鑫 郑昊 查达仁 《扬州大学学报(自然科学版)》 CAS 北大核心 2023年第1期70-73,共4页
针对复杂多源的非结构化数据,提出一种数据标准化方法,在抽取信息的同时,能将不同来源的数据转换为统一的表示形式.首先,对文本进行词性标注等预处理,提取出需要进一步识别类型的实体;其次,使用语言表征模型对文本信息进行向量表示;最后... 针对复杂多源的非结构化数据,提出一种数据标准化方法,在抽取信息的同时,能将不同来源的数据转换为统一的表示形式.首先,对文本进行词性标注等预处理,提取出需要进一步识别类型的实体;其次,使用语言表征模型对文本信息进行向量表示;最后,通过基于注意力机制的卷积神经网络对抽取出的实体进行分类,以适应不同应用场景的分类标准.实验结果验证了该模型的有效性. 展开更多
关键词 数据标准化 非结构化数据 实体分类 注意力机制 卷积神经网络
下载PDF
上一页 1 2 13 下一页 到第
使用帮助 返回顶部