期刊文献+
共找到29篇文章
< 1 2 >
每页显示 20 50 100
写钞本时代异质性文本的发现与研究 被引量:28
1
作者 程苏东 《北京大学学报(哲学社会科学版)》 CSSCI 北大核心 2016年第2期148-157,共10页
写钞本时代文本生成的主体可以区分为四种角色:作者、述者、钞者和写手,其中作者是文本的生成者,写手是文本的传播者,而述者和钞者则可兼具两种功能。辨识此四种角色对于文本所拥有的不同权利,特别是钞者如何整合多元文本来源,生成具有&... 写钞本时代文本生成的主体可以区分为四种角色:作者、述者、钞者和写手,其中作者是文本的生成者,写手是文本的传播者,而述者和钞者则可兼具两种功能。辨识此四种角色对于文本所拥有的不同权利,特别是钞者如何整合多元文本来源,生成具有"异质性"的衍生型文本,对于我们了解写钞本时代文本的生成过程及其深层结构、甚至文学性因素具有重要的启示意义。要言之,正面认识"钞者"在异质性文本生成过程中的创造性,在方法论层面探索建立"钞者研究"的范式,是推进写钞本时代文本研究走向深入的关键。 展开更多
关键词 写本 钞本 异质性文本 作者
原文传递
基于异构数据的颠覆性技术识别研究——以智能制造装备领域为例 被引量:16
2
作者 马永红 孔令凯 +2 位作者 林超然 杨晓萌 倪惠莉 《现代情报》 CSSCI 2022年第7期92-104,共13页
[目的/意义]颠覆性技术研发作为国家战略,如何准确识别颠覆性技术,对于国家和企业把握技术先机,抢占技术制高点意义重大。[方法/过程]本文结合专利文献数据,利用LDA主题模型实现数据降维,提取技术主题,从技术主题成长性、融合性、创新... [目的/意义]颠覆性技术研发作为国家战略,如何准确识别颠覆性技术,对于国家和企业把握技术先机,抢占技术制高点意义重大。[方法/过程]本文结合专利文献数据,利用LDA主题模型实现数据降维,提取技术主题,从技术主题成长性、融合性、创新性、突破性4个特征识别候选颠覆性技术;在此基础上,结合网页新闻数据,测算候选颠覆性技术主题与网页新闻数据主题之间的匹配度,分析技术的市场属性,准确识别颠覆性技术。[结果/结论]本文以智能制造装备领域为例,通过实证研究得到“智能数字控制”及“智能数据采集系统”是智能制造装备领域的颠覆性技术。 展开更多
关键词 异构数据 文本挖掘 颠覆性技术 技术识别
下载PDF
异构文本数据转换中XML解析方法对比研究 被引量:12
3
作者 何卓桁 刘志勇 +2 位作者 李璐 李长明 张琳 《计算机工程》 CAS CSCD 北大核心 2020年第7期286-293,299,共9页
对异构文本数据转换过程中解析XML文本的DOM、SAX、JDOM、DOM4J方法进行对比研究,以解析时间、内存堆占用空间、CPU占用率为评价指标来判定4种解析方法的优劣。该评价方法的优势在于当数据量或数据属性发生变化时,4种解析方法对评价结... 对异构文本数据转换过程中解析XML文本的DOM、SAX、JDOM、DOM4J方法进行对比研究,以解析时间、内存堆占用空间、CPU占用率为评价指标来判定4种解析方法的优劣。该评价方法的优势在于当数据量或数据属性发生变化时,4种解析方法对评价结果的影响仍具有良好的区分度。通过对10份Web日志异构文本数据转换后的XML数据集进行比较,实验结果表明,当数据量增大且以解析时间为重点时,DOM4J解析方法优于其他3种解析方法,当以空间占用为重点时,SAX解析方法优于其他3种解析方法。 展开更多
关键词 异构文本 XML解析 数据结构转换 时间复杂度 空间复杂度
下载PDF
基于异构图表示的中医电子病历分类方法
4
作者 王楷天 叶青 程春雷 《计算机应用》 CSCD 北大核心 2024年第2期411-417,共7页
中医(TCM)电子病历由于结构复杂多样与诊疗术语不规范的特点导致数据挖掘难度大、利用率低、难以抽取到有效信息。针对上述问题,提出基于LERT(Linguistically-motivated bidirectional Encoder Representation from Transformer)预训练... 中医(TCM)电子病历由于结构复杂多样与诊疗术语不规范的特点导致数据挖掘难度大、利用率低、难以抽取到有效信息。针对上述问题,提出基于LERT(Linguistically-motivated bidirectional Encoder Representation from Transformer)预训练模型与图卷积网络(GCN)并用异构图表示的中医电子病历分类模型TCM-GCN,用于改善中医电子病历特征有效表征的提取与分类。首先,利用LERT层词嵌入的方式将病历转换为句向量融入异构图中,以补全图结构缺失的病历整体语义特征;随后,为了缓解中医电子病历结构特点对特征提取产生的负面影响,异构图将关键词加入节点,使用BM25与点间互信息(PMI)算法构建图中“病历-关键词”“关键词-关键词”的边以表达病历的特征;最后,TCM-GCN依靠LERT-BM25-PMI构建的异构图对病历之间的特征关系进行聚合与抽取,完成病历分类的任务。在中医电子病历数据集上的实验结果表明,相较于次优的LERT,TCM-GCN加权平均后的准确率、召回率、F1值分别提升了2.24%、2.38%、2.32%,验证了算法在捕捉病历间隐含特征与中医电子病历分类工作上的有效性。 展开更多
关键词 异构图 图卷积网络 预训练模型 文本分类 自然语言处理 中医电子病历
下载PDF
Inductive Model Generation for Text Classification Using a Bipartite Heterogeneous Network 被引量:1
5
作者 Rafael Geraldeli Rossi Alneu de Andrade Lopes +1 位作者 Thiago de Paulo Faleiros Solange Oliveira Rezende 《Journal of Computer Science & Technology》 SCIE EI CSCD 2014年第3期361-375,共15页
Algorithms for numeric data classification have been applied for text classification. Usually the vector space model is used to represent text collections. The characteristics of this representation such as sparsity a... Algorithms for numeric data classification have been applied for text classification. Usually the vector space model is used to represent text collections. The characteristics of this representation such as sparsity and high dimensionality sometimes impair the quality of general-purpose classifiers. Networks can be used to represent text collections, avoiding the high sparsity and allowing to model relationships among different objects that compose a text collection. Such network- based representations can improve the quality of the classification results. One of the simplest ways to represent textual collections by a network is through a bipartite heterogeneous network, which is composed of objects that represent the documents connected to objects that represent the terms. Heterogeneous bipartite networks do not require computation of similarities or relations among the objects and can be used to model any type of text collection. Due to the advantages of representing text collections through bipartite heterogeneous networks, in this article we present a text classifier which builds a classification model using the structure of a bipartite heterogeneous network. Such an algorithm, referred to as IMBHN (Inductive Model Based on Bipartite Heterogeneous Network), induces a classification model assigning weights to objects that represent the terms for each class of the text collection. An empirical evaluation using a large amount of text collections from different domains shows that the proposed IMBHN algorithm produces significantly better results than k-NN, C4.5, SVM, and Naive Bayes algorithms. 展开更多
关键词 heterogeneous network text classification inductive model generation
原文传递
Meta-path-based outlier detection in heterogeneous information network 被引量:2
6
作者 Lu LIU Shang WANG 《Frontiers of Computer Science》 SCIE EI CSCD 2020年第2期388-403,共16页
Mining outliers in heterogeneous networks is crucial to many applications,but challenges abound.In this paper,we focus on identifying meta-path-based outliers in heterogeneous information network(HIN),and calculate th... Mining outliers in heterogeneous networks is crucial to many applications,but challenges abound.In this paper,we focus on identifying meta-path-based outliers in heterogeneous information network(HIN),and calculate the similarity between different types of objects.We propose a meta-path-based outlier detection method(MPOutliers)in heterogeneous information network to deal with problems in one go under a unified framework.MPOutliers calculates the heterogeneous reachable probability by combining different types of objects and their relationships.It discovers the semantic information among nodes in heterogeneous networks,instead of only considering the network structure.It also computes the closeness degree between nodes with the same type,which extends the whole heterogeneous network.Moreover,each node is assigned with a reliable weighting to measure its authority degree.Substantial experiments on two real datasets(AMiner and Movies dataset)show that our proposed method is very effective and efficient for outlier detection. 展开更多
关键词 data mining heterogeneous information network OUTLIER detection short text SIMILARITY
原文传递
强制与偏移:《水浒传》文本阐释的问题与反思 被引量:1
7
作者 俞武松 《山东师范大学学报(人文社会科学版)》 CSSCI 2017年第5期31-45,共15页
在诸多对于《水浒传》文本的阐释中,由于受到其创作素材丰富、版本情况复杂和衍生文本多样的影响,在中西文化交流碰撞日益频繁的情况下,文本强制阐释文本的情况值得关注,其具体表现为三种形式:用素材阐释文本;用异质文化阐释文本;用衍... 在诸多对于《水浒传》文本的阐释中,由于受到其创作素材丰富、版本情况复杂和衍生文本多样的影响,在中西文化交流碰撞日益频繁的情况下,文本强制阐释文本的情况值得关注,其具体表现为三种形式:用素材阐释文本;用异质文化阐释文本;用衍生文本阐释原文本。通过对于《水浒传》忠义观的考察可以发现,文本强制阐释文本不但导致忠义观阐释与《水浒传》文本的偏离,还导致人物形象及性格的变异以及对于《水浒传》结构、内容的不同认识和选择。或者可以说,讨论西方理论对于中国文本的强制阐释,解决的问题之一是如何回到文本;而讨论文本强制阐释文本,则希望解决回到什么文本的问题。 展开更多
关键词 《水浒传》 创作素材 异质文化 衍生文本 强制阐释
下载PDF
将纯文本数据迁入数据库中的技术研究 被引量:1
8
作者 张玉珍 帅克 《信息技术》 2007年第2期100-101,105,共3页
提出一种将纯文本数据迁入数据库的技术。通过程序依次将纯文本资料中的每条记录里的字段提取出来,并插入目的数据库中,并根据应用的需要,进行必要的数据类型转换、数据提取和数据生成,最后利用目的数据库自带的数据迁移工具完成数据迁... 提出一种将纯文本数据迁入数据库的技术。通过程序依次将纯文本资料中的每条记录里的字段提取出来,并插入目的数据库中,并根据应用的需要,进行必要的数据类型转换、数据提取和数据生成,最后利用目的数据库自带的数据迁移工具完成数据迁移。实际运行表明该技术可行、有效,在信息系统开发中对系统切换有很大帮助。 展开更多
关键词 异构数据 数据迁移 纯文本 数据提取
下载PDF
论中国文人小说的“整—性”
9
作者 何萃 《求是学刊》 CSSCI 北大核心 2014年第3期148-154,共7页
由于诗、词、曲、赋等各体文字的普遍使用,"非整一性"成为长期以来西方学者对中国小说文体最主要的批评。一般所谓"中国小说"或"白话小说",按其性质本应分为三类:一是"话本",本质上是说唱艺术... 由于诗、词、曲、赋等各体文字的普遍使用,"非整一性"成为长期以来西方学者对中国小说文体最主要的批评。一般所谓"中国小说"或"白话小说",按其性质本应分为三类:一是"话本",本质上是说唱艺术的文字遗存;二是"世代累积型"小说,亦本为说唱艺术,但大多经历了明清书商或文人程度不一的编改;三是明清文人独立创作的"文人小说"。故唯第三类才是真正意义的小说,西方学者的批评仅对应第三类才真正有效。诗、词、曲、赋等各体文字作为口头说唱艺术时本各有其用,在"文人小说"中此类文字在不同作品中,其文本"整一性"也各自不同。也就是说,如果我们将现存所谓"小说"还原至其所产生的历史语境,我们可能得到完全相反的结论。 展开更多
关键词 中国古典小说 非整一性 说唱文字 文人小说
下载PDF
基于异构图卷积网络的小样本短文本分类方法 被引量:11
10
作者 袁自勇 高曙 +1 位作者 曹姣 陈良臣 《计算机工程》 CAS CSCD 北大核心 2021年第12期87-94,共8页
针对小样本短文本分类过程中出现的语义稀疏与过拟合问题,在异构图卷积网络中利用双重注意力机制学习不同相邻节点的重要性和不同节点类型对当前节点的重要性,构建小样本短文本分类模型HGCN-RN。利用BTM主题模型在短文本数据集中提取主... 针对小样本短文本分类过程中出现的语义稀疏与过拟合问题,在异构图卷积网络中利用双重注意力机制学习不同相邻节点的重要性和不同节点类型对当前节点的重要性,构建小样本短文本分类模型HGCN-RN。利用BTM主题模型在短文本数据集中提取主题信息,构造一个集成实体和主题信息的短文本异构信息网络,用于解决短文本语义稀疏问题。在此基础上,构造基于随机去邻法和双重注意力机制的异构图卷积网络,提取短文本异构信息网络中的语义信息,同时利用随机去邻法进行数据增强,用于缓解过拟合问题。在3个短文本数据集上的实验结果表明,与LSTM、Text GCN、HGAT等基准模型相比,该模型在每个类别只有10个标记样本的情况下仍能达到最优性能。 展开更多
关键词 小样本短文本分类 异构图卷积网络 短文本异构信息网络 BTM主题模型 过拟合
下载PDF
基于事件异构图表示的文本去重算法 被引量:4
11
作者 艾玮 许佳 +1 位作者 谢灿豪 孟涛 《湖南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2023年第2期74-85,共12页
基于图结构的文本表示方法在新闻文本去重中具有更好的效果.但是,目前该表示方法还不能完整地表示文本的全部信息,并且忽略了图的语义信息,降低了新闻文本的去重效果.为此,本研究提出基于事件异构图表示的文本去重算法,该算法首先通过... 基于图结构的文本表示方法在新闻文本去重中具有更好的效果.但是,目前该表示方法还不能完整地表示文本的全部信息,并且忽略了图的语义信息,降低了新闻文本的去重效果.为此,本研究提出基于事件异构图表示的文本去重算法,该算法首先通过事件异构图表示新闻文本的全局语义与结构信息,然后提出双标签图核算法表征事件异构图,实现深度表征图的结构及语义信息.实验结果表明,该研究提出的去重算法比现有的基于图结构的文本表示去重方法在F1-score指标上提升了10%.最后,该算法能提高新闻文本的去重效果. 展开更多
关键词 图核算法 事件异构图 新闻文本 文本表示 文本去重
下载PDF
基于GCN的虚假评论检测方法 被引量:4
12
作者 曹东伟 李邵梅 陈鸿昶 《计算机工程与应用》 CSCD 北大核心 2022年第3期181-186,共6页
服务类网站的用户评价是消费者选择的重要参考,受商业利益的驱使,点评网站上充斥着大量不符合产品真实特性的评论,虚假评论的检测与治理,对于监督网站运营,净化网络环境具有重要的意义。为了提升虚假评论的检测结果,在基于词和文档构建... 服务类网站的用户评价是消费者选择的重要参考,受商业利益的驱使,点评网站上充斥着大量不符合产品真实特性的评论,虚假评论的检测与治理,对于监督网站运营,净化网络环境具有重要的意义。为了提升虚假评论的检测结果,在基于词和文档构建的图神经网络进行文本分类的基础上,提出基于融合语义相似度的图卷积网络(sematicgraph convolution networks)的虚假评论检测方法。基于PMI(pointwise mutual information)指数以及基于词嵌入度量的语义相似度构建词与词之间的连边,基于TF-IDF特征值构建词与评论之间的连边;利用图神经网络的传递特征对上述构建的词汇-评论异质文本图中的节点特征信息进行聚合和抽取,捕获词与评论节点之间的高阶特征信息实现分类。在公开数据集上,相对于CNN、LSTM及Text-GCN,提出方法的准确率分别提升7%、4.8%和1.3%。 展开更多
关键词 图卷积网络(GCN) 虚假评论 语义相似度 异质文本图
下载PDF
基于异质信息网络表征学习的微博虚假信息甄别研究
13
作者 王世雄 吴泽政 《情报杂志》 CSSCI 北大核心 2024年第12期152-160,共9页
[研究目的]社会网络的飞速发展与突发公共卫生事件的时有发生,使得大量的、具有迷惑性的虚假信息混杂社交媒体中,甄别此类信息已成为用户信息素养的重要组成部分。[研究方法]以微博上的异质信息网络为研究对象,综合考虑微博文本的语义... [研究目的]社会网络的飞速发展与突发公共卫生事件的时有发生,使得大量的、具有迷惑性的虚假信息混杂社交媒体中,甄别此类信息已成为用户信息素养的重要组成部分。[研究方法]以微博上的异质信息网络为研究对象,综合考虑微博文本的语义特征和用户行为的非语义特征,引入多头注意力机制融合生成集成表示实现虚假信息甄别,并从信息内容、参与用户、用户与信息交互三个维度进行特征挖掘与量化分析。[研究结论]研究表明,基于异质信息网络表征学习的虚假信息甄别方法具有较好的实用性,有助于解构虚假信息的特征,为突发公共卫生健康事件的虚假信息治理及辩症施策提供有益参考。 展开更多
关键词 异质信息网络 表征学习 突发公共卫生事件 虚假信息 用户行为 社交媒体 微博文本
下载PDF
融合异质图表示学习与注意力机制的可解释论文推荐
14
作者 马霄 邓秋淼 +2 位作者 张红玉 文轩 曾江峰 《情报学报》 CSSCI CSCD 北大核心 2024年第7期802-817,共16页
学术论文推荐旨在为研究人员从海量学术资源中快速筛选出感兴趣的论文。现有论文推荐方法主要基于论文标题等文本内容和引用关系等进行推荐,使得蕴含丰富语义的多源学术信息的表示学习不够充分,制约了推荐准确度的进一步提升。同时,当... 学术论文推荐旨在为研究人员从海量学术资源中快速筛选出感兴趣的论文。现有论文推荐方法主要基于论文标题等文本内容和引用关系等进行推荐,使得蕴含丰富语义的多源学术信息的表示学习不够充分,制约了推荐准确度的进一步提升。同时,当前方法往往关注论文推荐的准确性,而忽略了可解释性,降低了论文推荐系统的可信度和用户满意度。为解决上述问题,本文提出了一种融合异质图表示学习与注意力机制的可解释论文推荐方法,该方法能够有效利用异质学术图中的语义信息,为推荐结果提供文本解释说明。具体来说,首先,提出了一种基于异质图表示学习与注意力机制的论文推荐模型,融合多源学术信息来构建语义丰富的异质学术图,并利用注意力机制学习不同节点和元路径的重要性,以获得更准确的节点表示。其次,提出了一种基于特征的文本解释生成模型,该模型将可解释文本生成方法引入论文推荐场景,能够在为作者提供推荐列表的同时生成文本解释,以告知其推荐缘由,从而提高论文推荐的可解释性。最后,构建了一个包含论文元数据、特征词、引用上下文的学术数据集,基于该数据集的对比实验结果表明,本文提出的基于异质图表示学习与注意力机制的论文推荐模型推荐准确度更高,解释生成模型能够为论文推荐结果提供质量较高的可解释文本说明。 展开更多
关键词 论文推荐 异质图表示学习 注意力机制 可解释文本生成 元路径
下载PDF
一种基于异构图神经网络和文本语义增强的实体关系抽取方法
15
作者 彭勃 李耀东 +1 位作者 龚贤夫 李浩 《计算机科学》 CSCD 北大核心 2024年第S01期256-260,共5页
信息化时代,如何从海量自然语言文本中提取结构化信息已经成为研究热点。电力系统中繁杂的知识信息需要通过构建知识图谱来解决,而实体关系抽取是其上游的信息抽取任务,其完成度直接关系到知识图谱的有效性。而随着深度学习的不断发展,... 信息化时代,如何从海量自然语言文本中提取结构化信息已经成为研究热点。电力系统中繁杂的知识信息需要通过构建知识图谱来解决,而实体关系抽取是其上游的信息抽取任务,其完成度直接关系到知识图谱的有效性。而随着深度学习的不断发展,利用深度学习技术来完成实体关系抽取任务的研究逐渐展开并取得了良好的效果。然而目前依然存在文本语义应用不完全等问题。针对这些问题本文尝试提出了一种基于异构图神经网络和文本语义增强的实体关系抽取方法,该方法使用词节点与关系节点学习语义特征,并通过BRET与预训练任务分别获得两种节点的初始特征,使用多层图网络结构迭代更新,并在每一层中使用基于多头注意力机制的信息传递实现两种节点的交互。通过该模型与其他实体关系抽取在两个公开数据集上实验对比,所提模型取得了预期效果,在多种情境下普遍优于对比模型。 展开更多
关键词 深度学习 自然语言处理 知识图谱 实体关系抽取 异构图神经网络 文本语义增强
下载PDF
基于知识图谱技术的电力行业多源异构数据融合研究 被引量:3
16
作者 熊小舟 徐滢 +1 位作者 刘小康 罗坤 《中国高新科技》 2023年第3期111-112,132,共3页
文章针对电力行业内部与外部异构系统中存在的数据独立问题,提出了一种基于知识图谱的行业内外部数据融合解决方案。分析了目前文本信息提取以及知识图谱构建的主流技术路线,提出新的文本提取方案和知识图谱构建方案,实现对多源数据的... 文章针对电力行业内部与外部异构系统中存在的数据独立问题,提出了一种基于知识图谱的行业内外部数据融合解决方案。分析了目前文本信息提取以及知识图谱构建的主流技术路线,提出新的文本提取方案和知识图谱构建方案,实现对多源数据的融合与应用。该技术研究在某电力公司进行管理风险识别试点应用,验证了该研究成果的实用性。 展开更多
关键词 多源异构数据融合 知识图谱技术 文本信息提取 工程管理风险
下载PDF
基于词-主题-文本异质网络的短文本分类方法
17
作者 徐涛 赵星甲 卢敏 《计算机应用与软件》 北大核心 2024年第1期146-152,182,共8页
针对现有分类方法未考虑长距离词的语义相关性和文本间潜在主题共享的问题,提出一种基于词-主题-文本异质网络(WTDHN)的短文本分类方法。通过Word2vec训练词的上下文语义向量;构建词相关性矩阵以充足的词共现信息增强短文本各级别语义学... 针对现有分类方法未考虑长距离词的语义相关性和文本间潜在主题共享的问题,提出一种基于词-主题-文本异质网络(WTDHN)的短文本分类方法。通过Word2vec训练词的上下文语义向量;构建词相关性矩阵以充足的词共现信息增强短文本各级别语义学;构建以词、主题和文本为节点的异质网络,并采用图卷积学习节点之间的高阶邻域信息,丰富短文本语义。相较于基准分类模型,该方法在五个公开短文本数据集上的分类准确率平均提高1.56%。 展开更多
关键词 词-主题-文本异质网络 词共现 文本-主题分布 短文本分类
下载PDF
基于门控双层异构图注意力网络的半监督短文本分类 被引量:2
18
作者 蒋云良 王青朋 +3 位作者 张雄涛 黄旭 申情 饶佳峰 《模式识别与人工智能》 EI CSCD 北大核心 2023年第7期602-612,共11页
针对现有的基于异构图神经网络的短文本分类方法未充分利用节点之间的有效信息,以及存在的过拟合问题,文中提出基于门控双层异构图注意力网络的半监督短文本分类方法(Semi-Supervised Short Text Classification with Gated Double-Laye... 针对现有的基于异构图神经网络的短文本分类方法未充分利用节点之间的有效信息,以及存在的过拟合问题,文中提出基于门控双层异构图注意力网络的半监督短文本分类方法(Semi-Supervised Short Text Classification with Gated Double-Layer Heterogeneous Graph Attention Network,GDHG).GDHG包含节点注意力机制和门控异构图注意力网络两层.首先,使用节点注意力机制,训练不同类型的节点注意力系数,再将系数输入门控异构图注意力网络,训练得到门控双层注意力.然后,将门控双层注意力与节点的不同状态相乘,得到聚合的节点特征.最后,使用softmax函数对文本进行分类.GDHG利用节点注意力机制和门控异构图注意力网络的信息遗忘机制对节点信息进行聚集,得到有效的相邻节点信息,进而挖掘不同邻居节点的隐藏信息,提高聚合远程节点信息的能力.在Twitter、MR、Snippets、AGNews四个短文本数据集上的实验验证GDHG性能较优. 展开更多
关键词 门控异构图注意力 半监督学习 异构图神经网络 短文本分类
下载PDF
Knowledge acquisition, semantic text mining, and security risks in health and biomedical informatics 被引量:2
19
作者 J Harold Pardue William T Gerthoffer 《World Journal of Biological Chemistry》 CAS 2012年第2期27-33,共7页
Computational techniques have been adopted in medi-cal and biological systems for a long time. There is no doubt that the development and application of computational methods will render great help in better understan... Computational techniques have been adopted in medi-cal and biological systems for a long time. There is no doubt that the development and application of computational methods will render great help in better understanding biomedical and biological functions. Large amounts of datasets have been produced by biomedical and biological experiments and simulations. In order for researchers to gain knowledge from origi- nal data, nontrivial transformation is necessary, which is regarded as a critical link in the chain of knowledge acquisition, sharing, and reuse. Challenges that have been encountered include: how to efficiently and effectively represent human knowledge in formal computing models, how to take advantage of semantic text mining techniques rather than traditional syntactic text mining, and how to handle security issues during the knowledge sharing and reuse. This paper summarizes the state-of-the-art in these research directions. We aim to provide readers with an introduction of major computing themes to be applied to the medical and biological research. 展开更多
关键词 BIOMEDICAL informatics BIOINFORMATICS Knowledge SHARING Ontology matching heterogeneous SEMANTICS SEMANTIC integration SEMANTIC data MINING SEMANTIC text MINING Security risk
下载PDF
基于改进归纳式图卷积网络的文本分类方法 被引量:1
20
作者 赵钦 郑成博 《计算机工程与设计》 北大核心 2023年第4期1144-1150,共7页
针对图嵌入式文本分类方法在预测性能和归纳能力方面的缺陷,在文本图卷积网络(TextGCN)的基础上,进行适当改进。结合预测文本嵌入(PTE)的高效训练和归纳性,在各个网络层中使用不同的图;通过异质图卷积网络架构来学习特征嵌入,利用习得... 针对图嵌入式文本分类方法在预测性能和归纳能力方面的缺陷,在文本图卷积网络(TextGCN)的基础上,进行适当改进。结合预测文本嵌入(PTE)的高效训练和归纳性,在各个网络层中使用不同的图;通过异质图卷积网络架构来学习特征嵌入,利用习得的特征进行归纳推理。实验结果表明,在大量训练样本标注的情况下,所提方法取得了与其它方法相当或稍优的性能。在少量训练样本标注的情况下,所提方法表现更优,性能增益范围为2%~7%,支持更快的训练和泛化性。 展开更多
关键词 文本分类 预测性能 文本图卷积网络 异质图卷积网络 预测文本嵌入 归纳推理 特征嵌入
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部