期刊文献+
共找到277篇文章
< 1 2 14 >
每页显示 20 50 100
基于隐含语义分析的微博话题发现方法 被引量:36
1
作者 马雯雯 魏文晗 邓一贵 《计算机工程与应用》 CSCD 2014年第1期96-100,共5页
随着微博的大量普及和关注度的不断提高,微博热点话题发现已成为当前研究热点。针对于短文本、向量空间模型(VSM)文本表示方法存在高维度、稀疏,以及同义多义问题,导致难以准确度量文本相似度,提出一种基于隐含语义分析的两阶段聚类话... 随着微博的大量普及和关注度的不断提高,微博热点话题发现已成为当前研究热点。针对于短文本、向量空间模型(VSM)文本表示方法存在高维度、稀疏,以及同义多义问题,导致难以准确度量文本相似度,提出一种基于隐含语义分析的两阶段聚类话题发现方法。引入话题热度的概念来选取具有一定关注度的微博文本,用隐含语义分析(LSA)对数据集进行建模;用层次聚类的CURE算法确定初始类中心;用K-means聚类得到热点话题的聚类结果。真实微博数据集的实验结果验证了该方法的有效性。 展开更多
关键词 隐含语义分析 向量空间模型 话题发现 微博 两阶段聚类 LATENT semantic Analysis(LSA) vector Space Model(VSM)
下载PDF
用于信息检索的同义词自动识别及其进展 被引量:25
2
作者 陆勇 侯汉清 《南京农业大学学报(社会科学版)》 2004年第3期87-93,共7页
同义词识别在很多领域都有广泛的应用 ,例如信息检索、自动标引、后控制词表的编制、基于知识库的自动分类、基于实例的机器翻译等等 ,它是信息表示和信息检索领域急需解决的问题。目前 ,国外的同义词自动识别的方法主要包括 :基于词典... 同义词识别在很多领域都有广泛的应用 ,例如信息检索、自动标引、后控制词表的编制、基于知识库的自动分类、基于实例的机器翻译等等 ,它是信息表示和信息检索领域急需解决的问题。目前 ,国外的同义词自动识别的方法主要包括 :基于词典注释的同义词识别算法、基于大型语料库统计的方法和基于搜索引擎的方法。 展开更多
关键词 信息检索 自动标引 同义词识别 语料库
下载PDF
基于词向量与TextRank的关键词提取方法 被引量:23
3
作者 周锦章 崔晓晖 《计算机应用研究》 CSCD 北大核心 2019年第4期1051-1054,共4页
针对词汇语义的差异性对TextRank算法的影响进行了研究,提出一种基于词向量与TextRank的关键词抽取方法。利用FastText将文档集进行词向量表征,基于隐含主题分布思想和利用词汇间语义性的差异,构建TextRank的转移概率矩阵,最后进行词图... 针对词汇语义的差异性对TextRank算法的影响进行了研究,提出一种基于词向量与TextRank的关键词抽取方法。利用FastText将文档集进行词向量表征,基于隐含主题分布思想和利用词汇间语义性的差异,构建TextRank的转移概率矩阵,最后进行词图的迭代计算和关键词抽取。实验结果表明,该方法的抽取效果相比于传统方法有明显提升,同时证明利用词向量能简单而有效地改善TextRank算法的性能。 展开更多
关键词 抽取 语义差异性 TextRank 词向量 隐含主题分布
下载PDF
面向本体的语义相似度计算及在检索中的应用 被引量:15
4
作者 张功杰 赵向军 陈克建 《计算机工程与应用》 CSCD 北大核心 2010年第29期131-133,共3页
检索是获取信息的重要方式。传统检索只停留在关键字异同的逻辑层面,忽略了语义层面的信息。以本体的知识组织体系为基础,以检索应用为目标,提出面向本体的文档和查询的语义向量表示方法,进而建立面向本体的相似度计算方法,为语义检索... 检索是获取信息的重要方式。传统检索只停留在关键字异同的逻辑层面,忽略了语义层面的信息。以本体的知识组织体系为基础,以检索应用为目标,提出面向本体的文档和查询的语义向量表示方法,进而建立面向本体的相似度计算方法,为语义检索创造条件,检索结果关注语义层面的匹配。并在理论的指导下,进行实验和分析。 展开更多
关键词 本体 语义向量 相似度 语义检索
下载PDF
基于军事知识图谱的作战预案语义匹配方法研究 被引量:13
5
作者 梁汝鹏 邓克波 +1 位作者 毛泽湘 徐沛 《指挥与控制学报》 2019年第2期115-120,共6页
提出了一种智能化的预案语义匹配方法,基于军事知识图谱,建立知识图谱与作战预案特征映射,构建预案语义特征标注,实现作战预案隐藏知识的显式定义;设计了作战预案语义特征抽取与相似性计算算法,解决基于索引或关键字等语用层次特征匹配... 提出了一种智能化的预案语义匹配方法,基于军事知识图谱,建立知识图谱与作战预案特征映射,构建预案语义特征标注,实现作战预案隐藏知识的显式定义;设计了作战预案语义特征抽取与相似性计算算法,解决基于索引或关键字等语用层次特征匹配效率和准确度较低的问题,实现基于语义特征的作战预案智能语义匹配,满足预案快速、精准化匹配需求. 展开更多
关键词 知识图谱 作战预案 语义特征 语义相似度 特征向量 语义匹配
下载PDF
基于word2vec的跨领域情感分类方法 被引量:14
6
作者 王勤勤 张玉红 +1 位作者 李培培 胡学钢 《计算机应用研究》 CSCD 北大核心 2018年第10期2924-2927,共4页
情感分类是用于判断数据的情感极性,广泛用于商品评论、微博话题等数据。标记信息的昂贵使得传统的情感分类方法难以对不同领域的数据进行有效的分类。为此,跨领域情感分类问题引起广泛关注。已有的跨领域情感分类方法大多以共现为基础... 情感分类是用于判断数据的情感极性,广泛用于商品评论、微博话题等数据。标记信息的昂贵使得传统的情感分类方法难以对不同领域的数据进行有效的分类。为此,跨领域情感分类问题引起广泛关注。已有的跨领域情感分类方法大多以共现为基础提取词汇特征和句法特征,而忽略了词语间的语义关系。基于此,提出了基于word2vec的跨领域情感分类方法 WEEF(cross-domain classification based on word embedding extension feature),选取高质量的领域共现特征作为桥梁,并以这些特征作为种子,基于词向量的相似度计算,将领域专有特征扩充到这些种子中,形成特征簇,从而减小领域间的差异。在SRAA和Amazon产品评论数据集上的实验结果表明了方法的有效性,尤其在数据量较大时。 展开更多
关键词 语义特征 共现特征 词向量 跨领域情感分类
下载PDF
基于知识图谱的问答系统研究与应用 被引量:13
7
作者 袁博 施运梅 张乐 《计算机技术与发展》 2021年第10期134-140,共7页
基于知识图谱的问答系统(knowledge base question answering,KBQA)目前已成为自然语言处理中的热门研究领域。问答系统的应用涉及诸多领域,如医药、电力、交通等各个方面。由此可见,问答系统已成为社会生产发展中必不可少的一项技术。... 基于知识图谱的问答系统(knowledge base question answering,KBQA)目前已成为自然语言处理中的热门研究领域。问答系统的应用涉及诸多领域,如医药、电力、交通等各个方面。由此可见,问答系统已成为社会生产发展中必不可少的一项技术。该文聚焦于国内外针对知识图谱的问答系统的研究与应用,对其进行分析梳理,总结了知识图谱、知识库以及问答系统的历史、发展及应用等相关知识,以及现有基于知识图谱的问答系统构建的三类方法,分别为基于模板匹配的方法、基于语义解析的方法以及基于向量建模的方法,探究了深度学习对传统问答系统效果的影响。最后,对基于知识图谱的问答系统技术的未来以及发展进行展望。研究表明:随着人工智能的蓬勃发展,问答系统存在的技术难题不断得到解决,将知识图谱和深度学习技术应用于传统问答系统以提升问答效果已成为大势所趋。 展开更多
关键词 知识图谱 问答系统 模板匹配 语义解析 向量建模
下载PDF
基于中文维基百科的词语相关度计算 被引量:12
8
作者 谌志群 高飞 曾智军 《情报学报》 CSSCI 北大核心 2012年第12期1265-1270,共6页
词语相关度的计算是自然语言处理关键技术之一,在信息检索、机器翻译、词义消歧、句法分析等领域有广泛应用。国内现有大部分词语相关度计算方法是基于知网(HowNet)的。本文将中文维基百科作为语义资源,利用其分类层次、概念文档之... 词语相关度的计算是自然语言处理关键技术之一,在信息检索、机器翻译、词义消歧、句法分析等领域有广泛应用。国内现有大部分词语相关度计算方法是基于知网(HowNet)的。本文将中文维基百科作为语义资源,利用其分类层次、概念文档之间的链接来计算汉语词语之间的相关度。在借鉴向量空间模型和谷歌相似度(Google Similarity Distance)计算方法基础上,通过构建分类图和相关语义向量来实现汉语词语相关度的计算。在测试集Word Similarity-353上进行了实验,实验结果的斯皮尔曼等级相关系数显示,本文的方法是可行和有效的。 展开更多
关键词 词语相关度计算 维基百科 分类图 语义向量
下载PDF
基于语义规则和词向量的台风灾害网络情感分析方法 被引量:11
9
作者 林筱妍 吴升 《地球信息科学学报》 CSCD 北大核心 2022年第1期114-126,共13页
灾害期间的舆情引导有助于维护社会稳定。社交媒体是舆论传播的重要渠道,通过微博评论了解用户的网络情感及关注的话题,可以帮助相关舆情监测部门掌握公众的关注热点,从而选择适当的干预节点来应对网络舆情,并对公众情绪进行疏导,这对... 灾害期间的舆情引导有助于维护社会稳定。社交媒体是舆论传播的重要渠道,通过微博评论了解用户的网络情感及关注的话题,可以帮助相关舆情监测部门掌握公众的关注热点,从而选择适当的干预节点来应对网络舆情,并对公众情绪进行疏导,这对于应急管理具有现实意义。现有的研究大多是利用有监督的机器学习方法进行情感分类,这需要人工进行语料的标注,工作量大。本文根据微博评论文本的特点,综合考虑情感词以及表情符号等多重情感源,构建了台风灾害领域情感词典。在此基础上,提出了一种基于情感词语义规则的情感倾向计算方法,以及基于词向量的话题聚类方法。首先,采集了近年5次台风灾害期间共计40多万条微博评论文本,基于大连理工情感词汇本体库进行扩展构建了台风灾害领域情感词典,结合PMI法构建表情符号词典,根据语义规则确定情感倾向,并使用3500条评论文本验证了该方法的有效性。然后,本文基于词向量、TF-IDF与K-means的聚类方法探索灾害期间热点话题。最后,以2020年4号台风"黑格比"为例,基于台风期间的5万余条微博评论文本进行了舆情情感分析,并识别出6类与台风相关的话题。通过时空分析发现,随着时间的推移,微博评论文本的数量发生一定变化,评论数量多的地区大都集中在沿海地区和经济水平高的地区,台风登陆当天浙江省的恐惧情感达到最高。结果表明,基于语义规则和词向量的台风灾害网络情感分析方法,能在类似灾害事件发生时为政府部门掌握和引导网络舆情提供辅助。 展开更多
关键词 台风 情感分析 话题识别 网络舆情 文本聚类 语义规则 情感词典 词向量
原文传递
融合BERT语义加权与网络图的关键词抽取方法 被引量:12
10
作者 李俊 吕学强 《计算机工程》 CAS CSCD 北大核心 2020年第9期89-94,共6页
结合文档本身的结构信息与外部词语的语义信息,提出一种融合BERT词向量与TextRank的关键词抽取方法。在基于网络图的TextRank方法基础上,引入语义差异性并利用BERT词向量加权方式优化TextRank转移概率矩阵计算过程,同时通过迭代运算对... 结合文档本身的结构信息与外部词语的语义信息,提出一种融合BERT词向量与TextRank的关键词抽取方法。在基于网络图的TextRank方法基础上,引入语义差异性并利用BERT词向量加权方式优化TextRank转移概率矩阵计算过程,同时通过迭代运算对文档中的词语进行综合影响力得分排序,最终提取得分最高的Top N个词语作为关键词。实验结果表明,当选取Top3、Top5、Top7和Top10个关键词时,与基于词向量聚类质心与TextRank加权的关键词抽取方法相比,该方法的平均F值提升了2.5%,关键词抽取效率更高。 展开更多
关键词 关键词抽取 语义关系 词向量 TextRank方法 基于Transformer的双向编码器表示
下载PDF
基于本体的语义标引研究与实现 被引量:8
11
作者 张功杰 黄穗 《计算机工程与设计》 CSCD 北大核心 2008年第8期2078-2080,共3页
标引是资源管理与检索的基础。传统的标引方式仅停留在关键字异同的逻辑层面,忽略了文档语义层面上的信息。以本体的知识组织体系为基础,以抽取文档的语义向量为目标,提出了基于本体的语义标引思想,为基于概念匹配的语义检索创造条件。... 标引是资源管理与检索的基础。传统的标引方式仅停留在关键字异同的逻辑层面,忽略了文档语义层面上的信息。以本体的知识组织体系为基础,以抽取文档的语义向量为目标,提出了基于本体的语义标引思想,为基于概念匹配的语义检索创造条件。为了更清晰的描述标引过程,建立了基于本体的语义标引模型,并对模型中各环节进行详细的功能定义。参照具体的实例本体进行实验和分析。 展开更多
关键词 语义标引 本体 语义向量 概念相似度 语义相似度 语义检索
下载PDF
语义指向性特征聚类的图像检索算法研究 被引量:11
12
作者 文政颖 李运娣 《计算机技术与发展》 2017年第4期83-88,共6页
在大型多媒体数据库中,需要进行图像检索实现感兴趣图像的准确索引和多媒体数据库的准确访问。传统方法采用关联信息人工标注方法进行图像检索,随着数据库中图像信息的增大,标注检索效率较低。为提高大型多媒体数据库中图像检索的效率... 在大型多媒体数据库中,需要进行图像检索实现感兴趣图像的准确索引和多媒体数据库的准确访问。传统方法采用关联信息人工标注方法进行图像检索,随着数据库中图像信息的增大,标注检索效率较低。为提高大型多媒体数据库中图像检索的效率和精度,提出了一种基于语义指向性特征聚类的图像检索算法。该算法通过图像向量量化编码实现图像压缩,对图像中的文本信息点进行频域特征点归类,对出现重叠文本的图像帧序列进行向量量化分解,提取梯度差异信息特征,实现语义指向性特征聚类,将窗口中梯度最大值进行自适应加权,提取量化编码压缩图像的语义特征信息,采用模糊C均值聚类算法对提取的语义特征进行分类标注,由此实现大型多媒体数据库中图像的准确检索和调度。仿真结果表明,该算法的图像检索准确度较高,图像帧差为零,输出图像的峰值信噪比优于传统方法,展示了较好的图像检索能力。 展开更多
关键词 语义 聚类 图像检索 向量量化
下载PDF
基于语义层级细粒度的海量文献标引研究
13
作者 罗宏宇 刘伟 《情报理论与实践》 北大核心 2024年第5期194-203,193,共11页
[目的/意义]信息资源爆炸式增长使科技文献知识的组织趋于自动化,文献自动标引是组织构建科技文献数字资源的基础和关键。针对目前科技文献自动标引语义粒度不够精准以及难以适应大规模海量文献标引的问题,提出了基于语义层级细粒度的... [目的/意义]信息资源爆炸式增长使科技文献知识的组织趋于自动化,文献自动标引是组织构建科技文献数字资源的基础和关键。针对目前科技文献自动标引语义粒度不够精准以及难以适应大规模海量文献标引的问题,提出了基于语义层级细粒度的自动标引方法。[方法/过程]在传统知识组织自动标引方法的基础上,对知识组织工具中的语义资源进行深入挖掘,借助知识组织中概念间的语义层级结构对概念信息进行语义扩展,并设计基于语义层级细粒度的概念遴选方法以解决传统方法标引效率过低的问题,从而实现对大规模文献的概念高效标引。[结果/结论]实验结果表明,文章所提出的方法较好地实现了概念表示效果,有效降低了不相关概念在标引结果中出现的几率,并且在提高了标引结果文献相关性的同时大大减少了标引所需的时间,实现了知识组织工具在自动标引领域更深层次的利用,为科技文献数字资源的挖掘计算提供有价值的参考和支持。 展开更多
关键词 自动标引 语义层级 语义扩展 语义关系 词向量
原文传递
融合BERT嵌入与注意力机制的方面情感分析 被引量:6
14
作者 林孟达 李书豪 《现代电子技术》 2022年第12期130-136,共7页
针对现有的方面情感分析任务研究存在文本利用率低、有效信息抽取难度大和无法高效识别单词多义性等问题,文中提出一种融合BERT嵌入与注意力机制的方面情感分析模型。该模型将BERT预训练语言模型和多头注意力机制结合构建BERT-BiLSTM-At... 针对现有的方面情感分析任务研究存在文本利用率低、有效信息抽取难度大和无法高效识别单词多义性等问题,文中提出一种融合BERT嵌入与注意力机制的方面情感分析模型。该模型将BERT预训练语言模型和多头注意力机制结合构建BERT-BiLSTM-Attention架构用于表征语句情感特征。首先采用具有双向Transformer结构的BERT模型,根据单词上下文动态生成语义向量;然后通过有效识别单词的多义性增强文本单词的语义表示,并将语义向量输入BiLSTM捕捉双向的语义依赖关系,以此增强模型对有效信息的抽取能力;最后结合具有并行化信息处理能力的多头注意力机制解析编码后的文本表示,获取与方面情感关联度较高的信息。SemEval 2014数据集中的实验结果表明:相比Glove词向量模型,BERT模型对方面情感分析任务的性能有显著提升;相比基线模型,该模型的准确率更高。 展开更多
关键词 方面情感分析 注意力机制 多义性 BERT模型 语义向量 情感特征
下载PDF
融合语义特征的无监督关键词提取算法
15
作者 赵长路 刘军 +1 位作者 胡佳 胡宝权 《计算机与数字工程》 2024年第7期1909-1915,1926,共8页
针对传统的词图模型的关键词提取算法缺乏文本语义理解的不足,提出一种融合语义特征的无监督关键词提取算法,该方法结合词嵌入技术与词图模型的思想,将文本语义信息和语序信息同时融入到传统的词图模型算法中。首先利用Word2vec和Doc2ve... 针对传统的词图模型的关键词提取算法缺乏文本语义理解的不足,提出一种融合语义特征的无监督关键词提取算法,该方法结合词嵌入技术与词图模型的思想,将文本语义信息和语序信息同时融入到传统的词图模型算法中。首先利用Word2vec和Doc2vec模型分别对词和文本进行向量表征,获取文本的语序信息,然后通过词向量计算出候选词与文本之间的语义相似度,进而改进TextRank算法,重新对候选关键词之间的边权值和初始值进行分配,并构建对应的重启概率矩阵和转移概率矩阵用于词图模型迭代计算候选词的分值以及关键词的提取。实验结果表明,有效地融合文本的语义信息和语序信息能够提升关键词提取的准确性。 展开更多
关键词 提取 语义信息 语序信息 向量表征 TextRank算法
下载PDF
融合颜色信息和多尺度几何特征的点云语义分割方法
16
作者 张华 徐瑞政 +3 位作者 郑南山 郝明 刘东烈 史文中 《地球信息科学学报》 EI CSCD 北大核心 2024年第6期1562-1575,共14页
大规模室外点云具有丰富的空间结构,是地理信息获取重要手段之一,由于其本身具有不规则性、复杂几何结构特征及地物尺度变化大等特征,点云分割的准确性依然是一个巨大的挑战。特别是目前大规模点云几何信息及颜色等信息利用不充分等问题... 大规模室外点云具有丰富的空间结构,是地理信息获取重要手段之一,由于其本身具有不规则性、复杂几何结构特征及地物尺度变化大等特征,点云分割的准确性依然是一个巨大的挑战。特别是目前大规模点云几何信息及颜色等信息利用不充分等问题,为解决这些问题,本文提出了一种融合颜色信息和多尺度几何特征的点云语义分割方法(Integrating Color Information and Multi-Scale Geometric Features for Point Cloud Semantic Segmentation(CMGF-Net))。该方法中,分别设计了几何特征信息提取和语义特征信息提取模块。在几何特征信息提取模块中,为了充分利用点云数据的几何特征信息,设计了2个特征提取模块,分别是局部邻域的相对位置特征提取模块(RPF)和局部邻域的几何属性提取模块(LGP)。其中,RPF模块利用三维点云的空间法向信息以及相对空间距离,提取邻域点与当前点的相对位置关系;LGP模块利用点云几何属性在不同地物上有独特的表现特性,融合局部区域的几何属性特征;然后通过所设计的几何特征融合模块(LGF)将RPF模块和LGP模块所提取的特征信息进行融合得到融合后的几何特征信息。此外,为了从点云中学习到多尺度的几何特征,CMGF-Net在不同尺度的网络层中都进行了几何特征的提取,最终将所提取的几何特征与基于颜色特征提取的语义特征信息分层进行融合,以提高网络的学习能力。实验结果表明所提出的网络模型在Semantic3D数据集上的平均交并比(mIoU)和平均准确率(OA)达到了78.2%和95.0%,相较于KP Conv提高了3.6%和2.1%;在Sensat Urban数据集上达到了59.2%和93.7%,由此可见本文所提出的网络模型CMGF-Net在大规模室外场景点云分割具有较好的结果。 展开更多
关键词 大规模点云 语义分割 法向量 几何属性 相对位置关系 多尺度特征融合 几何特征提取
原文传递
Enhanced Wolf Pack Algorithm (EWPA) and Dense-kUNet Segmentation for Arterial Calcifications in Mammograms
17
作者 Afnan M.Alhassan 《Computers, Materials & Continua》 SCIE EI 2024年第2期2207-2223,共17页
Breast Arterial Calcification(BAC)is a mammographic decision dissimilar to cancer and commonly observed in elderly women.Thus identifying BAC could provide an expense,and be inaccurate.Recently Deep Learning(DL)method... Breast Arterial Calcification(BAC)is a mammographic decision dissimilar to cancer and commonly observed in elderly women.Thus identifying BAC could provide an expense,and be inaccurate.Recently Deep Learning(DL)methods have been introduced for automatic BAC detection and quantification with increased accuracy.Previously,classification with deep learning had reached higher efficiency,but designing the structure of DL proved to be an extremely challenging task due to overfitting models.It also is not able to capture the patterns and irregularities presented in the images.To solve the overfitting problem,an optimal feature set has been formed by Enhanced Wolf Pack Algorithm(EWPA),and their irregularities are identified by Dense-kUNet segmentation.In this paper,Dense-kUNet for segmentation and optimal feature has been introduced for classification(severe,mild,light)that integrates DenseUNet and kU-Net.Longer bound links exist among adjacent modules,allowing relatively rough data to be sent to the following component and assisting the system in finding higher qualities.The major contribution of the work is to design the best features selected by Enhanced Wolf Pack Algorithm(EWPA),and Modified Support Vector Machine(MSVM)based learning for classification.k-Dense-UNet is introduced which combines the procedure of Dense-UNet and kU-Net for image segmentation.Longer bound associations occur among nearby sections,allowing relatively granular data to be sent to the next subsystem and benefiting the system in recognizing smaller characteristics.The proposed techniques and the performance are tested using several types of analysis techniques 826 filled digitized mammography.The proposed method achieved the highest precision,recall,F-measure,and accuracy of 84.4333%,84.5333%,84.4833%,and 86.8667%when compared to other methods on the Digital Database for Screening Mammography(DDSM). 展开更多
关键词 Breast arterial calcification cardiovascular disease semantic segmentation transfer learning enhanced wolf pack algorithm and modified support vector machine
下载PDF
融合共现和语义信息的药对提取方法研究及应用
18
作者 唐静 杨涛 +1 位作者 朱垚 胡孔法 《世界科学技术-中医药现代化》 CSCD 北大核心 2024年第1期88-98,共11页
目的针对处方数据特点,提出一种融合共现和语义信息的药对提取算法。方法将处方数据转化为矩阵数据,计算药物之间的关联信息作为初始筛选指标,再根据处方数据构建词向量,计算药物之间的语义相似度,作为第二筛选指标,从而提取潜在药对。... 目的针对处方数据特点,提出一种融合共现和语义信息的药对提取算法。方法将处方数据转化为矩阵数据,计算药物之间的关联信息作为初始筛选指标,再根据处方数据构建词向量,计算药物之间的语义相似度,作为第二筛选指标,从而提取潜在药对。将本文算法与经典的Apriori算法分别对1090条肺癌门诊处方用药数据进行实验,对比分析实验提取结果,从而验证本算法提取的有效性及实用性。结果与Apriori算法相比,本算法提取药对效果较好,可以在药物频次相差较大的情况下合理地缩小潜在药对选择范围,此外对阈值结果进行比对,针对本文数据根据数量变化与专家经验,分别推出两组建议阈值,在推荐阈值设置的范围下分别成功提取出医案中的88组与33组药对。结论词频结合语义信息用于筛选潜在药对的方法是可行且有效的,可为中医临床处方用药经验挖掘提供方法参考。 展开更多
关键词 药对筛选 药物共现 语义信息 词向量 数据挖掘
下载PDF
Orbit Weighting Scheme in the Context of Vector Space Information Retrieval
19
作者 Ahmad Ababneh Yousef Sanjalawe +2 位作者 Salam Fraihat Salam Al-E’mari Hamzah Alqudah 《Computers, Materials & Continua》 SCIE EI 2024年第7期1347-1379,共33页
This study introduces the Orbit Weighting Scheme(OWS),a novel approach aimed at enhancing the precision and efficiency of Vector Space information retrieval(IR)models,which have traditionally relied on weighting schem... This study introduces the Orbit Weighting Scheme(OWS),a novel approach aimed at enhancing the precision and efficiency of Vector Space information retrieval(IR)models,which have traditionally relied on weighting schemes like tf-idf and BM25.These conventional methods often struggle with accurately capturing document relevance,leading to inefficiencies in both retrieval performance and index size management.OWS proposes a dynamic weighting mechanism that evaluates the significance of terms based on their orbital position within the vector space,emphasizing term relationships and distribution patterns overlooked by existing models.Our research focuses on evaluating OWS’s impact on model accuracy using Information Retrieval metrics like Recall,Precision,InterpolatedAverage Precision(IAP),andMeanAverage Precision(MAP).Additionally,we assessOWS’s effectiveness in reducing the inverted index size,crucial for model efficiency.We compare OWS-based retrieval models against others using different schemes,including tf-idf variations and BM25Delta.Results reveal OWS’s superiority,achieving a 54%Recall and 81%MAP,and a notable 38%reduction in the inverted index size.This highlights OWS’s potential in optimizing retrieval processes and underscores the need for further research in this underrepresented area to fully leverage OWS’s capabilities in information retrieval methodologies. 展开更多
关键词 Information retrieval orbit weighting scheme semantic text analysis Tf-Idf weighting scheme vector space model
下载PDF
语义自编码结合关系网络的零样本图像识别算法 被引量:5
20
作者 林克正 李昊天 +1 位作者 白婧轩 李骜 《模式识别与人工智能》 EI CSCD 北大核心 2019年第3期214-224,共11页
为了解决零样本图像识别中传统模型容易出现投影域移位问题以及提高距离相似度度量的鲁棒性,提出关系网络改进语义自编码器的零样本识别算法.基于语义自编码器构建图像视觉特征和语义向量之间的特征映射,并将重构向量与对应向量真值进... 为了解决零样本图像识别中传统模型容易出现投影域移位问题以及提高距离相似度度量的鲁棒性,提出关系网络改进语义自编码器的零样本识别算法.基于语义自编码器构建图像视觉特征和语义向量之间的特征映射,并将重构向量与对应向量真值进行级联后送入神经网络,最终利用输出的标量给出预测类别.实验表明,相比传统距离度量方法,文中算法在AWA、CUB和Image Net-2数据集上的识别率均有所提高,在某些数据集上语义-视觉的投影效果优于反向投影. 展开更多
关键词 语义自编码器 关系网络 零样本识别 语义向量 投影域移位
下载PDF
上一页 1 2 14 下一页 到第
使用帮助 返回顶部