期刊文献+
共找到21篇文章
< 1 2 >
每页显示 20 50 100
面向垂直搜索引擎的基于知识的语义关联算法 被引量:3
1
作者 高一波 赵先章 +1 位作者 孙硕 黄河 《计算机工程》 CAS CSCD 北大核心 2009年第11期184-186,共3页
提出一种面向垂直搜索引擎的基于知识的语义关联算法,以知识表达技术及语义关联度计算为核心,建立语义关联规则,在语义扩展基础上提高查询招回率和语义相关度计算高检索的准确性,同时根据农产品物流领域的特点,设计并实现了用于农产品物... 提出一种面向垂直搜索引擎的基于知识的语义关联算法,以知识表达技术及语义关联度计算为核心,建立语义关联规则,在语义扩展基础上提高查询招回率和语义相关度计算高检索的准确性,同时根据农产品物流领域的特点,设计并实现了用于农产品物流ASP平台的垂直搜索引擎。 展开更多
关键词 概念知识树 知识表达 语义计算 垂直搜索
下载PDF
基于情感计算的“情移”现象实证研究 被引量:3
2
作者 王攸然 《语言文字应用》 CSSCI 北大核心 2018年第3期134-142,共9页
本文尝试运用计算语言学中基于搜索引擎的点互信息(PMI-IR)计算方法,对所选取的18个"情移"类词语进行量化考察,并利用Word2vec计算方法对互信息计算结果进行校正。结果表明,"情移"现象确实存在,且具有时效性强、易... 本文尝试运用计算语言学中基于搜索引擎的点互信息(PMI-IR)计算方法,对所选取的18个"情移"类词语进行量化考察,并利用Word2vec计算方法对互信息计算结果进行校正。结果表明,"情移"现象确实存在,且具有时效性强、易受影响等特点。网络热点事件与此类词语的调侃性、自嘲性是"情移"现象产生与热传的主要原因。 展开更多
关键词 网络语言 语义计算 PMI-IR 情感色彩
下载PDF
基于语义计算的公交移动问答系统 被引量:1
3
作者 陈小宾 葛新伟 林鸿飞 《计算机工程与科学》 CSCD 2008年第10期118-121,共4页
为解决外来旅客公交问询困难的问题,本文利用模式匹配、编辑距离计算、语义计算、自动问答等技术,实现了基于自然语言问答的公交移动问答系统。本文在抽象公交节点的基础上引入站点概念词,对站点关键词进行扩展、消除问询歧义,把公交线... 为解决外来旅客公交问询困难的问题,本文利用模式匹配、编辑距离计算、语义计算、自动问答等技术,实现了基于自然语言问答的公交移动问答系统。本文在抽象公交节点的基础上引入站点概念词,对站点关键词进行扩展、消除问询歧义,把公交线路抽象成线路节点网络模型,引入查询日志记录快表辅助问答,借助手机短消息业务实现了双向传输。实验结果表明,该系统达到了预期效果。 展开更多
关键词 语义计算 问答系统 公交问询 编辑距离
下载PDF
句法谓词的主题表现力研究 被引量:1
4
作者 高京坚 张文彦 张凯 《语言文字应用》 CSSCI 北大核心 2018年第1期71-80,共10页
针对句法谓词的篇章主题表现力研究目前仍为空白领域。本文根据篇章主题聚合理论,结合事件语义学的角度,以小学语文中223篇记叙文包含的句法谓词为切入点,进行主题表现力分析。通过提取句法谓词、分析语义聚类、给出语义关系图谱等步骤... 针对句法谓词的篇章主题表现力研究目前仍为空白领域。本文根据篇章主题聚合理论,结合事件语义学的角度,以小学语文中223篇记叙文包含的句法谓词为切入点,进行主题表现力分析。通过提取句法谓词、分析语义聚类、给出语义关系图谱等步骤,探索不同文体中句法谓词的主题表现力,并得出语义聚类的数量和聚类内部谓词的数量共同影响篇章主题表现等结论。 展开更多
关键词 句法谓词 篇章主题聚合理论 事件语义学 主题表现力 语义计算
下载PDF
基于关键词的云计算语义文本自适应分类
5
作者 沈佳杰 江红 王肃 《计算机工程》 CAS CSCD 2014年第7期247-253,共7页
传统语义文本分类方法难以高效地在云计算环境下进行中文文本快速分类。为解决该问题,提出一个在云计算环境下基于语义关键词提取的分布式中文文本自适应分类算法,在代理端对中文文本关键词进行基于语义的分布式提取,并将提取出的中文... 传统语义文本分类方法难以高效地在云计算环境下进行中文文本快速分类。为解决该问题,提出一个在云计算环境下基于语义关键词提取的分布式中文文本自适应分类算法,在代理端对中文文本关键词进行基于语义的分布式提取,并将提取出的中文关键词传输到中心数据库端进行整合,从而确定文本本身类别。通过理论证明在关键词提取数量足够的情况下,提出的文本分类算法可以在保证中文文本分类效果的前提下,有效降低网络传输的代价,从而提高中文文本分类算法在云计算环境下的性能。实验结果验证了该算法在云计算环境下的可行性以及理论推导的正确性。 展开更多
关键词 云计算 关键词提取 文本分类 语义计算 网络传输代价 中文文本语义
下载PDF
基于HNC理论的中文文本词汇链构造方法
6
作者 王宇 伍力慧 《情报杂志》 CSSCI 北大核心 2016年第2期182-187,共6页
[目的/意义]词汇链是文本中一系列词汇关联而成的语义链。构造词汇链有助于读者把握文本主题,对知识元构建、自动文摘生成等领域研究有重要价值。[方法/过程]借鉴HNC理论的概念层次原理对词汇语义进行形式化描述,利用HNC的符号和同行优... [目的/意义]词汇链是文本中一系列词汇关联而成的语义链。构造词汇链有助于读者把握文本主题,对知识元构建、自动文摘生成等领域研究有重要价值。[方法/过程]借鉴HNC理论的概念层次原理对词汇语义进行形式化描述,利用HNC的符号和同行优先准则,及依存句法揭示的多义词上下文信息,对词语语义进行消歧处理,进而运用HNC语义相似度计算方法获得词语的语义关联性。[结果/结论]在此基础上,提出词汇链构建算法,并对词汇链进行优选处理,获得优选词汇链。实验结果表明,基于HNC理论和依存句法提出的词汇链构造方法的可接受度较高。 展开更多
关键词 词汇链 语义计算 HNC理论 依存句法
下载PDF
隐含语义索引在农业技术问答系统中的应用 被引量:1
7
作者 魏保子 王儒敬 《微电子学与计算机》 CSCD 北大核心 2008年第7期48-51,共4页
利用隐含语义索引技术设计了一个问答系统,在系统中利用隐含语义索引理论进行查询问题和数据库中的候选问题的相似度计算.主要是通过构造一个语义矩阵,进行奇异值分解消除"噪音"进行实现的.这样更清晰地表示出了词之间的语义... 利用隐含语义索引技术设计了一个问答系统,在系统中利用隐含语义索引理论进行查询问题和数据库中的候选问题的相似度计算.主要是通过构造一个语义矩阵,进行奇异值分解消除"噪音"进行实现的.这样更清晰地表示出了词之间的语义相关性,使本系统可以接受被自然语言描述的问题.最后,对整个系统进行实验测试并对测试结果进行了分析,发现本系统比一般的基于VSM等方法实现的系统表现出了明显的优势. 展开更多
关键词 隐含语义索引 问答系统 语义计算 向量空间模型 相似度
下载PDF
融合聚类触发对特征的最大熵词性标注模型 被引量:20
8
作者 赵岩 王晓龙 +1 位作者 刘秉权 关毅 《计算机研究与发展》 EI CSCD 北大核心 2006年第2期268-274,共7页
为解决传统HMM词性标注模型不能包含远距离词特征的问题,提出了形如“WA→WB/TB”的触发对来承载远距离词特征信息,并采用平均互信息量度对触发对特征进行选择·在最大熵框架下,将选择后的触发对特征加入到词性标注系统中·利... 为解决传统HMM词性标注模型不能包含远距离词特征的问题,提出了形如“WA→WB/TB”的触发对来承载远距离词特征信息,并采用平均互信息量度对触发对特征进行选择·在最大熵框架下,将选择后的触发对特征加入到词性标注系统中·利用矢量空间模型提供的语义相似度计算功能进行词语聚类,聚类的结果和语义词典融合,建立聚类触发对特征用来解决触发词“WA”的数据稀疏问题·实验结果表明,与HMM相比,融合了聚类触发对特征的最大熵模型标注错误率减少了34%· 展开更多
关键词 词性标注 最大熵模型 矢量空间模型 语义相似度计算 触发对
下载PDF
基于SA-BP算法的本体概念语义相似度综合计算 被引量:12
9
作者 许飞翔 叶霞 +2 位作者 李琳琳 曹军博 王馨 《计算机科学》 CSCD 北大核心 2020年第1期199-204,共6页
不同作战部队在指挥信息系统测试评估中建立的指标存在异构问题,导致在信息交互和测试数据共享上存在较大困难。实现指标本体概念的映射和集成,建立一个统一的全局指标本体树可以有效地解决该问题,其中本体概念相似度计算的准确性至关... 不同作战部队在指挥信息系统测试评估中建立的指标存在异构问题,导致在信息交互和测试数据共享上存在较大困难。实现指标本体概念的映射和集成,建立一个统一的全局指标本体树可以有效地解决该问题,其中本体概念相似度计算的准确性至关重要。针对现有本体概念相似度计算模型中存在的精度不高的问题,提出了基于模拟退火改进BP(Back Propagation)神经网络(Simulated Annealing Back Propagation,SA-BP)算法的相似度综合计算模型。首先,对经典的基于语义距离、信息内容和概念属性的相似度计算模型进行改进,同时提出了基于概念子节点重合度的相似度计算模型;然后,采用SA-BP算法进行相似度综合计算,避免现有方法中人为确定权重的主观性和简单线性加权的不准确性问题;最后,从某作战部队不同单位建立的各异的指挥信息系统评估指标的本体概念中提取样本数据,对相似度综合计算模型进行训练测试。实验数据表明,相比于PSO-BP计算模型和主成分分析确定权值的线性加权计算模型,基于SA-BP算法的相似度综合计算模型的计算结果与专家评价结果的Pearson相关系数分别提升了0.0695和0.1351,达到了极强相关的一致性。实验数据充分说明,模拟退火算法改进的BP神经网络在训练后可以较好地收敛,在综合计算本体概念相似度时更加准确,从而有效地解决了本体概念集成的关键问题。 展开更多
关键词 本体集成 语义相似度计算 BP神经网络 模拟退火算法 子节点重合度
下载PDF
基于LDA模型和HowNet的多粒度子话题划分方法 被引量:9
10
作者 李湘东 巴志超 黄莉 《计算机应用研究》 CSCD 北大核心 2015年第6期1625-1629,共5页
针对LDA建模结果较泛化、子话题间文本相似度较高等问题,提出一种基于狄利克雷分配模型(LDA)和知网(How Net)语义词典相结合的多粒度子话题划分方法(MGH-LDA)。首先采用LDA模型对不同新闻源的新闻集合进行初划分,并根据文档贡献度获得... 针对LDA建模结果较泛化、子话题间文本相似度较高等问题,提出一种基于狄利克雷分配模型(LDA)和知网(How Net)语义词典相结合的多粒度子话题划分方法(MGH-LDA)。首先采用LDA模型对不同新闻源的新闻集合进行初划分,并根据文档贡献度获得相同新闻话题的文档集合;其次在TF-IDF模型基础上获取多粒度粗细特征,作为核心词特征集合来表征新闻文档,采用知网语义词典来计算新闻文档之间的相似度;最后通过single-pass增量聚类算法进行新闻文档的聚类,实现子话题划分。通过在真实新闻数据集上的实验,验证了该方法能有效地提高热点新闻话题子话题划分的准确率。 展开更多
关键词 新闻报道 子话题划分 多粒度 狄利克雷分配模型 语义相似度计算
下载PDF
基于双序列比对的中文术语语义相似度计算的新方法 被引量:6
11
作者 徐硕 朱礼军 +1 位作者 乔晓东 薛春香 《情报学报》 CSSCI 北大核心 2010年第4期701-708,共8页
针对中文术语的语义相似度计算问题,本文首先用数学语言对其进行了描述,然后仔细分析了求解该问题的传统计算方法,结果发现传统计算方法大都做了一个隐式假设:组成两个术语的原子术语的顺序必须大体一致。换句话说,传统计算方法并没有... 针对中文术语的语义相似度计算问题,本文首先用数学语言对其进行了描述,然后仔细分析了求解该问题的传统计算方法,结果发现传统计算方法大都做了一个隐式假设:组成两个术语的原子术语的顺序必须大体一致。换句话说,传统计算方法并没有考虑原子术语顺序的差异对构建两个术语的原子术语间对应关系质量的影响。为克服这个问题,通过类比分析,本文认为可将该问题看作一个全局双序列比对问题,因而引入生物信息学领域中著名的全局双序列比对算法(NW算法)。理论及实验研究均表明,在绝大多数情况下,该方法优于传统方法,或至少与传统方法的效果相当。 展开更多
关键词 语义相似度计算 序列比对 语义知识库
下载PDF
语义相似度计算在语义标注中的应用 被引量:4
12
作者 张玉芳 张泓博 熊忠阳 《计算机工程与应用》 CSCD 2013年第4期153-156,共4页
提出了一种词汇和本体概念间的语义相似度计算方法。该方法利用编辑距离和维基百科从语法和语义两方面综合考虑词汇和概念间的语义相似度。在领域本体的指导下,将方法应用于语义标注过程,建立词汇与本体概念之间的映射。在标注过程中建... 提出了一种词汇和本体概念间的语义相似度计算方法。该方法利用编辑距离和维基百科从语法和语义两方面综合考虑词汇和概念间的语义相似度。在领域本体的指导下,将方法应用于语义标注过程,建立词汇与本体概念之间的映射。在标注过程中建立知识库,提高算法性能,实验结果说明该方法是行之有效的。 展开更多
关键词 语义相似度计算 语义标注 编辑距离 维基百科
下载PDF
基于Roberta的中文短文本语义相似度计算研究
13
作者 张小艳 李薇 《计算机应用与软件》 北大核心 2024年第8期275-281,366,共8页
针对传统基于孪生网络的文本语义相似度计算模型中存在特征提取能力不足的问题,提出一种融合孪生网络与Roberta预训练模型SRoberta-SelfAtt。在孪生网络架构上,通过Roberta预训练模型分别将原始文本对编码为字级别向量,并使用自注意力... 针对传统基于孪生网络的文本语义相似度计算模型中存在特征提取能力不足的问题,提出一种融合孪生网络与Roberta预训练模型SRoberta-SelfAtt。在孪生网络架构上,通过Roberta预训练模型分别将原始文本对编码为字级别向量,并使用自注意力机制捕获文本内部不同字之间的关联;通过池化策略获取文本对的句向量进而将表示结果交互并融合;在全连接层计算损失值,评价文本对的语义相似度。将此模型在两类任务下的三种数据集上进行实验,其结果相比于其他模型有所提升,为进一步优化文本语义相似度计算的准确率提供有效依据。 展开更多
关键词 孪生神经网络 Roberta 自注意力机制 中文短文本 语义相似度计算
下载PDF
消费者健康信息门户网站的主题导航优化研究 被引量:4
14
作者 许鑫 于霜 姚占雷 《情报学报》 CSSCI 北大核心 2014年第11期1167-1177,共11页
本文在综合归纳健康信息门户网站主题网页的内容与链接特性的基础上,提出了一种基于语义计算与链接分析相结合的方法来探测资源间的关联性,并选取NICHD网站作为实验案例,验证了文中提出的主题导航优化方法的可行性。实验表明:基于... 本文在综合归纳健康信息门户网站主题网页的内容与链接特性的基础上,提出了一种基于语义计算与链接分析相结合的方法来探测资源间的关联性,并选取NICHD网站作为实验案例,验证了文中提出的主题导航优化方法的可行性。实验表明:基于语义相似度计算与链接分析相结合的导航优化方法一定程度地优胜于传统的依赖内容聚类优化导航的方法,且能够最大程度地将相关资源汇聚,缩短了检索时间、提升了用户体验。 展开更多
关键词 导航优化 健康信息门户 语义相似度计算 链接分析 编网法
下载PDF
基于本体的甲骨文文献语义检索模型研究 被引量:5
15
作者 韩姣红 《图书馆学研究》 CSSCI 北大核心 2013年第7期51-57,共7页
在甲骨文信息化研究中,基于关键词匹配的检索方式在查全率和查准率两个方面均不理想。领域本体作为共享概率化的明确的形式化规范说明,既可以将检索范围限定在特定领域,也可以通过概念间的关系寻找与关键字相关联的潜在信息,从而有效弥... 在甲骨文信息化研究中,基于关键词匹配的检索方式在查全率和查准率两个方面均不理想。领域本体作为共享概率化的明确的形式化规范说明,既可以将检索范围限定在特定领域,也可以通过概念间的关系寻找与关键字相关联的潜在信息,从而有效弥补关键词匹配方式的缺陷。在构建甲骨文文献本体的基础上,建立了一个基于领域本体的甲骨文文献语义检索模型,通过查询分析模块对查询条件进行分析,将检索关键词进行语义扩展,从而得到新的检索条件,再通过检索分析模块与本体库映射进行语义推理,从而提高检索的准确率和查全率。 展开更多
关键词 甲骨文 本体 语义检索 相似度计算
原文传递
面向机器阅读理解的候选句抽取算法 被引量:3
16
作者 郭鑫 张庚 +1 位作者 陈千 王素格 《计算机科学》 CSCD 北大核心 2020年第5期198-203,共6页
使机器理解人类自然语言是人工智能在认知领域的终极目标,机器阅读理解是自然语言处理技术中继语音识别、语义理解之后的一大挑战,要求计算机具有一定的背景常识,全面理解给定文本材料,并根据材料内容对相应的问题作答。随着深度学习的... 使机器理解人类自然语言是人工智能在认知领域的终极目标,机器阅读理解是自然语言处理技术中继语音识别、语义理解之后的一大挑战,要求计算机具有一定的背景常识,全面理解给定文本材料,并根据材料内容对相应的问题作答。随着深度学习的快速发展,阅读理解成为当前人工智能的热点研究方向,涉及机器学习、信息检索、语义计算等核心技术,在聊天机器人、问答系统、智能化教育等多个领域具有广泛的应用前景。文中聚焦微阅读模式,根据问题或选项从给定文本材料中抽取包含答案的候选句,缩小推理范围,为进一步实现机器阅读理解提供技术支持。传统基于特征的方法耗费大量人力,文中将答案候选句抽取看成一种语义相关度计算问题,提出了一种答案候选句排序方法,即Att-BiGRU/BiLSTM模型。首先,利用双向长短期记忆和门控循环单元来编码句子中表达的语义信息;其次,设计Atten结构,结合相异性和相似性对语义相关度进行建模;最后,采用Adam算法来学习模型的参数。在SemEval-SICK数据集上的实验结果显示,该模型在测试集上的pearson指标超过了基线方法BiGRU将近0.67,在MSE指标上超过BiGRU方法16.83%,收敛速度更快,表明双向和Atten结构能大大提高候选句抽取的精度。 展开更多
关键词 长短期记忆模型 门控循环单元 候选句抽取 语义相关度计算
下载PDF
基于人工智能的图书馆文献自动检索机器人设计 被引量:1
17
作者 朱蕊 《自动化与仪器仪表》 2023年第6期192-194,共3页
为实现图书馆文献自动检索,提出一种基于意图识别的图书馆文献自动检索机器人检索方法。首先,提出机器人检索思路;然后分别对用户问题的关键词进行自动抽取,对用户问题的意图进行识别,最后结合意图识别,计算意图识别的文献和搜索文献的... 为实现图书馆文献自动检索,提出一种基于意图识别的图书馆文献自动检索机器人检索方法。首先,提出机器人检索思路;然后分别对用户问题的关键词进行自动抽取,对用户问题的意图进行识别,最后结合意图识别,计算意图识别的文献和搜索文献的语义相似度。最结果表明:自动检索机器人的检索准确率达98%,说明本方法可准确实现用户意图和候选文献的精准检索。 展开更多
关键词 人工智能 自动检索 意图识别 语义相似度计算
原文传递
基于RDF重写的航空安全事件因果关系查询方法研究 被引量:1
18
作者 王红 杨蓉 郭静 《现代电子技术》 北大核心 2019年第16期149-153,158,共6页
针对航空安全事件RDF图数据因果关系查询中低匹配和无匹配的问题,提出一种基于语义相似度和RDFS规则的重写方法。该方法首先采用基于词向量的语义相似度计算方法将用户RDF三元组转换为领域本体RDF三元组,然后依据RDFS规则对领域本体RDF... 针对航空安全事件RDF图数据因果关系查询中低匹配和无匹配的问题,提出一种基于语义相似度和RDFS规则的重写方法。该方法首先采用基于词向量的语义相似度计算方法将用户RDF三元组转换为领域本体RDF三元组,然后依据RDFS规则对领域本体RDF三元组进行关系扩展重写,最后将该方法应用于航空安全事件因果关系的查询。实验结果表明,该方法在查全率和查准率方面取得明显效果,能够改善因果关系查询中低匹配和无匹配的问题,为解决航空安全事件因果关系的查询问题提供了方法支持。 展开更多
关键词 因果关系查询 关系重写 航空安全事件 语义相似度计算 查询效果分析 查询语句扩展
下载PDF
本体概念与词汇的语义相似度计算方法
19
作者 张玉芳 熊荣东 熊忠阳 《世界科技研究与发展》 CSCD 2011年第5期763-764,775,共3页
提出了一种本体概念与词汇语义相似度的计算方法。此方法结合编辑距离与Wordnet距离两者的优点综合衡量词汇与本体概念之间的语义相似度,从而将词汇映射到本体概念,同时不断的扩充本体丰富本体,更进一步提高算法的性能。实验结果说明此... 提出了一种本体概念与词汇语义相似度的计算方法。此方法结合编辑距离与Wordnet距离两者的优点综合衡量词汇与本体概念之间的语义相似度,从而将词汇映射到本体概念,同时不断的扩充本体丰富本体,更进一步提高算法的性能。实验结果说明此方法是可行的。 展开更多
关键词 语义网 本体 语义相似度 编辑距离 Wordnet距离
原文传递
基于临床领域本体的语义信息检索模型研究
20
作者 蒋秀林 朱文婕 +1 位作者 谢静 陈玉娥 《常州工学院学报》 2016年第2期43-46,共4页
传统的基于关键词和关键词向量空间的检索模型在查全率和查准率上效率较低,在临床领域本体的基础上,通过分析和讨论了改进的概念间语义相似度和相关度混合计算方法,提出基于临床领域本体的语义信息检索模型。实验结果表明,该混合计算方... 传统的基于关键词和关键词向量空间的检索模型在查全率和查准率上效率较低,在临床领域本体的基础上,通过分析和讨论了改进的概念间语义相似度和相关度混合计算方法,提出基于临床领域本体的语义信息检索模型。实验结果表明,该混合计算方法是可行性的,能有效提高语义信息检索模型的查准率。 展开更多
关键词 临床领域本体 语义相似度计算 信息检索模型 查全率 查准率
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部