期刊文献+
共找到21篇文章
< 1 2 >
每页显示 20 50 100
基于框架语义分析的汉语句子相似度计算 被引量:46
1
作者 李茹 王智强 +2 位作者 李双红 梁吉业 Collin Baker 《计算机研究与发展》 EI CSCD 北大核心 2013年第8期1728-1736,共9页
句子相似度计算在自然语言处理的许多领域中发挥着重要作用.已有的汉语句子相似度计算方法由于考虑句子的语义不全面,使得相似度计算结果不够准确,为此提出一种新的汉语句子相似度计算方法.该方法基于汉语框架网语义资源,通过多框架语... 句子相似度计算在自然语言处理的许多领域中发挥着重要作用.已有的汉语句子相似度计算方法由于考虑句子的语义不全面,使得相似度计算结果不够准确,为此提出一种新的汉语句子相似度计算方法.该方法基于汉语框架网语义资源,通过多框架语义分析、框架的重要度度量、框架的相似匹配、框架间相似度计算等关键步骤来实现句子语义的相似度量.其中多框架语义分析是从框架角度对句子中的所有目标词进行识别、框架选择及框架元素标注,从而达到全面刻画句子语义的目的;在此基础上根据句子中框架的语义覆盖范围对不同框架的重要度进行区分,能够使得相似度结果更准确.在包含多目标词的句子集上的实验结果显示,基于多框架语义分析的句子相似度计算方法相对传统方法获得了更好的测试结果. 展开更多
关键词 汉语框架网 多框架语义分析 句子语义相似度 框架相似度 框架重要度
下载PDF
基于问句相似度的中文FAQ问答系统 被引量:14
2
作者 叶正 林鸿飞 杨志豪 《计算机工程与应用》 CSCD 北大核心 2007年第9期161-163,248,共4页
常见问题(FAQ)问答系统是一种在已有的“问题—答案”对集合中找到与用户提问相匹配的问句,并将其对应的答案返回给用户的问答式检索系统。其关键问题是用户提出问句与FAQ库中问句进行相似度计算,找出FAQ库中最相近的问句,并返回事先存... 常见问题(FAQ)问答系统是一种在已有的“问题—答案”对集合中找到与用户提问相匹配的问句,并将其对应的答案返回给用户的问答式检索系统。其关键问题是用户提出问句与FAQ库中问句进行相似度计算,找出FAQ库中最相近的问句,并返回事先存储好的问题答案。通过对常见问句特点的研究,给出一种基于分解的向量空间模型和语义概念的问句相似度计算方法,其主要思想是对一个问句向量进行分解,提取其三个关键部分:问点、主题词和疑问词,表示成三个分向量,然后对每个分向量计算基于《HIT-IRLab同义词词林(扩展版)》的语义相似度,通过线性加权就可以得出两个问句的语义相似度。试验表明,与传统的基于向量空间模型的TF-DF问句相似度计算方法相比,可以提高问句匹配的精度。 展开更多
关键词 问句相似度 语义相似度 常见问题集 向量空间模型
下载PDF
多特征融合的语句相似度计算模型 被引量:19
3
作者 张培颖 《计算机工程与应用》 CSCD 北大核心 2010年第26期136-137,157,共3页
句子的相似度计算在自然语言处理的各个领域都占有十分重要的地位。提出了一种多特征融合的句子相似度计算模型,该计算方法把句子的词形、词序、结构、长度、距离和语义这6种特征相似度考虑进来,通过对不同的特征赋予不同的权重来调节... 句子的相似度计算在自然语言处理的各个领域都占有十分重要的地位。提出了一种多特征融合的句子相似度计算模型,该计算方法把句子的词形、词序、结构、长度、距离和语义这6种特征相似度考虑进来,通过对不同的特征赋予不同的权重来调节各个特征对于句子相似度的贡献,从而使计算结果得到最优。实验结果表明,该方法与其他方法相比,描述句子的信息更加全面,在计算句子相似度方面具有较高的准确率。 展开更多
关键词 自然语言处理 句子相似度 多特征融合 结构相似度 语义相似度
下载PDF
基于HowNet语义相似度的FAQ研究 被引量:10
4
作者 贾可亮 樊孝忠 张禹 《计算机应用》 CSCD 北大核心 2007年第9期2256-2257,共2页
FAQ是网站提供在线帮助的主要手段。利用检索机制根据用户提出的问题建立一个候选问句集,利用知网研究了用户问句和候选问句之间的相似度,从中找出最相似的问句,并将相应答案返回给用户。实验表明,该方法提高了问句匹配的准确率。
关键词 知网 Frequently Asked Question(FAQ) 句子语义相似度
下载PDF
多特征融合的句子语义相似度计算方法 被引量:14
5
作者 翟社平 李兆兆 +2 位作者 段宏宇 李婧 董迪迪 《计算机工程与设计》 北大核心 2019年第10期2867-2873,2884,共8页
针对句子语义相似度计算问题,综合考虑句子的结构信息与语义信息,提出一种多特征融合的句子语义相似度计算方法。提取句子的词形特征、词序特征及句长特征,使用层次分析法进行权重分配,计算结构相似度;利用本体图中最短路径定义语义距离... 针对句子语义相似度计算问题,综合考虑句子的结构信息与语义信息,提出一种多特征融合的句子语义相似度计算方法。提取句子的词形特征、词序特征及句长特征,使用层次分析法进行权重分配,计算结构相似度;利用本体图中最短路径定义语义距离,基于语义距离计算句子语义相似度;对结构相似度和语义相似度进行特征加权,构建多特征融合的句子语义相似度计算方法。实验结果表明,该方法取得了72.5%的F-度量值,与传统余弦相似度和基于关键词的相似度算法相比提高了12%。 展开更多
关键词 句子相似度 结构相似度 语义相似度 本体 层次分析法
下载PDF
基于语句结构及语义相似度计算主观题评分算法的研究 被引量:12
6
作者 贾电如 李阳明 《信息化纵横》 2009年第5期5-7,共3页
文字类主观题的自动评分是实现远程教育中在线考试系统的一个关键技术,由于其自动评判具有相当难度,使自动评分系统中在对语句结构、关键字匹配、词性、词义以及语义方面的判断还存在很多问题。通过对已有的算法分析,提出了一种方法,采... 文字类主观题的自动评分是实现远程教育中在线考试系统的一个关键技术,由于其自动评判具有相当难度,使自动评分系统中在对语句结构、关键字匹配、词性、词义以及语义方面的判断还存在很多问题。通过对已有的算法分析,提出了一种方法,采用浅层次句法结构分析和深层次语义分析相结合的算法计算相似度,该方法可以提高主观题自动评分的效率和准确度,具有一定的实用价值。 展开更多
关键词 自动评分 动态规划 语句相似度 语义相似度
下载PDF
基于问句语料库的受限领域自动应答系统 被引量:5
7
作者 余正涛 樊孝忠 宋丽哲 《计算机工程与应用》 CSCD 北大核心 2003年第36期28-30,86,共4页
自动应答系统中对用户所提问句的理解是系统实现的关键,同样也是一个难点,通过在受限领域内建立问句语料库来协助理解用户问句是一种非常有效的实现方法。文章分析了建行领域业务咨询系统的问句收集、分词和词性标注、语义标注、问句语... 自动应答系统中对用户所提问句的理解是系统实现的关键,同样也是一个难点,通过在受限领域内建立问句语料库来协助理解用户问句是一种非常有效的实现方法。文章分析了建行领域业务咨询系统的问句收集、分词和词性标注、语义标注、问句语料统计等问句语料库的建设过程,并详细介绍了采用词向量空间法和语义向量空间法从问句语料库中寻找和目标问句相似问句的计算方法及提取答案的实现过程。 展开更多
关键词 自然语言处理 问句语料库 自动应答系统 问句语义标注
下载PDF
RDAQAS中问句相似度计算方法研究 被引量:4
8
作者 余正涛 高盛祥 纪鹏程 《昆明理工大学学报(理工版)》 2004年第2期40-44,71,共6页
在受限领域自动应答系统 (RDAQAS)中 ,以“知网”和领域本体库为基础 ,计算目标问句和问句语料库中问句的相似度 ,从中寻找最相近问句 ,最终提取答案的方式 ,是一种很实用的自动应答实现模式 .文中介绍了金融领域本体库、问句语料库等... 在受限领域自动应答系统 (RDAQAS)中 ,以“知网”和领域本体库为基础 ,计算目标问句和问句语料库中问句的相似度 ,从中寻找最相近问句 ,最终提取答案的方式 ,是一种很实用的自动应答实现模式 .文中介绍了金融领域本体库、问句语料库等语义资源的构建方法 ,提出了基于关键词空间向量模型和基于语义概念空间向量模型的问句相似度计算方法 ,并对其实现过程进行了详细描述 。 展开更多
关键词 RDAQAS 计算方法 受限领域自动应答系统 问句相似度 语义相似度 领域本体库 空间向量模型 “知网”
下载PDF
基于弱语义样本的对比学习句嵌入方法
9
作者 徐斌斌 严大川 +1 位作者 王建尚 王小敏 《兰州交通大学学报》 CAS 2024年第1期51-58,共8页
为了有效消除句嵌入在语义特征空间的各向异性问题,提出一种基于弱语义样本的对比学习句嵌入方法,旨在生成有效句嵌入的同时,提升模型对文本语义相似性的识别效果。首先,采用标记重复算法构建相似样本并作为遮掩语言模型的输入,预测生... 为了有效消除句嵌入在语义特征空间的各向异性问题,提出一种基于弱语义样本的对比学习句嵌入方法,旨在生成有效句嵌入的同时,提升模型对文本语义相似性的识别效果。首先,采用标记重复算法构建相似样本并作为遮掩语言模型的输入,预测生成包含弱语义关系的样本;然后,将原始样本重复输入不同失活率的转换器,抽取不同的全局语义特征;最后,通过对比学习调整特征权重值,构建句嵌入。在公开数据集上进行系列对比实验,结果表明:基于弱语义样本的句嵌入表示方法性能优于其他方法,获得77.38%的相似性评估分数,为句嵌入生成和语义相似度识别任务提供了一种有效的解决方案。 展开更多
关键词 句嵌入 对比学习 弱语义样本 文本相似性
下载PDF
基于特征知识元的专利语义引用识别方法研究——以量子计算领域为例 被引量:1
10
作者 唐晓波 吴海婷 吴佳琳 《情报理论与实践》 北大核心 2023年第10期86-95,共10页
[目的/意义]专利引文分析是专利分析研究的重要内容。传统专利引文分析仅分析专利文献中明确标示的物理引用专利数据,不能够准确真实反映专利之间的引用关系,难以准确揭示专利之间的技术相似度。专利语义引用识别有利于准确真实揭示专... [目的/意义]专利引文分析是专利分析研究的重要内容。传统专利引文分析仅分析专利文献中明确标示的物理引用专利数据,不能够准确真实反映专利之间的引用关系,难以准确揭示专利之间的技术相似度。专利语义引用识别有利于准确真实揭示专利间的潜在语义联系,为专利的继承与创新评价提供参考,有助于专利授权前的专利审核和专利授权后的专利评价。[方法/过程]首先,基于规则和句法分析抽取了专利的特征知识元;其次,利用Sentence-BERT和Word2Vec对专利特征知识元及专利标题摘要文本进行向量化表示;再次,根据余弦相似度计算专利的特征相似度和整体相似度,结合专利申请日期的先后顺序得到专利的语义引用专利集;最后,采用量子计算领域专利数据进行了实验研究。[结果/结论]该专利语义引用识别方法能够实现语义引用专利的有效识别,有利于评价专利的技术新颖性、创造性和实用性,为专利审核和专利价值评估工作提供支持。 展开更多
关键词 语义引用识别 特征知识元 语义相似度 sentence-BERT Word2Vec
原文传递
一种基于语义与结构的句子相似度计算方法 被引量:5
11
作者 张艳杰 邵雄凯 刘建舟 《湖北工业大学学报》 2015年第5期82-85,共4页
在对已有方法进行分析的基础上,提出语义与结构相结合计算句子相似度的方法,并系统地介绍了此方法的实现过程。首先对输入的句子进行预处理,得到词语序列,使用基于知网的方法得到词语间的语义相似度;然后使用词形和句长特征表示句子的... 在对已有方法进行分析的基础上,提出语义与结构相结合计算句子相似度的方法,并系统地介绍了此方法的实现过程。首先对输入的句子进行预处理,得到词语序列,使用基于知网的方法得到词语间的语义相似度;然后使用词形和句长特征表示句子的结构相似度;最后加权得到两个句子的相似度。实例证明,提出的方法计算得到的句子相似度取得了较好的效果。 展开更多
关键词 句子相似度 知网 特征 语义相似度 结构相似度
下载PDF
一种基于知网语义相似度计算的应用研究 被引量:4
12
作者 徐猛 刘宗田 周文 《微计算机信息》 2010年第3期200-201,206,共3页
随着常见问题集(FAQ)的积累,问句数量日益增大,逐页浏览的知识获取方式很难满足用户的实际需求,也浪费用户大量的精力和时间,而基于FAQ的自动问答系统是解决该问题的一种有效途径。本文设计了QuickFaq自动问答系统框架,采用基于知网的... 随着常见问题集(FAQ)的积累,问句数量日益增大,逐页浏览的知识获取方式很难满足用户的实际需求,也浪费用户大量的精力和时间,而基于FAQ的自动问答系统是解决该问题的一种有效途径。本文设计了QuickFaq自动问答系统框架,采用基于知网的语义相似度计算模块,找出相似问句并返回答案。实验表明,该方法提高了问答系统的召回率和不匹配率。 展开更多
关键词 HOWNET 问句相似度 常见问题集 语义相似度
下载PDF
Designing an automated FAQ answering system for farmers based on hybrid strategies 被引量:1
13
作者 Junliang ZHANG Xuefang ZHU Guang ZHU 《Chinese Journal of Library and Information Science》 2012年第4期21-36,共16页
Purpose: The purpose of this study is to develop an automated frequently asked question(FAQ) answering system for farmers. This paper presents an approach for calculating the similarity between Chinese sentences based... Purpose: The purpose of this study is to develop an automated frequently asked question(FAQ) answering system for farmers. This paper presents an approach for calculating the similarity between Chinese sentences based on hybrid strategies.Design/methodology/approach: We analyzed the factors influencing the successful matching between a user's question and a question-answer(QA) pair in the FAQ database. Our approach is based on a combination of multiple factors. Experiments were conducted to test the performance of our method.Findings: Experiments show that this proposed method has higher accuracy. Compared with similarity calculation based on TF-IDF,the sentence surface forms and the semantic relations,the proposed method based on hybrid strategies has a superior performance in precision,recall and F-measure value.Research limitations: The FAQ answering system is only capable of meeting users' demand for text retrieval at present. In the future,the system needs to be improved to meet users' demand for retrieving images and videos.Practical implications: This FAQ answering system will help farmers utilize agricultural information resources more efficiently.Originality/value: We design the algorithms for calculating similarity of Chinese sentences based on hybrid strategies,which integrate the question surface similarity,the question semantic similarity and the question-answer similarity based on latent semantic analysis(LSA) to find answers to a user's question. 展开更多
关键词 Frequently asked question(FAQ)answering system sentence surface similarity semantic similarity Latent semantic analysis(LSA) similarity computation based on hybrid strategies FAQ answering system for farmers
下载PDF
基于卷积网络的句子语义相似性模型 被引量:5
14
作者 黄江平 姬东鸿 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2017年第3期68-75,共8页
句子间语义相似性的计算已成为自然语言处理领域的重要研究内容,如何有效地对句子建立语义模型已成为释义识别、文本相似性计算、问答和文本蕴涵等自然语言处理应用的基础任务.文中提出了一种并行的卷积神经网络模型,该模型的两个卷积... 句子间语义相似性的计算已成为自然语言处理领域的重要研究内容,如何有效地对句子建立语义模型已成为释义识别、文本相似性计算、问答和文本蕴涵等自然语言处理应用的基础任务.文中提出了一种并行的卷积神经网络模型,该模型的两个卷积网络不仅对句子对中的单个句子建立句子向量表示,还对句子经卷积池化后的特征进行相似性度量,并获得句子间的相似性特征.采用释义识别及文本相似性两项任务进行模型性能的实验评测,结果显示,该模型能够较好地表示句子语义信息,其释义识别F1值相比基准实验提高了7.4个百分点,语义相似性评测的皮尔森相关系数比逻辑回归方法有7.1个百分点的提高. 展开更多
关键词 卷积网络 释义识别 句子模型 语义相似性
下载PDF
基于动态特征词的中文句子相似度计算 被引量:2
15
作者 黄莉 《宝鸡文理学院学报(自然科学版)》 CAS 2013年第3期49-52,共4页
目的针对当前常用的汉语句子相似度计算方法存在的问题,结合语言习得特点,提出了一种基于动态特征词的中文句子相似度计算方法。方法首先以特征词作为语块切分边界,提取左右语块信息,采用语义向量空间模型;然后计算2个句子对应的左右组... 目的针对当前常用的汉语句子相似度计算方法存在的问题,结合语言习得特点,提出了一种基于动态特征词的中文句子相似度计算方法。方法首先以特征词作为语块切分边界,提取左右语块信息,采用语义向量空间模型;然后计算2个句子对应的左右组块的相似度;最终将各组块的相似度量值加权求和作为2个句子的相似度。结果实验表明,提出的方法计算结果较为理想,与人工判断的相似度较为一致。结论基于动态特征词的中文句子相似度计算方法在常用句式中具有更好的效果。 展开更多
关键词 句子相似度 特征词 语义相似度 语义向量
下载PDF
基于双向字交互卷积网络的句子相似度计算 被引量:3
16
作者 关晓菡 韩建辉 《计算机工程与设计》 北大核心 2019年第8期2259-2264,共6页
为解决基于Siamese模型缺乏句子间交互的问题和基于匹配模型的匹配因子单一问题,提出双向字粒度交互的卷积神经网络模型。在输入侧通过建立句子交互序列改善Siamese模型交互问题;在特征提取侧和输出侧通过对交互序列进行卷积,建立动态... 为解决基于Siamese模型缺乏句子间交互的问题和基于匹配模型的匹配因子单一问题,提出双向字粒度交互的卷积神经网络模型。在输入侧通过建立句子交互序列改善Siamese模型交互问题;在特征提取侧和输出侧通过对交互序列进行卷积,建立动态匹配因子改善匹配模型的匹配因子单一问题。实验结果表明,该模型在语义相似性计算数据集Quora和自然语言推理数据集SNLI的准确度相较其它算法均有提升,验证了算法的有效性和可行性。 展开更多
关键词 深度学习 卷积神经网络 句子交互 匹配计算 语义相似度
下载PDF
传递信息分类的句子间相似性度量
17
作者 李林 周一民 《计算机工程与应用》 CSCD 北大核心 2009年第31期15-17,共3页
提出了一种计算英文句子间相似度的方法。基于句子所传递的信息——其描述的对象、描述对象的属性和动作,首先将待比较的两个句子进行语块分析,并从中提取以上三个方面的信息;然后通过语义向量的方法,分别计算两个句子在这三个方面的相... 提出了一种计算英文句子间相似度的方法。基于句子所传递的信息——其描述的对象、描述对象的属性和动作,首先将待比较的两个句子进行语块分析,并从中提取以上三个方面的信息;然后通过语义向量的方法,分别计算两个句子在这三个方面的相似度;最后将它们结合起来作为两个句子的整体相似度,并通过训练得到最优的结合参数。实验表明,提出的方法与目前计算句子间相似度的方法相比更加符合人工判断句子间相似度的过程,表现出更高的准确性,达到了较高的性能指标。 展开更多
关键词 句子相似度 词汇语义相似度 语块分析 语义向量
下载PDF
基于构式语块的句子相似度计算
18
作者 黄莉 《计算机与数字工程》 2014年第1期9-13,共5页
针对当前主要的汉语句子相似度计算方法存在的问题,通过对大量的中文语句进行构式语义分析,提取构式语块特征,构建构式义特征库,并提出了一种基于构式语块的中文句子相似度计算方法。该方法最大化语块粒度,缩小语义理解间隙。在计算时,... 针对当前主要的汉语句子相似度计算方法存在的问题,通过对大量的中文语句进行构式语义分析,提取构式语块特征,构建构式义特征库,并提出了一种基于构式语块的中文句子相似度计算方法。该方法最大化语块粒度,缩小语义理解间隙。在计算时,首先,通过自上而下语块分析方法,利用HMM学习算法,对复杂多样的汉语句子进行构式语块识别;然后,采用自底向上的计算方式,获取得到构式块间的相似度;最后,计算得出句子间的相似度量值。对比句子相似度实验结果表明,论文提出的计算方法优于其他算法。 展开更多
关键词 句子相似度 构式义 构式语块 语义相似度
下载PDF
基于多头注意力机制Tree-LSTM的句子语义相似度计算 被引量:18
19
作者 胡艳霞 王成 +2 位作者 李弼程 李海林 吴以茵 《中文信息学报》 CSCD 北大核心 2020年第3期23-33,共11页
针对现有句子语义相似度计算由于缺乏语义结构信息导致精度低的问题,该文在依存关系树的基础上,提出了一种基于多头注意力机制Tree-LSTM(multi-head attention Tree-LSTM,MA-Tree-LSTM)的句子语义相似度计算方法。首先,MA-Tree-LSTM将... 针对现有句子语义相似度计算由于缺乏语义结构信息导致精度低的问题,该文在依存关系树的基础上,提出了一种基于多头注意力机制Tree-LSTM(multi-head attention Tree-LSTM,MA-Tree-LSTM)的句子语义相似度计算方法。首先,MA-Tree-LSTM将外部具有指导意义的特征作为输入,再将输入结合多头注意力机制作用在Tree-LSTM树节点的所有孩子节点上,为每个孩子节点赋予不同的权重值,从而实现多头注意力机制和Tree-LSTM的融合;其次,将三层的MA-Tree-LSTM应用于句子语义相似度计算并实现句子对的相互指导,从而得到句子对语义特征的多层表示;最后联合多层的语义特征建立句子对语义相似度计算模型,从而实现句子对间相关的语义结构特征的充分利用。该文提出的方法鲁棒性强,可解释性强,对句子单词的顺序不敏感,不需要特征工程。在SICK和STS数据集上的实验结果表明,基于MA-Tree-LSTM的句子语义相似度计算的精度优于非注意力机制的Tree-LSTM方法以及融合了多头注意力机制的BiLSTM方法。 展开更多
关键词 句子语义相似度计算 多头注意力机制 Tree-LSTM 语义依存树
下载PDF
基于多特征融合模型的自动摘要 被引量:3
20
作者 吴世鑫 黄德根 张云霞 《计算机工程与设计》 北大核心 2020年第3期650-655,共6页
为解决文本自动摘要任务中特征挖掘不充分的问题,选取句子的词汇、相对位置、长度和句间相似度4个特征,提出一种基于多特征融合模型的摘要系统。基于句法树的词汇特征充分利用语法信息,消除传统方法获取关键词的局限性,相对位置特征通... 为解决文本自动摘要任务中特征挖掘不充分的问题,选取句子的词汇、相对位置、长度和句间相似度4个特征,提出一种基于多特征融合模型的摘要系统。基于句法树的词汇特征充分利用语法信息,消除传统方法获取关键词的局限性,相对位置特征通过获取位置的高阶信息对句子进行赋值,长度特征过滤掉过长的句子,基于平滑逆向频率句嵌入方法构造句向量,有效计算句子间的相似度。实验结果表明,该系统提高了文本自动摘要的准确度。 展开更多
关键词 文本摘要 多特征融合 句法树 平滑逆向频率句嵌入 语义相似度
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部