期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
基于向量距离的词序相似度算法 被引量:11
1
作者 董刊生 方金云 《中文信息学报》 CSCD 北大核心 2009年第3期45-50,共6页
手机POI搜索已经成为手机搜索的主要应用之一。该文结合手机搜索的特点以及POI数据的结构性特征采用简拼进行POI搜索。由于词序相似度是影响简拼搜索排序结果的主要因素,该文提出了基于向量距离计算词序相似度的算法。该算法采用空间向... 手机POI搜索已经成为手机搜索的主要应用之一。该文结合手机搜索的特点以及POI数据的结构性特征采用简拼进行POI搜索。由于词序相似度是影响简拼搜索排序结果的主要因素,该文提出了基于向量距离计算词序相似度的算法。该算法采用空间向量模型作为简拼的表示方法,将提取的公共简拼映射为位置向量,进而利用位置向量间的距离计算词序相似度。通过理论分析,该算法相比基于逆序数的词序相似度算法,将时间复杂度由O(nlogn)降为O(n),空间复杂度由O(n)降为O(1)。实验结果表明,基于向量距离的词序相似度算法有效地保证了准确性,可以满足手机POI简拼搜索的应用需求,并在性能上将词序相似度的计算效率提高16.88%。 展开更多
关键词 计算机应用 中文信息处理 手机POI搜索 简拼搜索 词序相似 向量距离
下载PDF
基于句向量的文本相似度计算方法 被引量:10
2
作者 刘继明 于敏敏 袁野 《科学技术与工程》 北大核心 2020年第17期6950-6955,共6页
为进一步提高文本相似度计算的准确性,提出基于句向量的文本相似函数(part of speech and order smooth inverse frequency,PO-SIF),从词性和词序方面优化了平滑反频率(smooth inverse frequency,SIF)计算方法,SIF算法的核心是通过加权... 为进一步提高文本相似度计算的准确性,提出基于句向量的文本相似函数(part of speech and order smooth inverse frequency,PO-SIF),从词性和词序方面优化了平滑反频率(smooth inverse frequency,SIF)计算方法,SIF算法的核心是通过加权和去除噪声得到句向量来计算句子相似度。在具体计算时,一方面通过增加词性消减因子调节SIF句向量计算权重参数,获得带有词性信息的句向量,另一方面通过将词序相似度与SIF句向量相似度算法进行线性加权优化句子相似度得分。实验结果表明,增加词性和词序的方法可以提升算法准确率。 展开更多
关键词 平滑逆频率 句向量 词性 词序相似
下载PDF
基于NLP技术的装备故障文本匹配算法研究 被引量:6
3
作者 祖月芳 凌海风 吕永顺 《兵器装备工程学报》 CSCD 北大核心 2021年第11期204-208,共5页
基于当前装备故障诊断的现状,依据在装备维修手册、装备履历书以及装备管理信息系统中存在大量的装备故障和维修经验等数据,结合装备故障文本的特点,提出了一种融合词性、语义及词序因子的故障文本相似度计算方法。该方法将装备故障文... 基于当前装备故障诊断的现状,依据在装备维修手册、装备履历书以及装备管理信息系统中存在大量的装备故障和维修经验等数据,结合装备故障文本的特点,提出了一种融合词性、语义及词序因子的故障文本相似度计算方法。该方法将装备故障文本中词汇的词性、语义及位置关系相联系,在余弦公式的基础上,通过文本中的词汇之间的相似度与词性权重的关联关系,改进相似度计算方法,并引入词序相似度进一步优化文本相似度。实验表明,所提出的方法较其他方法有更好的精确率和召回率,有效提高了装备故障文本的匹配效果。 展开更多
关键词 装备故障文本 词向量 词性 语义 词序相似 文本相似 匹配算法
下载PDF
基于句子多种特征的相似度计算模型 被引量:2
4
作者 李秋明 张卫山 张培颖 《软件导刊》 2016年第9期4-6,共3页
句子相似度计算模型在基于实例的机器翻译中有着举足轻重的地位。提出了一种基于多特征加权的句子相似度计算模型,在对中文句子的词形、词序、句法和语义4种特征相似度计算的基础上,融合这4种特征,通过采用不同的特征权重来调节不同特... 句子相似度计算模型在基于实例的机器翻译中有着举足轻重的地位。提出了一种基于多特征加权的句子相似度计算模型,在对中文句子的词形、词序、句法和语义4种特征相似度计算的基础上,融合这4种特征,通过采用不同的特征权重来调节不同特征对句子相似度计算的影响,使得句子相似度计算更加准确。实验结果表明,该算法在计算句子相似度方面准确性较高。 展开更多
关键词 句子相似 词语相似 词序相似 句法相似 语义相似
下载PDF
句子相似度计算模型的改进 被引量:1
5
作者 杜刚 王超 《电脑知识与技术》 2008年第12X期2817-2818,2826,共3页
智能搜索需维护一个动态的问题与答案的数据库。一方面涉及到关键词的提取、逻辑组合等知识。另一方面,由于用户的用词和系统中存储的关键词在表达方式上可能不完全一样,精确的关键词匹配法必将导致很多问题找不到答案,或者找不准答案... 智能搜索需维护一个动态的问题与答案的数据库。一方面涉及到关键词的提取、逻辑组合等知识。另一方面,由于用户的用词和系统中存储的关键词在表达方式上可能不完全一样,精确的关键词匹配法必将导致很多问题找不到答案,或者找不准答案。智能搜索的关键性技术之一是句子相似度计算,该文从词型、词序、词长和不同特征加不同权值两方面对句子相似度进行优化改进,对于智能搜索性能的提高有着显著的作用。 展开更多
关键词 智能搜索 词形相似 语句长相似 词序相似
下载PDF
主观题自动评卷准确程度的关键技术研究——基于单向贴近度与词序相似度相结合的视角
6
作者 邓兆熙 《岭南师范学院学报》 2016年第6期93-96,共4页
信息产业的迅速发展为教育信息化的实现提供了条件,而教育部高度重视是信息化教育的发展的重要动力.然而,由于中文主观题的答案具有相当的复杂性,因此系统自动评卷有较大的难度.本文将在介绍分词技术的基础上,把单向贴近度和词序相似度... 信息产业的迅速发展为教育信息化的实现提供了条件,而教育部高度重视是信息化教育的发展的重要动力.然而,由于中文主观题的答案具有相当的复杂性,因此系统自动评卷有较大的难度.本文将在介绍分词技术的基础上,把单向贴近度和词序相似度进行相结合,从而达到提升主观题自动评卷的目的,并且对其效果进行检验. 展开更多
关键词 主观题 自动评卷 单向贴近 词序相似
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部