期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
一种基于同义词词典的模糊查询扩展方法 被引量:17
1
作者 吴江宁 潘东华 《大连理工大学学报》 EI CAS CSCD 北大核心 2007年第3期439-443,共5页
在信息检索系统中,查询扩展是一种非常有效的改进检索性能的方法.为此,提出一种基于同义词词典的模糊查询扩展方法.该方法中的同义词词典是基于著名的语义词典WordNet中的同义词集合建立的,同义词之间的贴近度[0,1]使用Tanimoto系数获得... 在信息检索系统中,查询扩展是一种非常有效的改进检索性能的方法.为此,提出一种基于同义词词典的模糊查询扩展方法.该方法中的同义词词典是基于著名的语义词典WordNet中的同义词集合建立的,同义词之间的贴近度[0,1]使用Tanimoto系数获得.利用该词典,能够进行较好的查询扩展.将该方法与向量空间模型结合应用于文本信息检索系统中,所构造的检索模型相当于一种简单的语义模型,并且可以根据阈值来控制查询扩展的程度.所得试验结果表明,使用该查询扩展方法的信息检索系统较常规信息检索系统的检索性能有一定改善. 展开更多
关键词 模糊查询扩展 同义词词典 信息检索
下载PDF
基于自注意力的双向LSTM网络的情感分析模型 被引量:13
2
作者 孙璇 +2 位作者 周胜利 徐婧 王成 《微型电脑应用》 2021年第6期12-15,共4页
如今,社交媒体中的用户评论经常涉及到对目标对象的多个属性不同的情感倾向。这种多维度的用户情感对文本情感分析任务构成了巨大的挑战。然而,先前的研究很大程度上侧重于依赖外部信息,不擅长捕捉数据或特征的内部相关性。因此,提出了... 如今,社交媒体中的用户评论经常涉及到对目标对象的多个属性不同的情感倾向。这种多维度的用户情感对文本情感分析任务构成了巨大的挑战。然而,先前的研究很大程度上侧重于依赖外部信息,不擅长捕捉数据或特征的内部相关性。因此,提出了一种新颖的基于自注意力机制的双向LSTM网络的情感分析模型。使用双向LSTM神经网络学习抽象的文本语义表征,接着通过自注意力机制对文本语义表征的内部特征进行建模,对内部特征赋予不同权重,让模型更加有效地捕获数据的内部相关性。与多个基准模型进行了对比实验,在准确率、精确率、召回率及F1值等评估指标上取得了当前最优的表现。 展开更多
关键词 情感分析 深度学习 自注意力机制 长短程记忆网络
下载PDF
一种修正的向量空间模型在信息检索中的应用 被引量:6
3
作者 吴江宁 潘东华 《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 2008年第4期666-669,共4页
为了提高文本信息检索系统检索性能,针对信息检索系统中普遍使用的向量空间模型(VSM)所固有的缺陷,提出一种新的修正的向量空间模型(MVSM).该模型重新定义了查询索引项的内容,将修饰词与中心词组成的合成短语引入到查询语句及传统的向... 为了提高文本信息检索系统检索性能,针对信息检索系统中普遍使用的向量空间模型(VSM)所固有的缺陷,提出一种新的修正的向量空间模型(MVSM).该模型重新定义了查询索引项的内容,将修饰词与中心词组成的合成短语引入到查询语句及传统的向量空间检索模型的信息表示中,并重新计算作为特征索引项的合成短语的权重值.在此基础上,又对查询索引项使用了基于同义词词典的查询扩展策略.实验结果表明:用合成短语作为查询索引项进行检索,使检索能够在相对精确的范围内进行,提高检索查准率;对查询进行同义扩展,能够使更多的语义相关的文本被检索出来,提高检索查全率.因此,在信息检索系统中应用修正的向量空间模型能够较好地改善检索性能. 展开更多
关键词 文本信息检索 向量空间模型 同义词词典 查询扩展
下载PDF
信息检索中修饰语作用的研究 被引量:1
4
作者 吴江宁 潘东华 《情报学报》 CSSCI 北大核心 2006年第3期306-311,共6页
在海量信息中检索时,与用户查询相关的信息常常被漏掉,而与查询无关的信息——信息垃圾,却大量地出现在检索结果中。改进文本信息检索系统的质量,提高检索效能,已成为亟待解决的问题。本文针对能够影响检索效力的一个易被忽略的因... 在海量信息中检索时,与用户查询相关的信息常常被漏掉,而与查询无关的信息——信息垃圾,却大量地出现在检索结果中。改进文本信息检索系统的质量,提高检索效能,已成为亟待解决的问题。本文针对能够影响检索效力的一个易被忽略的因素——修饰语,研究其在文本信息检索中的作用。为此,构建了修正的向量空间模型(Modified Vector Space Model,MVSM),并以英文文本进行试验,进而说明修饰语的作用。 展开更多
关键词 文本信息检索 修饰语 向量空间模型 精确率 召回率
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部