期刊文献+
共找到761篇文章
< 1 2 39 >
每页显示 20 50 100
基于语义依存的汉语句子相似度计算 被引量:127
1
作者 李彬 刘挺 +1 位作者 秦兵 李生 《计算机应用研究》 CSCD 北大核心 2003年第12期15-17,共3页
句子间相似度的计算在自然语言处理的各个领域都占有很重要的地位,在多文档自动文摘技术中,句子间相似度的计算是一个关键的问题。由于汉语句子的表达形式是多种多样的,要准确地刻画一个句子所表达的意思,必须深入到语义一级并结合语法... 句子间相似度的计算在自然语言处理的各个领域都占有很重要的地位,在多文档自动文摘技术中,句子间相似度的计算是一个关键的问题。由于汉语句子的表达形式是多种多样的,要准确地刻画一个句子所表达的意思,必须深入到语义一级并结合语法结构信息,由此提出了一种基于语义依存的汉语句子相似度计算的方法,该方法取得了令人满意的实验效果。 展开更多
关键词 相似计算 语义 依存结构 自然语言处理 多文档文摘
下载PDF
基于语义理解的文本相似度算法 被引量:79
2
作者 金博 史彦军 滕弘飞 《大连理工大学学报》 EI CAS CSCD 北大核心 2005年第2期291-297,共7页
相似度的计算在信息检索及文档复制检测等领域具有广泛的应用前景.研究了文本相似度的计算方法,在知网语义相似度的基础上,将基于语义理解的文本相似度计算推广到段落范围,进而可以将这种段落相似度推广到篇章相似度计算.给出了文本(包... 相似度的计算在信息检索及文档复制检测等领域具有广泛的应用前景.研究了文本相似度的计算方法,在知网语义相似度的基础上,将基于语义理解的文本相似度计算推广到段落范围,进而可以将这种段落相似度推广到篇章相似度计算.给出了文本(包括词语、句子、段落)相似度的计算公式及算法,用于计算两文本之间的相似度.实例验证表明,该算法与现有典型的相似度计算方法相比,计算准确性得到提高. 展开更多
关键词 语义理解 相似算法 相似计算 计算方法 文本相似 语义相似 信息检索 实例验证 计算公式 准确性 文档 知网
下载PDF
一种新的句子相似度度量及其在文本自动摘要中的应用 被引量:34
3
作者 张奇 黄萱菁 吴立德 《中文信息学报》 CSCD 北大核心 2005年第2期93-99,共7页
本文提出了一种新的句子相似度度量的方法并应用于文本自动摘要中。其创新处在于相似度计算不仅考虑句子中的uni gram ,还考虑了bi gram和tri gram ,通过回归方法将这几种相似度结果综合起来。实验证明这种相似度计算方法是有效的。同... 本文提出了一种新的句子相似度度量的方法并应用于文本自动摘要中。其创新处在于相似度计算不仅考虑句子中的uni gram ,还考虑了bi gram和tri gram ,通过回归方法将这几种相似度结果综合起来。实验证明这种相似度计算方法是有效的。同时本文还提出了一种新的 ,利用句子间相似度以及句子的权重的抽句式文摘算法 ,在抽取出句子的同时也去掉了冗余。DUC2 0 0 3、DUC2 0 0 4 (DocumentUnderstandingConference 2 0 0 3,2 0 0 4 )的评测结果征明了方法的有效性。我们的系统在DUC2 0 0 4的评测中列第二位。 展开更多
关键词 计算机应用 中文信息处理 文本自动摘要 向量模型 相似计算
下载PDF
当归的化学成分指纹图谱 被引量:44
4
作者 吴燕燕 尚明英 蔡少青 《药学学报》 CAS CSCD 北大核心 2008年第7期728-732,共5页
比较不同产地的当归样品与市售药材之间的化学成分差异,为当归的质量控制提供参考。采用高效液相色谱法测定了16个不同产地的19份全归样品及28份市售药材(除6份全归,1份归头外,其余21份均为饮片)的指纹图谱,以阿魏酸为参照,鉴定12个共... 比较不同产地的当归样品与市售药材之间的化学成分差异,为当归的质量控制提供参考。采用高效液相色谱法测定了16个不同产地的19份全归样品及28份市售药材(除6份全归,1份归头外,其余21份均为饮片)的指纹图谱,以阿魏酸为参照,鉴定12个共有峰。结果显示,当归饮片指纹图谱共有峰数目普遍较全归样品少,共有峰吸收值除峰11、12外,其余均较全归样品的共有峰吸收值低。结合系统聚类分析、相似度计算等方法对产地收集的当归样品和商品药材的指纹图谱进行评价比较,结果发现当归全归与饮片基本可以聚成两大类。全归(y-17、s-3、s-5及s-6除外)的相似度在0.973以上,饮片的相似度则在0.969以下,表明当归全归与饮片化学成分存在较大差异。本实验结果提示为保持药材成分的稳定,当归最好以全归的形式流通,同时应该注意当归的贮藏方式及年限。 展开更多
关键词 当归 当归饮片 指纹图谱 相似计算
下载PDF
基于用户的协同过滤算法的推荐效率和个性化改进 被引量:37
5
作者 王成 朱志刚 +1 位作者 张玉侠 苏芳芳 《小型微型计算机系统》 CSCD 北大核心 2016年第3期428-432,共5页
针对传统的基于用户的协同过滤算法存在的推荐效率、精度和个性化低的问题,提出一种改进方法.该方法在计算用户评分矩阵时,考虑到用户评分矩阵稀疏性,建立项目-用户的倒查表,只计算有相同评分项的用户之间的相似度,避免了传统方法中对... 针对传统的基于用户的协同过滤算法存在的推荐效率、精度和个性化低的问题,提出一种改进方法.该方法在计算用户评分矩阵时,考虑到用户评分矩阵稀疏性,建立项目-用户的倒查表,只计算有相同评分项的用户之间的相似度,避免了传统方法中对所有用户计算两两用户相似度的庞大工作量.该方法在计算用户相似度时,考虑到项目的热门程度不同,"惩罚"了用户共同兴趣列表中的热门项目,避免了传统方法中赋予所有项目相同权值对推荐结果个性化的负面影响.本文在详细分析了改进的用户协同过滤算法的原理和优点,给出了其推荐步骤流程图.在Movielens100K和HetRec2011-movielens-2k公开数据集上,十折交叉验证的结果表明,改进后的算法节约了运行时间,提高了推荐算法的效率和个性化. 展开更多
关键词 基于用户的协同过滤 个性化推荐 相似计算 用户评分矩阵 数据稀疏性 项目-用户倒查表 十折交叉验证
下载PDF
基于移动用户上下文相似度的协同过滤推荐算法 被引量:34
6
作者 徐风苓 孟祥武 王立才 《电子与信息学报》 EI CSCD 北大核心 2011年第11期2785-2789,共5页
该文面向移动通信网络领域的个性化服务推荐问题,通过将移动用户上下文信息引入协同过滤推荐过程,提出一种基于移动用户上下文相似度的改进协同过滤推荐算法。该算法首先计算基于移动用户的上下文相似度,以构造目标用户当前上下文的相... 该文面向移动通信网络领域的个性化服务推荐问题,通过将移动用户上下文信息引入协同过滤推荐过程,提出一种基于移动用户上下文相似度的改进协同过滤推荐算法。该算法首先计算基于移动用户的上下文相似度,以构造目标用户当前上下文的相似上下文集合,然后采用上下文预过滤推荐方法对"移动用户-移动服务-上下文"3维模型进行降维得到"移动用户-移动服务"2维模型,最后结合传统2维协同过滤算法进行偏好预测和推荐。仿真数据集和公开数据集实验表明,该算法能够用于移动网络服务环境下的用户偏好预测,并且与传统协同过滤相比具有更高的推荐精确度。 展开更多
关键词 移动网络 用户上下文 相似计算 协同过滤
下载PDF
基于词汇语义计算的文本相似度研究 被引量:25
7
作者 余刚 裴仰军 +1 位作者 朱征宇 陈华月 《计算机工程与设计》 CSCD 北大核心 2006年第2期241-244,共4页
基于《知网》的词汇语义计算方法揭示了词汇间的语义信息。根据文本的向量空间模型描述形式,采用了基于《知网》的词汇语义计算方法来计算两篇文章向量的相关性,并用最大匹配算法来获得这两篇文章的相似度,通过该计算过程达到揭示文本... 基于《知网》的词汇语义计算方法揭示了词汇间的语义信息。根据文本的向量空间模型描述形式,采用了基于《知网》的词汇语义计算方法来计算两篇文章向量的相关性,并用最大匹配算法来获得这两篇文章的相似度,通过该计算过程达到揭示文本所蕴涵概念的目的,并用实验对该方法的有效性进行了验证,提出了今后的改进方向。 展开更多
关键词 《知网》 相似计算 义原 匹配 向量空间模型
下载PDF
韩信草的高效液相色谱指纹图谱及化学模式识别 被引量:29
8
作者 潘伟东 杜义龙 +3 位作者 赵胜男 李艳荣 王肖 潘海峰 《药物分析杂志》 CAS CSCD 北大核心 2015年第2期250-254,共5页
目的:通过比较指纹图谱的相似度并进行主成分和聚类分析,建立韩信草指纹图谱共有模式。方法:采用Agilent Eclipse XDB-C18色谱柱(4.6 mm×250 mm,5μm),以0.6%乙酸水溶液-乙腈-四氢呋喃为流动相,梯度洗脱,流速1.0 m L·min^... 目的:通过比较指纹图谱的相似度并进行主成分和聚类分析,建立韩信草指纹图谱共有模式。方法:采用Agilent Eclipse XDB-C18色谱柱(4.6 mm×250 mm,5μm),以0.6%乙酸水溶液-乙腈-四氢呋喃为流动相,梯度洗脱,流速1.0 m L·min^-1,1~40 min检测波长为365 nm,40~65 min检测波长为275 nm,柱温30℃,进样量10μL。对16批韩信草进行检测,运用国家药典委员会《中药色谱指纹图谱相似度评价系统2004A版》建立指纹图谱并进行相似度计算,运用SPSS 17.0统计软件进行化学模式识别分析,建立韩信草指纹图谱共有模式。结果:根据主成分和聚类分析结果筛选出10批韩信草样品,并建立指纹图谱共有模式。结论:本文建立的方法经方法验证可作为韩信草的质量控制方法。 展开更多
关键词 韩信草 大叶半枝莲 黄芩 高效液相色谱指纹图谱 主成分分析 聚类分析 共有模式 相似计算 方法验证
原文传递
基于语句相似度计算的FAQ自动回复系统设计与实现 被引量:19
9
作者 张亮 冯冲 +1 位作者 陈肇雄 黄河燕 《小型微型计算机系统》 CSCD 北大核心 2006年第4期720-723,共4页
FAQ(Frequently Asked Question)在互联网站上广泛使用,但绝大多数FAQ的检索与回复都是手工进行.本文介绍了一个较为完整的基于语句相似度计算的FAQ自动回复系统,包括基本计算模型的选取、FAQ特性的分析、FAQ数据形式化表示及特征向量... FAQ(Frequently Asked Question)在互联网站上广泛使用,但绝大多数FAQ的检索与回复都是手工进行.本文介绍了一个较为完整的基于语句相似度计算的FAQ自动回复系统,包括基本计算模型的选取、FAQ特性的分析、FAQ数据形式化表示及特征向量索引、权重计算等,并给出详细的语句相似度计算算法,实验结果表明,对于频率高、共性大的问题,系统有很高的准确率. 展开更多
关键词 FAQI VSM 相似计算 信息检索
下载PDF
AIMLBot智能机器人在实时虚拟参考咨询中的应用 被引量:28
10
作者 李文江 陈诗琴 《现代图书情报技术》 CSSCI 北大核心 2012年第7期127-132,共6页
基于AIMLBot智能机器人软件,利用"海量智能分词"和Lucene.net对机器人的中文知识库进行分词和索引检索,运用《知网》对用户输入问句与知识库问句进行相似度计算,获取相似度最高的知识问句进行推理,从而实现机器人在图书馆实... 基于AIMLBot智能机器人软件,利用"海量智能分词"和Lucene.net对机器人的中文知识库进行分词和索引检索,运用《知网》对用户输入问句与知识库问句进行相似度计算,获取相似度最高的知识问句进行推理,从而实现机器人在图书馆实时虚拟参考咨询中的服务。 展开更多
关键词 实时虚拟参考咨询 AIMLBot LUCENE.NET 中文分词 相似计算
原文传递
基于改进编辑距离和依存文法的汉语句子相似度计算 被引量:22
11
作者 刘宝艳 林鸿飞 赵晶 《计算机应用与软件》 CSCD 北大核心 2008年第7期33-34,47,共3页
句子相似度计算在中文自然语言处理领域有着广泛的应用背景。要准确地刻画一个句子所表达的意思,必须深入到语义层面级并结合语法结构信息,提出了一种基于改进编辑距离和依存文法的汉语句子相似度计算方法。依存文法考虑到句子内部的结... 句子相似度计算在中文自然语言处理领域有着广泛的应用背景。要准确地刻画一个句子所表达的意思,必须深入到语义层面级并结合语法结构信息,提出了一种基于改进编辑距离和依存文法的汉语句子相似度计算方法。依存文法考虑到句子内部的结构和词语之间的相互作用关系,而编辑距离由于《同义词词林》的应用可以兼顾同义词之间的替换,因此该方法与其他方法相比,描述句子的信息更加全面,试验结果表明该方法是有效的。 展开更多
关键词 相似计算 依存文法 改进编辑距离 句法分析
下载PDF
基于香气成分气相色谱-质谱指纹图谱的判别分析和相似度评价用于绿茶等级差异研究 被引量:24
12
作者 龙立梅 宋沙沙 曹学丽 《色谱》 CAS CSCD 北大核心 2019年第3期325-330,共6页
该文以研究指纹图谱在绿茶等级判别方面应用的可行性为目的。以信阳毛尖茶为研究对象,以茶汤香气成分为研究目标,采用顶空固相微萃取与气相色谱-质谱联用技术,筛选其香气特征成分,建立不同等级信阳毛尖茶香气成分GC-MS指纹图谱。发现运... 该文以研究指纹图谱在绿茶等级判别方面应用的可行性为目的。以信阳毛尖茶为研究对象,以茶汤香气成分为研究目标,采用顶空固相微萃取与气相色谱-质谱联用技术,筛选其香气特征成分,建立不同等级信阳毛尖茶香气成分GC-MS指纹图谱。发现运用判别分析法可以对2个系列7个等级41个信阳毛尖茶样进行很好的等级区分;通过不同等级色谱指纹图谱的相似度计算发现,相似度与茶样等级之间具有较好的相关性,尤其是对于品质较好的茶样,这种相关性更好。表明运用判别分析法和相似度计算方法能够反映绿茶等级之间的差异性,且基于相似度评价的方法具有客观量化的特征。 展开更多
关键词 气相色谱-质谱指纹图谱 判别分析 相似计算 等级相关性 香气成分 信阳毛尖茶
下载PDF
基于本体的个性化领域信息服务 被引量:17
13
作者 余正涛 宋丽哲 樊孝忠 《计算机工程》 EI CAS CSCD 北大核心 2005年第5期22-24,81,共4页
以数字图书馆领域个性化服务为例,以空间向量模型表示用户兴趣和资源特征,并借助于构建的领域本体和“知网”知识词典对向量进行概念上的扩展,形成用户和资源特征概念空间向量,并通过向量相似度计算寻找最优的资源,从而为用户提供个性... 以数字图书馆领域个性化服务为例,以空间向量模型表示用户兴趣和资源特征,并借助于构建的领域本体和“知网”知识词典对向量进行概念上的扩展,形成用户和资源特征概念空间向量,并通过向量相似度计算寻找最优的资源,从而为用户提供个性化信息服务。实验数据说明了基于概念的相似度计算比基于关键词的相似度计算具有更明显的优越性。 展开更多
关键词 个性化服务 本体论 特征提取 空间向量 相似计算
下载PDF
文本聚类中文本表示和相似度计算研究综述 被引量:23
14
作者 吴夙慧 成颖 +1 位作者 郑彦宁 潘云涛 《情报科学》 CSSCI 北大核心 2012年第4期622-627,共6页
围绕文本聚类中的文本表示和相似度计算两个基本的问题,对目前学界提出的文本表示方法和相似度计算方法进行了分类和较为全面的综述,将文本表示模型分为向量空间模型、语言模型、后缀树模型、本体等,相似度计算方法分为基于向量空间模... 围绕文本聚类中的文本表示和相似度计算两个基本的问题,对目前学界提出的文本表示方法和相似度计算方法进行了分类和较为全面的综述,将文本表示模型分为向量空间模型、语言模型、后缀树模型、本体等,相似度计算方法分为基于向量空间模型的相似度计算,基于短语的相似度计算方法和基于本体的相似度计算方法。 展开更多
关键词 文本聚类 文本表示 相似计算
原文传递
基于图计算的论文审稿自动推荐系统 被引量:21
15
作者 谢玮 沈一 马永征 《计算机应用研究》 CSCD 北大核心 2016年第3期798-801,共4页
针对传统审稿方式所存在的问题,设计了基于TextRank图算法思想的论文推荐系统,以实现论文审稿分配过程的自动化。系统通过加入词与词之间的影响力计算以及多文档集中逆文档频率IDF,实现关键词抽取部分,并使用基于余弦向量值的计算对抽... 针对传统审稿方式所存在的问题,设计了基于TextRank图算法思想的论文推荐系统,以实现论文审稿分配过程的自动化。系统通过加入词与词之间的影响力计算以及多文档集中逆文档频率IDF,实现关键词抽取部分,并使用基于余弦向量值的计算对抽取出的关键词向量进行相似度匹配,最后计算审稿人在各研究领域的影响力,实现论文的推荐。采用了综合考察准确率、召回率的F值作为评测指标,验证了该方法的有效性。在实际使用环境中,该系统具有较高的准确性与可靠性。 展开更多
关键词 论文推荐 推荐系统 审稿分配 关键词抽取 相似计算 计算
下载PDF
微博文本的句向量表示及相似度计算方法研究 被引量:21
16
作者 段旭磊 张仰森 孙祎卓 《计算机工程》 CAS CSCD 北大核心 2017年第5期143-148,共6页
在Word2vec框架内,针对微博文本的特点,提出采用词向量或高维词库映射计算句向量的方法。以3种算法构造句向量,即采用Word2vec对微博文本进行扩展后以TF-IDF方法表示句向量;将句子中每个词的词向量相加形成句向量;构建高维词库,将句子... 在Word2vec框架内,针对微博文本的特点,提出采用词向量或高维词库映射计算句向量的方法。以3种算法构造句向量,即采用Word2vec对微博文本进行扩展后以TF-IDF方法表示句向量;将句子中每个词的词向量相加形成句向量;构建高维词库,将句子中的每个词映射到高维词库形成句向量。对比3种训练句向量的方法,选出最适合微博领域的模型。实验结果表明,采用高维词库映射的方法对微博的句向量计算的效果最佳。 展开更多
关键词 微博文本 相似计算 词向量 高维词库 句向量
下载PDF
基于无机元素的含量判别食醋的种类和品牌方法研究 被引量:19
17
作者 陈燕清 倪永年 舒红英 《光谱学与光谱分析》 SCIE EI CAS CSCD 北大核心 2009年第10期2860-2863,共4页
化学计量学广泛应用于食品种类和原产地的区分。文章采用原子吸收法测定了32个食醋样品中的Mg,K,Pb,Zn,Fe,Mn,Ca和Cu等八种无机元素含量。采用向量相似法计算了陈醋和白醋以及同一种类不同品牌食醋的相似度;通过聚类分析和主成分分析对... 化学计量学广泛应用于食品种类和原产地的区分。文章采用原子吸收法测定了32个食醋样品中的Mg,K,Pb,Zn,Fe,Mn,Ca和Cu等八种无机元素含量。采用向量相似法计算了陈醋和白醋以及同一种类不同品牌食醋的相似度;通过聚类分析和主成分分析对来自北京、江西、江苏和山西4个地区品牌的食醋进行了分类,对不同种类的食醋(陈醋和白醋)也进行了分类。聚类分析和主成分分析都将食醋样品分为两大类,每个大类又将食醋样品按不同品牌分开。食醋中无机元素含量差异可作为食醋种类和品牌判别的测量指标之一。 展开更多
关键词 食醋 相似计算 聚类分析 主成分分析
下载PDF
基于LDA主题模型的短文本分类 被引量:19
18
作者 杨萌萌 黄浩 +2 位作者 程露红 马平 包武杰 《计算机工程与设计》 北大核心 2016年第12期3371-3377,共7页
针对传统VSM(vector space model)在短文本分类中维数高、语义特征不明显的问题,提出基于LDA(latent Dirichlet allocation)模型主题分布相似度分类方法;针对短文本内容少、长度短、特征稀疏的问题,提出基于LDA模型主题-词分布矩阵的主... 针对传统VSM(vector space model)在短文本分类中维数高、语义特征不明显的问题,提出基于LDA(latent Dirichlet allocation)模型主题分布相似度分类方法;针对短文本内容少、长度短、特征稀疏的问题,提出基于LDA模型主题-词分布矩阵的主题分布向量改进方法。与传统VSM分类方法相比,该方法降低了相似度计算维度,融合了一定语义特征。实验结果表明,与传统VSM分类方法相比,基于主题分布相似度方法的平均F1值提高了4.5%,基于LDA模型主题-词分布矩阵主题分布向量改进方法的平均F1值提高了5.2%,验证了以上方法的有效性。 展开更多
关键词 潜在狄利克雷分布(LDA) 向量空间模型(VSM) 短文本分类 K近邻(K-nearest neighbor) 吉布斯采样 相似计算
下载PDF
一种基于LDA的社区问答问句相似度计算方法 被引量:18
19
作者 熊大平 王健 林鸿飞 《中文信息学报》 CSCD 北大核心 2012年第5期40-45,共6页
传统的问答系统(QA)只是直接返回问题的答案,而且没有用户交互特性,而基于社区的问答系统(CQA),含有大量的"问答对"可以利用。该文提出了一种基于LDA的匹配框架来解决相似问句的匹配问题,分别从问句的统计信息、语义信息和主... 传统的问答系统(QA)只是直接返回问题的答案,而且没有用户交互特性,而基于社区的问答系统(CQA),含有大量的"问答对"可以利用。该文提出了一种基于LDA的匹配框架来解决相似问句的匹配问题,分别从问句的统计信息、语义信息和主题信息三个方面来计算问句相似度,综合得到整体相似度。实验是在Yahoo!Answers上抽取的真实标注数据集上进行,最终的实验结果表明,该文的方法达到了很好的性能。 展开更多
关键词 问句相似 LDA主题模型 社区问答 相似计算
下载PDF
改进的块匹配五台山壁画修复算法 被引量:18
20
作者 焦莉娟 王文剑 +1 位作者 李秉婧 赵青杉 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2019年第1期118-125,共8页
针对五台山壁画破损区域形状不规则、大小不均匀,采用Criminisi算法修复时易出现错误填充的问题,提出一种改进的块匹配五台山壁画数字化修复算法.首先在计算优先权,除置信度与数据项之外引入分散度项,确保信息最丰富的块被优先修复;然... 针对五台山壁画破损区域形状不规则、大小不均匀,采用Criminisi算法修复时易出现错误填充的问题,提出一种改进的块匹配五台山壁画数字化修复算法.首先在计算优先权,除置信度与数据项之外引入分散度项,确保信息最丰富的块被优先修复;然后结合图像块结构的整体性将协方差因子引入相似度计算中,以减少错误填充率.对五台山破损壁画进行数字化修复的实验结果表明,该算法较好地解决了Criminisi算法的错误填充问题. 展开更多
关键词 五台山壁画 壁画修复 信息离散 相似计算
下载PDF
上一页 1 2 39 下一页 到第
使用帮助 返回顶部