期刊文献+
共找到35篇文章
< 1 2 >
每页显示 20 50 100
利用《知网》和领域关键词集扩展方法的短文本分类研究 被引量:17
1
作者 李湘东 曹环 +1 位作者 丁丛 黄莉 《现代图书情报技术》 CSSCI 2015年第2期31-38,共8页
【目的】实现短文本特征扩展,提高短文本分类性能。【方法】按照特征词和隐含主题两种特征粒度,分别抽取训练集中各类别的高频词和主题核心词作为领域关键词集。利用概率主题模型提取待分类文本的主题概率分布,将概率大于某一阈值的主... 【目的】实现短文本特征扩展,提高短文本分类性能。【方法】按照特征词和隐含主题两种特征粒度,分别抽取训练集中各类别的高频词和主题核心词作为领域关键词集。利用概率主题模型提取待分类文本的主题概率分布,将概率大于某一阈值的主题对应的关键词扩展到待分类文本中。借助《知网》计算待分类文本与各领域关键词集的语义相似度。【结果】与LDA模型的短文本分类算法相比,本文提出的分类算法在复旦语料、Sogou语料和微博语料上的Macro_F1分别平均提高4.9%、5.9%和4.2%,在Micro_F1上分别平均提高4.6%、6.2%和2.8%。而与VSM的短文本分类算法相比,本文方法在各语料上都提高13%以上。且实验证明结合领域高频词和主题核心词的特征扩展方法的分类性能优于仅使用领域高频词或主题核心词进行特征扩展的方法。【局限】短文本中存在很多《知网》未收录的特征词,无法利用《知网》计算相似度,影响分类效果。【结论】本文方法能有效提高短文本分类性能。 展开更多
关键词 短文本分类 关键词集 LDA 特征扩展 知网
原文传递
作者关键词集的文献计量分析——以图情学科为例 被引量:10
2
作者 袁润 李莹 王婧怡 《图书情报研究》 2019年第1期90-95,共6页
[目的/意义]以图情学科为例,探索作者关键词集的特征,为这一层面的知识挖掘提供一个新的视角。[方法/过程]提出作者关键词集的概念,以图情领域的18种CSSCI源刊10年内的全部论文为研究对象,采用R语言编程技术,生成作者关键词数据集,包含... [目的/意义]以图情学科为例,探索作者关键词集的特征,为这一层面的知识挖掘提供一个新的视角。[方法/过程]提出作者关键词集的概念,以图情领域的18种CSSCI源刊10年内的全部论文为研究对象,采用R语言编程技术,生成作者关键词数据集,包含作者发文量、关键词总量、关键词种数、低频关键词占比、中频关键词占比、高频关键词占比、Top关键词、关键词集的相似度、关键词共现网络参数等,探索作者关键词集的词频、相似性比较和共现网络。[结果/结论]图情学科作者的关键词特征为低频关键词占比较高,高频关键词占比较低,相对分散。同时指出作者关键词集能够表征作者研究主题和兴趣,借助作者关键词集相似度指标,可以构建作者共现网络,而作者关键词共现网络中心性指标可以揭示作者研究领域、研究主题或研究方向。 展开更多
关键词 文献计量 关键词集 词频 共现网络 R语言
下载PDF
单文档关键词自动提取方法述评 被引量:2
3
作者 张越龄 《信息工程期刊(中英文版)》 2013年第1期1-7,共7页
关键词作为定义一篇文章主旨的重要元素,在文本处理、文档聚类、数据挖掘、新闻阅读、机器翻译、自动问答系统等多个方面都扮演着重要的角色。本文对单文档关键词提取方法进行了综述,分析了现有提取方法的技术特点、优势与不足,并指... 关键词作为定义一篇文章主旨的重要元素,在文本处理、文档聚类、数据挖掘、新闻阅读、机器翻译、自动问答系统等多个方面都扮演着重要的角色。本文对单文档关键词提取方法进行了综述,分析了现有提取方法的技术特点、优势与不足,并指出提高关键词自动标注算法的实用性是未来的研究热点。 展开更多
关键词 关键词 提取算法 语料库 词共现 词汇链 PAGERANK算法
下载PDF
KRBKSS: a keyword relationship based keyword-set search system for peer-to-peer networks 被引量:1
4
作者 张亮 邹福泰 马范援 《Journal of Zhejiang University-Science A(Applied Physics & Engineering)》 SCIE EI CAS CSCD 2005年第6期577-582,共6页
may incur significant bandwidth for executing more com- plicated search queries such as multiple-attribute queries. In order to reduce query overhead, KSS (keyword-set search) by Gnawali partitions the index by a set ... may incur significant bandwidth for executing more com- plicated search queries such as multiple-attribute queries. In order to reduce query overhead, KSS (keyword-set search) by Gnawali partitions the index by a set of keywords. However, a KSS index is considerably larger than a standard inverted index, since there are more word sets than there are individual words. And the insert overhead and storage overhead are obviously un- acceptable for full-text search on a collection of documents even if KSS uses the distance window technology. In this paper, we extract the relationship information between query keywords from websites’ queries logs to improve performance of KSS system. Experiments results clearly demonstrated that the improved keyword-set search system based on keywords relationship (KRBKSS) is more efficient than KSS index in insert overhead and storage overhead, and a standard inverted index in terms of communication costs for query. 展开更多
关键词 Peer-to-peer (P2P) keyword-set search (KSS) keyword relationship
下载PDF
时间序列下关键词多词共现分析及研究热点预测——以我国图情领域核心期刊为例 被引量:1
5
作者 肖明 徐烨 《情报探索》 2019年第11期115-120,共6页
[目的/意义]提出挖掘关键词多词共现的方法,从而揭示领域的研究主题并预测未来的研究热点。[方法/过程]以我国图情领域为例,通过Apriori算法,对近12年15种核心期刊关键词矩阵进行关联规则挖掘,并结合时间序列预测法对挖掘出的关键词集... [目的/意义]提出挖掘关键词多词共现的方法,从而揭示领域的研究主题并预测未来的研究热点。[方法/过程]以我国图情领域为例,通过Apriori算法,对近12年15种核心期刊关键词矩阵进行关联规则挖掘,并结合时间序列预测法对挖掘出的关键词集进行短期预测。[结果/结论]该方法挖掘出442组关键词集,得出近12年来我国图情领域的研究热点,并选择了4组典型的关键词集进行短期预测,分析这些领域的未来趋势。 展开更多
关键词 多词共现 APRIORI算法 时间序列预测法 关键词集 研究热点
下载PDF
PMkSK:一种空间关键字移动近邻查询并行处理方法
6
作者 李传文 谷峪 +1 位作者 张统 于戈 《东南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2015年第5期840-844,共5页
为了提高空间关键字移动k近邻查询处理效率,提出关键字影响集的概念,并设计了一种基于关键字影响集的空间关键字移动近邻查询并行处理方法.该方法包含一种并行查询算法和一种并行验证算法.首先,采用并行查询算法计算近邻结果;然后,确定... 为了提高空间关键字移动k近邻查询处理效率,提出关键字影响集的概念,并设计了一种基于关键字影响集的空间关键字移动近邻查询并行处理方法.该方法包含一种并行查询算法和一种并行验证算法.首先,采用并行查询算法计算近邻结果;然后,确定查询区域,并在区域内查找包含的关键字影响集;最后,在查询者移动时不断通过并行验证算法验证影响集,以实现空间关键字移动近邻查询处理.实验结果表明:这2种算法的时间复杂度分别为O((log D+k)/k)和O(logk),均为现有对应算法的O(1/k),其中D为空间对象数目.在多核系统上,这2种算法的运行时间均比现有算法低一个数量级.基于影响集的并行查询处理方法避免了基于安全区域的移动k近邻查询处理方法中更新代价和更新频率难以同时取得最优的固有缺点,可以高效地处理关键字移动k近邻查询. 展开更多
关键词 K近邻 影响集 空间移动查询 安全区域
下载PDF
远洋船舶运输大数据快速检索算法
7
作者 李凤云 《舰船科学技术》 北大核心 2019年第2期190-192,共3页
传统船舶数据检索算法存在关键字索引连接速率过慢、单次检索数据总量过低等弊端。为解决上述问题,设计新型远洋船舶运输大数据快速检索算法。通过关键字索引结构建立、数据查询节点确定2个步骤,完成远洋船舶运输大数据的索引与查询。... 传统船舶数据检索算法存在关键字索引连接速率过慢、单次检索数据总量过低等弊端。为解决上述问题,设计新型远洋船舶运输大数据快速检索算法。通过关键字索引结构建立、数据查询节点确定2个步骤,完成远洋船舶运输大数据的索引与查询。在此基础上,通过远洋船舶运输数据集创建、待检索数据捕获处理、减速流程完善3个步骤,实现新型快速检索算法的顺利运行。对比实验结果表明,与传统船舶数据检索算法相比,应用新型远洋船舶运输大数据快速检索算法后,关键字索引连接速率明显提升、单次检索数据总量最大值超过9.0×10~9 T。 展开更多
关键词 运输大数据 快速检索 关键字索引 查询节点 数据集 捕获处理
下载PDF
作者合著网络中研究兴趣相似性实证研究 被引量:27
8
作者 李纲 李岚凤 +1 位作者 毛进 叶光辉 《图书情报工作》 CSSCI 北大核心 2015年第2期75-81,共7页
[目的/意义]从作者微观个体研究兴趣角度出发,通过对作者合著网络中作者关联关键词集的研究,定量地验证研究兴趣相似是作者合作的一个动机。[方法/过程]收集WOS中检索领域相关文献题录信息,构建作者合著网络,并利用Louvain算法划分社区... [目的/意义]从作者微观个体研究兴趣角度出发,通过对作者合著网络中作者关联关键词集的研究,定量地验证研究兴趣相似是作者合作的一个动机。[方法/过程]收集WOS中检索领域相关文献题录信息,构建作者合著网络,并利用Louvain算法划分社区,实现了Jaccard系数及余弦相似性系数的计算指标,统计与对比分析整体网络及社区内部作者研究兴趣的相似性。[结果/结论]在网络整体层次,作者合著网络中作者的研究兴趣相似性较高,但也存在一定比例的差异性即互补性;在科研社区内部,合著作者平均研究兴趣相似性及互补性均高于网络整体层次,科研社区的形成受到作者研究兴趣的影响。两个层次的兴趣相似性反映了研究兴趣相似是作者合作的一个重要动机。 展开更多
关键词 作者合著网络 合著动机 关键词集 研究兴趣相似性
原文传递
基于粗集理论的中文关键词短语构成规则挖掘 被引量:17
9
作者 刘远超 王晓龙 +1 位作者 徐志明 刘秉权 《电子学报》 EI CAS CSCD 北大核心 2007年第2期371-374,共4页
短语比词信息量更加丰富,更能够体现原文的主题,通常所说的关键词实际上多数为短语形式.然而目前的问题是关键词短语的自动标引缺乏统一的规则指导.本文利用粗集理论在数据泛化和知识约简方面的优势,对人工标注的人民日报关键词短语语... 短语比词信息量更加丰富,更能够体现原文的主题,通常所说的关键词实际上多数为短语形式.然而目前的问题是关键词短语的自动标引缺乏统一的规则指导.本文利用粗集理论在数据泛化和知识约简方面的优势,对人工标注的人民日报关键词短语语料进行了挖掘,从而得到了中文关键词短语的若干构成规则.规则可以用于自动关键词抽取,也可以对手工关键词标引进行指导.实验结果表明获取的规则使关键词自动抽取的性能有较大改善. 展开更多
关键词 抽取 关键词短语 粗集理论 规则挖掘
下载PDF
基于值约简和决策树的最简规则提取算法 被引量:15
10
作者 罗秋瑾 陈世联 《计算机应用》 CSCD 北大核心 2005年第8期1853-1855,共3页
粗糙集理论中的值约简和数据挖掘领域中的决策树都是有效的分类方法,但二者都有其局限性。将这两种方法结合起来,生成一种新的基于值核的极小化方法对决策树进行修剪,提出了约简规则的判定准则,缩小了约简的范围,最后再对生成的规则进... 粗糙集理论中的值约简和数据挖掘领域中的决策树都是有效的分类方法,但二者都有其局限性。将这两种方法结合起来,生成一种新的基于值核的极小化方法对决策树进行修剪,提出了约简规则的判定准则,缩小了约简的范围,最后再对生成的规则进行极大化处理,以保证规则覆盖信息的一致性,实验验证了该算法的有效性。 展开更多
关键词 粗糙集 数据挖掘 决策树 值约简 分类规则
下载PDF
基于粗集理论的地下水水质指标属性约简 被引量:7
11
作者 熊建秋 李祚泳 邹长武 《水科学进展》 EI CAS CSCD 北大核心 2005年第4期494-499,共6页
粗集理论是一种处理不确定和不精确问题的新型数学工具。将粗集理论用于地下水水质指标属性约简,采用区分矩阵属性约简算法对原有的4个水质指标进行分析,发现仅需要其中的3个就可以表达相同的地下水水质级别区分能力,还得出了各水质指... 粗集理论是一种处理不确定和不精确问题的新型数学工具。将粗集理论用于地下水水质指标属性约简,采用区分矩阵属性约简算法对原有的4个水质指标进行分析,发现仅需要其中的3个就可以表达相同的地下水水质级别区分能力,还得出了各水质指标相对于地下水水质级别的属性重要性。理论分析和应用实践表明了粗集理论用于地下水水质指标属性约简具有简便、准确和实用性强等特点。 展开更多
关键词 粗集 属性重要性 属性约简 地下水水质
下载PDF
英语专业四级口试对口语教学的反拨效应及启示 被引量:5
12
作者 黄红兰 《韶关学院学报》 2004年第11期133-136,共4页
反拨效应(washback)是指测试对相应的教学和学习产生的影响。问卷调查的数据分析和访谈结果表明:大部分考生和教师对TEM4-SET总体评价较好,认为TEM4-SET对口语教学产生正面的积极的反拨效应。
关键词 全国英语专业四级口试 口语教学 反拨效应 口语能力
下载PDF
一种改进的SVM算法 被引量:6
13
作者 郑春颖 《航空计算技术》 2005年第2期6-8,共3页
当训练集的规模很大特别是支持向量很多时,支持向量机的学习过程需要占用大量的内存,寻优速度非常缓慢,这给实际应用带来了很大的麻烦。文献[4]提出了一种针对大规模样本集的学习策略,该方法虽大幅降低了学习的代价,但存在着一个致命的... 当训练集的规模很大特别是支持向量很多时,支持向量机的学习过程需要占用大量的内存,寻优速度非常缓慢,这给实际应用带来了很大的麻烦。文献[4]提出了一种针对大规模样本集的学习策略,该方法虽大幅降低了学习的代价,但存在着一个致命的弱点:如果初始样本集选择不当,SVM的分类精度将得不到保障。基于此,本文引入了“最远邻”,对文献[4]中算法进行了改进。实验表明,采用这种改进的算法不仅保留了文献[4]方法的优点,而且这样获得的分类器的分类精度完全可以与直接通过大规模样本集训练得到的分类器的分类精度相媲美,甚至更优。 展开更多
关键词 支持向量机 训练集 分类精度
下载PDF
一种非参数估计的活动围道图像分割方法 被引量:5
14
作者 杨鸿波 时永刚 邹谋炎 《电子与信息学报》 EI CSCD 北大核心 2004年第12期1849-1855,共7页
该文采用Parzen窗非参数估计的活动围道方法进行图像分割,不必假定图像区域符合特定的概率分布,大大增加了该算法的应用范围。通过动态调整Parzen窗口参数,更好地利用了图像灰度区域一致的信息,使之更好地适应图像分割的任务。通过合成... 该文采用Parzen窗非参数估计的活动围道方法进行图像分割,不必假定图像区域符合特定的概率分布,大大增加了该算法的应用范围。通过动态调整Parzen窗口参数,更好地利用了图像灰度区域一致的信息,使之更好地适应图像分割的任务。通过合成图像和真实图像的实验证明此方法具有很好的合理性,具有很好的分割精度和抗噪性能。 展开更多
关键词 非参数概率密度估计 PARZEN窗 活动围道 水平截集 图像分割
下载PDF
具有隐私保护的完整性可验证的关键字搜索方案 被引量:5
15
作者 刘雪艳 芦婷婷 杨晓涛 《电子与信息学报》 EI CSCD 北大核心 2021年第1期218-225,共8页
针对传统基于属性关键字搜索(ABKS)方案存在访问结构泄密、用户侧计算量高及缺乏完整性验证问题,该文提出具有隐私保护和完整性可验证的基于属性的关键字搜索方案。该方案提出了有序多值属性访问结构和有序多值属性集,固定每个属性的位... 针对传统基于属性关键字搜索(ABKS)方案存在访问结构泄密、用户侧计算量高及缺乏完整性验证问题,该文提出具有隐私保护和完整性可验证的基于属性的关键字搜索方案。该方案提出了有序多值属性访问结构和有序多值属性集,固定每个属性的位置,减少参数及相关计算,提高了方案的效率,而在密钥生成时计算具体属性取值的哈希值,从而达到区别多值属性取值的不同。同时,采用Hash和对运算实现对访问结构的隐藏,防止访问结构泄密;采用倒序索引结构和Merkle树建立数据认证树,可验证云服务器返回文档和外包解密结果的正确性。此外,支持外包解密以降低用户侧的计算量。安全分析和实验表明所提方案实现云中共享数据的可验证性、关键字不可区分性和关键字不可链接性,且是高效的。 展开更多
关键词 基于属性关键字搜索 有序多值属性集 隐藏访问结构 数据完整性认证 外包解密
下载PDF
基于粗集推理的大坝安全监测预报模型研究 被引量:4
16
作者 雷鹏 顾冲时 《河海大学学报(自然科学版)》 CAS CSCD 北大核心 2005年第4期391-394,共4页
针对传统大坝安全监测预报模型存在的受环境量相关性影响较大和网络训练时间长、易收敛到局部最优点等缺点,通过对原始监测信息的粗糙集预处理提取主要影响因素和决策规则集,并通过对规则集的不确定性推理建立了大坝监测的粗集预报模型... 针对传统大坝安全监测预报模型存在的受环境量相关性影响较大和网络训练时间长、易收敛到局部最优点等缺点,通过对原始监测信息的粗糙集预处理提取主要影响因素和决策规则集,并通过对规则集的不确定性推理建立了大坝监测的粗集预报模型.与传统方法相比,粗集预报模型不依赖于具体的数学模型,所得到的预报值是一定可信度下的区间值,并且预测值区间与实测值区间基本一致. 展开更多
关键词 大坝安全监测 粗集理论 不确定性推理 区间预报
下载PDF
赤水河中上游地区生态与环境评价信息系统建立的必要性 被引量:4
17
作者 范光先 吕云怀 《酿酒》 CAS 2005年第4期5-7,共3页
运用生态经济学原理、土地经济学理论、区域经济学原理、可持续发展理论及3S技术,采用统计分析、对比分析、系统分析等方法,分析赤水河流域生态环境存在的主要问题,并对生态环境退化的环境效应进行分析评价,特别是对流域中上游地区生态... 运用生态经济学原理、土地经济学理论、区域经济学原理、可持续发展理论及3S技术,采用统计分析、对比分析、系统分析等方法,分析赤水河流域生态环境存在的主要问题,并对生态环境退化的环境效应进行分析评价,特别是对流域中上游地区生态破坏对茅台集团企业发展的现实及潜在影响进行对比分析,建立流域资源与环境的信息系统,是解决赤水河流域的生态环境问题:水土流失日益严重,土地生态系统功能弱化;喀斯特地区的石漠化问题;自然保护区的保护与人口、经济发展矛盾日益突出,森林植被、微生物种破坏严重,生物多样性衰退;矿产资源及城市发展所产生的水资源环境及大气污染等问题的理论基础。 展开更多
关键词 建立 资源与环境信息系统 解决 生态环境问题
下载PDF
双布鲁姆过滤器法查询集合成员 被引量:2
18
作者 田小梅 张大方 +1 位作者 史长琼 杨晓波 《计算机工程与应用》 CSCD 2012年第28期10-15,共6页
探讨双布鲁姆过滤器查询法查询集合并集、交集、补集、差集或对称差成员的性能问题。理论分析和实验结果表明,双布鲁姆过滤器查询法能够较好地支持集合并集、交集、补集、差集及对称差的成员查询问题,其中双布鲁姆过滤器并集及交集查询... 探讨双布鲁姆过滤器查询法查询集合并集、交集、补集、差集或对称差成员的性能问题。理论分析和实验结果表明,双布鲁姆过滤器查询法能够较好地支持集合并集、交集、补集、差集及对称差的成员查询问题,其中双布鲁姆过滤器并集及交集查询不会产生假阴性,仅有少量假阳性的存在,而双布鲁姆过滤器补集、差集及对称差查询则除存在少量假阳性外,还存在少量假阴性。 展开更多
关键词 布鲁姆过滤器 数据同步 多关键字检索 集合调和
下载PDF
成品油销售企业会计机构设置及财务管理探讨(项目研究节选) 被引量:2
19
作者 李显章 黎晓 +4 位作者 王小凯 汪永贵 王中艾 田惠宏 汪家玉 《石油化工管理干部学院学报》 2004年第3期1-4,共4页
成品油市场对外开放后,销售企业将面临激烈竞争、体制机制与外部环境不适应等方面的压力。中国石化已确定销售企业改革总体目标,按照"区域化、专业化、扁平化"的原则,实现物流、零售、直销的经营专业化管理。为适应新的经营... 成品油市场对外开放后,销售企业将面临激烈竞争、体制机制与外部环境不适应等方面的压力。中国石化已确定销售企业改革总体目标,按照"区域化、专业化、扁平化"的原则,实现物流、零售、直销的经营专业化管理。为适应新的经营管理体制,需要对现有的财会核算管理体制及流程重新再造。分析目前成品油销售企业的财务管理体制与现状;按照"财务会计分设、财会人员委派、会计一级核算、财务统一管理"的原则,提出财会体制和核算流程再造的思路。 展开更多
关键词 成品油销售企业 会计机构设置 财务管理 项目研究 财会体制 经营专业化 成品油市场 适应 原则 激烈竞争
下载PDF
基于Rough Set的网络媒体受众分析模型的研究 被引量:2
20
作者 朱李莉 卢冰原 彭扬 《现代情报》 北大核心 2005年第7期10-12,共3页
文章首先介绍了网络媒体受众分析的目标和需求,以及网络媒体受众信息中存在的不确定性问题,然后给出了基于RoughSet理论和遗传算法的受众分类规则挖掘模型,最后通过一个实例验证了该模型的有效性。
关键词 媒介管理 受众 粗糙集 遗传算法
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部