期刊文献+
共找到61篇文章
< 1 2 4 >
每页显示 20 50 100
基于数据挖掘的新词发现 被引量:8
1
作者 王立希 王建东 汪静 《计算机应用研究》 CSCD 北大核心 2006年第12期195-197,共3页
利用文本挖掘技术提出了一种用于主题式搜索引擎的专业词典库发现新专业词汇的方法,详述了如何通过关联规则挖掘来实现专业词典库的扩展,并在此基础上进行了小样本实验,实验结果显示该方法有效可行。
关键词 文本挖掘 关联规则 搜索引擎 专业词典库
下载PDF
基于语义web的智能信息检索关键技术研究 被引量:6
2
作者 贾保先 徐建良 +1 位作者 姚文琳 张子阵 《微计算机信息》 北大核心 2006年第11X期241-243,共3页
本文对基于语义web的智能信息检索系统开发中所涉及的若干关键技术进行了深入的分析研究,提出了有效的解决方案,为智能检索系统的实现提供了技术支持。这些关键技术包括:关联搜索、信息资源收集和语义推理。
关键词 关联搜索 智能信息检索 语义推理 贝叶斯网络
下载PDF
中国包装产业大数据知识图谱应用系统的设计 被引量:7
3
作者 廖立君 吴岳忠 李长云 《包装工程》 CAS 北大核心 2019年第21期140-150,共11页
目的针对目前包装产业存在的产业链长、数据大而散、包装领域知识不全面等问题,设计一个中国包装产业大数据知识图谱应用系统。方法从行业高度定义涵盖包装领域全生态的分类体系,结合人工智能中知识图谱的最新技术,对政府信息、工商信... 目的针对目前包装产业存在的产业链长、数据大而散、包装领域知识不全面等问题,设计一个中国包装产业大数据知识图谱应用系统。方法从行业高度定义涵盖包装领域全生态的分类体系,结合人工智能中知识图谱的最新技术,对政府信息、工商信息、行业信息、学术论文、全球包装专利等互联网上各类数据进行自动采集汇聚,抽取出知识信息,融合成一个涵盖资讯、政策、会议、标准、论文、专利、企业、产品、高校、机构和专家等十几类信息的包装知识图谱知识库。结果系统主要功能包括数据采集、知识图谱和终端应用,实现了包装产业大数据的图谱探索、产业链图、数据报告和关联搜索。结论该系统使用方便,可从多视图、多维度获取包装产业相关数据,提升行业的数字化和信息化水平,加速中国包装行业的智能化产业升级,促进包装产业逐步向智能、绿色、集约、创新方向发展。 展开更多
关键词 包装产业大数据 知识图谱 图谱探索 关联搜索 全生态链
下载PDF
基于用户搜索行为的query-doc关联挖掘 被引量:6
4
作者 朱亮 陆静雅 左万利 《自动化学报》 EI CSCD 北大核心 2014年第8期1654-1666,共13页
query和doc之间的关联关系是搜索引擎期望获取的一类有价值的信息.query和doc间准确的关联分析不仅可以帮助搜索结果排序,也在query和doc之间的桥接中起到重要作用,以实现相关query和doc之间的信息传递,有利于更深入的query理解和doc理... query和doc之间的关联关系是搜索引擎期望获取的一类有价值的信息.query和doc间准确的关联分析不仅可以帮助搜索结果排序,也在query和doc之间的桥接中起到重要作用,以实现相关query和doc之间的信息传递,有利于更深入的query理解和doc理解,并在此基础上开展相关应用.本文提出了一种基于用户搜索行为的query和doc关联关系挖掘算法,该方法首先对用户搜索点击日志中的数据进行整理与分析,构建query与doc间的二部图,再通过采用马尔可夫随机游走模型对二部图数据进行建模,挖掘二部图中的点击数据和session数据,最终挖掘出点击日志中用户没有点击到的doc数据,从而预测出query和doc间的隐含关联关系,同时也可以利用该算法得到query和query潜在的关联关系.基于以上理论基础,我们实现了一套完整的日志挖掘系统,通过大量的实验对比,该系统在各方面均取得了优异的表现,其中对检索结果相关性的性能提升可以达到71.23%,这充分表明,本文所提出的理论和算法能够很好地解决query和doc之间的隐含关系挖掘问题,为提高搜索结果的召回率、实现查询推荐和检索结果聚类奠定了良好的前提基础. 展开更多
关键词 关联关系 搜索行为 马尔可夫随机游走 查询推荐 检索结果聚类
下载PDF
文本数据主题挖掘与关联搜索研究 被引量:6
5
作者 朱卫星 徐伟光 +1 位作者 何红悦 李雯 《计算机科学》 CSCD 北大核心 2017年第B11期411-413,456,共4页
文本数据是存储和交换信息最自然的方式,文本挖掘技术可以发现海量文本数据中隐藏的潜在知识模式。研究了文本数据主题挖掘与关联搜索技术,首先通过文本解析提取、分词预处理和索引等进行文本信息处理,然后利用基于潜在语义关系的主题... 文本数据是存储和交换信息最自然的方式,文本挖掘技术可以发现海量文本数据中隐藏的潜在知识模式。研究了文本数据主题挖掘与关联搜索技术,首先通过文本解析提取、分词预处理和索引等进行文本信息处理,然后利用基于潜在语义关系的主题发现模型挖掘大量文本数据中隐藏的主题信息,最后利用主题模型计算关键词间的关联程度进行查询扩展,从而实现关联搜索。实现了一个文本数据挖掘与关联搜索的原型系统,对Tancorp数据集进行主题发现和关联搜索,并以视化和网页同步显示关联搜索的过程。 展开更多
关键词 文本挖掘 主题发现 关联搜索
下载PDF
一种高效的改进频繁项集挖掘算法 被引量:5
6
作者 王杰 乐红兵 《微电子学与计算机》 CSCD 北大核心 2018年第2期49-51,共3页
提出一种结合投影与排序频繁项集位置索引表的挖掘频繁项集改进算法,通过单趟扫描数据库,建立存储项集关系的"投影"数据结构,直接找到频繁1-项集及通过内积运算获得频繁2-项集.然后建立高阶项集的位置索引表,通过跨越式搜索... 提出一种结合投影与排序频繁项集位置索引表的挖掘频繁项集改进算法,通过单趟扫描数据库,建立存储项集关系的"投影"数据结构,直接找到频繁1-项集及通过内积运算获得频繁2-项集.然后建立高阶项集的位置索引表,通过跨越式搜索和连接,依次找出后续频繁项集.通过实验分析,大大提高了寻找频繁项集的效率. 展开更多
关键词 关联规则 频繁项集 位置索引表 跨越搜索
下载PDF
一种基于Rough本体的语义搜索引擎模型 被引量:4
7
作者 胡军 李志露 《微计算机信息》 北大核心 2008年第24期180-182,共3页
基于关键字匹配的搜索引擎无法反映Web信息在现实世界中的语义,由此不可避免地导致查准率和查全率低的缺陷;另一方面,目前本体支持的形式化概念还不足以表示不完备知识。因此本文结合Rough本体理论,提出了一种基于Rough本体的语义搜索... 基于关键字匹配的搜索引擎无法反映Web信息在现实世界中的语义,由此不可避免地导致查准率和查全率低的缺陷;另一方面,目前本体支持的形式化概念还不足以表示不完备知识。因此本文结合Rough本体理论,提出了一种基于Rough本体的语义搜索引擎模型,讨论了模型设计和实现其中的若干关键技术,最后对模型的实现技术进行概述。 展开更多
关键词 Rough本体 信息检索 关联搜索 检索模型
下载PDF
一个基于关联规则的Web信息检索模型 被引量:5
8
作者 关戍 庄成三 陈定涛 《计算机应用》 CSCD 北大核心 2003年第3期88-90,共3页
针对Web信息检索系统在大数据量下的数据存储、数据调度与工作的效率问题 ,分析了数据挖掘在Internet信息检索中的运用 ,提出了一个基于关联规则的Web信息检索模型 ,并以逻辑层次、服务域与数据路由为中心 ,给出了这个模型的结构、算法... 针对Web信息检索系统在大数据量下的数据存储、数据调度与工作的效率问题 ,分析了数据挖掘在Internet信息检索中的运用 ,提出了一个基于关联规则的Web信息检索模型 ,并以逻辑层次、服务域与数据路由为中心 ,给出了这个模型的结构、算法与设计思想。 展开更多
关键词 关联规则 WEB 信息检索模型 INTERNET 数据调度 负属性
下载PDF
一种基于序列数的关联规则挖掘算法 被引量:5
9
作者 王仕平 蒋玲 +1 位作者 熊江 方刚 《西南大学学报(自然科学版)》 CAS CSCD 北大核心 2011年第3期122-127,共6页
在关联规则挖掘研究中,为了在产生候选频繁项时减少算法存在的重复计算和冗余候选项,为了在计算支持数时减少扫描事务数据库的次数,提出了一种基于序列数的关联规则挖掘算法,其关联规则适合挖掘任何长度.该算法用事务属性的布尔约简法,... 在关联规则挖掘研究中,为了在产生候选频繁项时减少算法存在的重复计算和冗余候选项,为了在计算支持数时减少扫描事务数据库的次数,提出了一种基于序列数的关联规则挖掘算法,其关联规则适合挖掘任何长度.该算法用事务属性的布尔约简法,将传统事务数据转换成二进制数,然后用数字的递增和递减两种方式双向搜索候选频繁项;算法通过序列数的度来计算支持数,实现一次扫描数据库,有效地提高了算法的效率. 展开更多
关键词 数据挖掘 关联规则 布尔约简法 双向搜索 序列数
下载PDF
基于关联规则的铁路调度集中系统进路自动化搜索算法
10
作者 牛林杰 吴建军 《公路工程》 2023年第5期192-198,共7页
铁路调度集中系统进路自动化搜索算法的搜索性能决定了铁路调度水平,为提升铁路调度集中系统的调度性能,研究基于关联规则的铁路调度集中系统进路自动化搜索算法。采用关联规则算法挖掘铁路调度集中系统的车站进路数据,获取站场进路网... 铁路调度集中系统进路自动化搜索算法的搜索性能决定了铁路调度水平,为提升铁路调度集中系统的调度性能,研究基于关联规则的铁路调度集中系统进路自动化搜索算法。采用关联规则算法挖掘铁路调度集中系统的车站进路数据,获取站场进路网格序列信息,计算站场进路网格各节点的重要度,设置重要度较高的节点为进路自动化搜索的路径节点;采用蚁群算法搜索关联规则算法获取的全部路径节点,依据蚁周模型更新全部路径的信息素浓度,直至满足终止条件,此时输出的结果即铁路调度集中系统进路自动化搜索结果。实验结果表明,该算法可以实现铁路调度集中系统进路的自动化搜索,启发因子为3,信息素残留因子为0.5时,进路自动化搜索性能最佳。 展开更多
关键词 关联规则 铁路调度 集中系统 进路 自动化 搜索算法
下载PDF
基于二进制的约束性关联规则挖掘算法 被引量:4
11
作者 方刚 《计算机工程》 CAS CSCD 北大核心 2009年第7期78-81,共4页
提出一种基于二进制的约束性关联规则挖掘算法,用数字区间确定候选频繁项的范围,通过数值的递增/减方式交叉产生候选项,利用二进制的逻辑操作计算支持数,并用数字特征减少扫描事务数,以提取满足约束条件的关联规则。该算法适于挖掘任何... 提出一种基于二进制的约束性关联规则挖掘算法,用数字区间确定候选频繁项的范围,通过数值的递增/减方式交叉产生候选项,利用二进制的逻辑操作计算支持数,并用数字特征减少扫描事务数,以提取满足约束条件的关联规则。该算法适于挖掘任何长度的约束性频繁项目集,且具有较高的运算效率。 展开更多
关键词 关联规则 约束条件 交叉搜索 数字特征 二进制
下载PDF
基于关联规则的搜索引擎方法 被引量:4
12
作者 姚全珠 彭程 +1 位作者 宋志理 李薇 《计算机工程与应用》 CSCD 北大核心 2011年第9期134-136,145,共4页
针对传统的搜索引擎关键词提取算法在实现检索时存在的局限性,在本体推理的基础上,运用基于Apriori算法的关联规则推理过滤,实现对无用词项的过滤和有用信息的提取。实验表明,基于关联规则的Apriori算法,在无用词项过滤和有用信息提取方... 针对传统的搜索引擎关键词提取算法在实现检索时存在的局限性,在本体推理的基础上,运用基于Apriori算法的关联规则推理过滤,实现对无用词项的过滤和有用信息的提取。实验表明,基于关联规则的Apriori算法,在无用词项过滤和有用信息提取方面,与传统的搜索引擎关键词提取算法相比,具有较好的查全率和效率。 展开更多
关键词 关联规则 APRIORI算法 搜索引擎
下载PDF
基于路径搜索的配电网多端行波故障定位算法 被引量:2
13
作者 游金梁 张帝 +1 位作者 康童 朱哲明 《湖南电力》 2022年第1期43-47,52,共6页
配电网结构复杂,多为树形辐射状分布,馈线上分支多,且网络拓扑结构经常发生改变,传统的故障定位方法很难适用于配电网的准确故障定位。提出基于路径搜索的配电网多端行波故障定位算法,首先构建一种新的配电网关联矩阵,充分表达配电网的... 配电网结构复杂,多为树形辐射状分布,馈线上分支多,且网络拓扑结构经常发生改变,传统的故障定位方法很难适用于配电网的准确故障定位。提出基于路径搜索的配电网多端行波故障定位算法,首先构建一种新的配电网关联矩阵,充分表达配电网的拓扑结构;然后提出路径搜索的方法,对各末端节点间的最短路径及所经过的线路进行排列;最后综合利用多端暂态行波信息,实现对配电网的准确定位。仿真结果表明;该算法可以快速准确地给出故障距离,且路径搜索可以实现配电网中初始行波传播过程。 展开更多
关键词 配电网 故障定位 行波 关联矩阵 路径搜索
下载PDF
基于排序索引矩阵的频繁项集挖掘算法 被引量:3
14
作者 荀娇 徐连诚 杨仁华 《计算机工程》 CAS CSCD 2012年第19期41-44,48,共5页
针对Apriori算法产生候选项集的问题,提出一种基于排序索引矩阵(SIM)的频繁项集挖掘算法。将频繁1-项集形成的1-项集向量依次与对应矩阵相乘,生成频繁2-项集。从频繁3-项集开始,对每次生成的频繁k-项集建立SIM,借助SIM结构实现项集的跨... 针对Apriori算法产生候选项集的问题,提出一种基于排序索引矩阵(SIM)的频繁项集挖掘算法。将频繁1-项集形成的1-项集向量依次与对应矩阵相乘,生成频繁2-项集。从频繁3-项集开始,对每次生成的频繁k-项集建立SIM,借助SIM结构实现项集的跨越式搜索和连接。整个过程只需扫描一次数据库,不会产生候选项集。实验结果表明,该算法能提高频繁项集的挖掘效率。 展开更多
关键词 关联规则 排序索引矩阵 候选项集 频繁项集 跨越式搜索 数据挖掘
下载PDF
A new fast algorithm for multitarget tracking in dense clutter 被引量:1
15
作者 Weihua QIN Fei HU Chaoyin QIN 《控制理论与应用(英文版)》 EI 2005年第4期383-386,共4页
A fast joint probabilistic data association (FJPDA) algorithm is proposed in tiffs paper. Cluster probability matrix is approximately calculated by a new method, whose elements βi^t(K) can be taken as evaluation ... A fast joint probabilistic data association (FJPDA) algorithm is proposed in tiffs paper. Cluster probability matrix is approximately calculated by a new method, whose elements βi^t(K) can be taken as evaluation functions. According to values of βi^t(K), N events with larger joint probabilities can be searched out as the events with guiding joint probabilities, tiros, the number of searching nodes will be greatly reduced. As a result, this method effectively reduces the calculation load and nnkes it possible to be realized on real-thne, Theoretical ,analysis and Monte Carlo simulation results show that this method is efficient. 展开更多
关键词 Data association Multitarget tracking Cluster probability matrix search-tree
下载PDF
A Novel Personalized Web Search Model
16
作者 ZHU Zhengyu XU Jingqiu TIAN Yunyan REN Xiang 《Wuhan University Journal of Natural Sciences》 CAS 2007年第5期897-901,共5页
A novel personalized Web search model is proposed. The new system, as a middleware between a user and a Web search engine, is set up on the client machine. It can learn a user's preference implicitly and then generat... A novel personalized Web search model is proposed. The new system, as a middleware between a user and a Web search engine, is set up on the client machine. It can learn a user's preference implicitly and then generate the user profile automatically. When the user inputs query keywords, the system can automatically generate a few personalized expansion words by computing the term-term associations according to the current user profile, and then these words together with the query keywords are submitted to a popular search engine such as Yahoo or Google. These expansion words help to express accurately the user's search intention. The new Web search model can make a common search engine personalized, that is, the search engine can return different search results to different users who input the same keywords. The experimental results show the feasibility and applicability of the presented work. 展开更多
关键词 search engine PERSONALIZATION term-term association retrieval effectiveness
下载PDF
栅格网环境下的任务信息精准服务框架 被引量:2
17
作者 赵岳 黄光奇 《指挥信息系统与技术》 2016年第1期41-46,共6页
栅格网环境下的任务信息具有海量、异构、分布和动态等特点,任务信息的按需搜索且精准服务是亟待解决的问题。基于服务需求,从任务信息关联关系分析、特征捕获以及搜索方法等方面,研究了任务信息精准服务框架。最后通过应用实例给出了... 栅格网环境下的任务信息具有海量、异构、分布和动态等特点,任务信息的按需搜索且精准服务是亟待解决的问题。基于服务需求,从任务信息关联关系分析、特征捕获以及搜索方法等方面,研究了任务信息精准服务框架。最后通过应用实例给出了任务信息精准服务的过程。 展开更多
关键词 任务信息 精准服务 关联关系分析 特征捕获 按需搜索
下载PDF
一种基于Rough本体的信息检索方法 被引量:1
18
作者 胡军 陈传明 《计算机与现代化》 2011年第8期5-8,共4页
基于本体的信息检索是实现知识检索的有效途径,针对目前本体支持的形式化概念还不足以表示不完备知识的问题,提出一种基于Rough本体的信息检索方法,该方法中本体以本体信息系统的形式表示。用户提交关键字查询后,首先结合基于关键字检... 基于本体的信息检索是实现知识检索的有效途径,针对目前本体支持的形式化概念还不足以表示不完备知识的问题,提出一种基于Rough本体的信息检索方法,该方法中本体以本体信息系统的形式表示。用户提交关键字查询后,首先结合基于关键字检索的方法在预先定义的语义文档空间中搜索文档,然后利用关联搜索的方法来搜索与关键词关联的个体集和属性集,以属性集作为等价类构造Rough本体的近似空间,最后通过近似空间计算个体集和文档集的相似度,根据相似度高低对文档排序。实验表明,此方法比基于关键字和基于经典本体的方法有更高的查准率。 展开更多
关键词 粗糙本体 信息检索 关联搜索 相似度
下载PDF
基于多角度关联模型的实体检索方法 被引量:1
19
作者 王东 牛军钰 《计算机工程》 CAS CSCD 2013年第1期71-75,共5页
针对信息检索领域特定类型实体的检索问题,在传统搜索引擎的基础上,提出一种基于多角度关联模型的实体检索方法,综合运用实体名识别(NER)、文本向量、关联规则等技术以及Wikipedia、Stanford NER等工具,并在TREC2010实体检索项目中进行... 针对信息检索领域特定类型实体的检索问题,在传统搜索引擎的基础上,提出一种基于多角度关联模型的实体检索方法,综合运用实体名识别(NER)、文本向量、关联规则等技术以及Wikipedia、Stanford NER等工具,并在TREC2010实体检索项目中进行评测。实验结果表明,与基于BM25和贝叶斯模型的检索方法相比,该方法的nDCG@R值平均提高11.49%和18.09%。 展开更多
关键词 文本挖掘 关联规则 实体检索 实体名识别 词频-逆文档频率 维基百科 搜索引擎
下载PDF
箱体类零件工艺相似性的可拓关联检索方法 被引量:1
20
作者 徐春光 钱苏翔 +1 位作者 黄风立 杨扬 《机械设计与制造》 北大核心 2016年第9期173-175,179,共4页
针对现有的箱体类零件结构工艺的相似性,提出基于可拓关联的两段式检索方法。首先,对箱体类零件的几何特征进行分类,并提出了一种计算相似度的方法来进行结构方面的检索,从实例库中找到若干结构相似的实例,再结合可拓综合关联方法进行... 针对现有的箱体类零件结构工艺的相似性,提出基于可拓关联的两段式检索方法。首先,对箱体类零件的几何特征进行分类,并提出了一种计算相似度的方法来进行结构方面的检索,从实例库中找到若干结构相似的实例,再结合可拓综合关联方法进行加工特征的匹配。这种相似性检索方法包含了结构和工艺两个方面,全面考虑到了箱体类零件复杂的多重属性,具有适应性强、精确度高的优点。最后,通过简单的实例应用验证了该方法的有效性和可行性。 展开更多
关键词 箱体类零件 可拓关联 结构工艺 相似度检索
下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部