期刊文献+
共找到78篇文章
< 1 2 4 >
每页显示 20 50 100
基于电力系统复杂网络特征的线路脆弱性风险分析 被引量:25
1
作者 苏慧玲 李扬 《电力自动化设备》 EI CSCD 北大核心 2014年第2期101-107,共7页
提出了一种从电力系统复杂网络特征角度分析线路脆弱性风险的方法。该方法首先采用自下而上的层次聚类法挖掘线路脆弱性的层次风险,并以电力系统的复杂网络特征为条件属性,以电力系统线路脆弱性为决策属性,建立系统样本决策表;然后采用... 提出了一种从电力系统复杂网络特征角度分析线路脆弱性风险的方法。该方法首先采用自下而上的层次聚类法挖掘线路脆弱性的层次风险,并以电力系统的复杂网络特征为条件属性,以电力系统线路脆弱性为决策属性,建立系统样本决策表;然后采用基于贪婪启发式算法的ID3决策树数据挖掘法,建立线路脆弱性的精细化决策表;最后根据决策树建立电力系统线路脆弱性的层次风险模型,各层次所含线路的脆弱性风险与层次聚类法所得层次风险水平一致。IEEE 39节点算例结果表明电力系统复杂网络特征的分布情况决定了系统脆弱性线路风险大小。 展开更多
关键词 层次风险 复杂网络特征 电力系统 线路脆弱性 决策树 层次聚类 数据挖掘 风险
下载PDF
基于混合余弦相似度的中文文本层次关系挖掘 被引量:20
2
作者 董洋溢 李伟华 于会 《计算机应用研究》 CSCD 北大核心 2017年第5期1406-1409,共4页
层次关系是中文文本概念间存在的最为重要的关系之一。对层次关系的正确判定是进行领域本体自动构建、文本数据挖掘等信息处理的基础研究内容。先将概念间可能存在的候选层次关系罗列出来,构建词性序列语义余弦相似度和关系词语余弦相... 层次关系是中文文本概念间存在的最为重要的关系之一。对层次关系的正确判定是进行领域本体自动构建、文本数据挖掘等信息处理的基础研究内容。先将概念间可能存在的候选层次关系罗列出来,构建词性序列语义余弦相似度和关系词语余弦相似度混合的核函数分类器,将概念间层次关系的挖掘问题转换为分类问题;再通过对文本数据进行模板标注来训练分类器;最后输入预处理后的中文文本,使用核函数分类器对候选层次关系进行判定。以空军武器装备领域的中文文本为测试数据,通过实验表明,该方法简单可靠,具有较好的正确率和召回率。 展开更多
关键词 自然语言处理 层次关系 文本挖掘 混合余弦相似度 本体构建
下载PDF
基于文本聚类技术的主题发现 被引量:15
3
作者 郭建永 蔡勇 甄艳霞 《计算机工程与设计》 CSCD 北大核心 2008年第6期1426-1428,1432,共4页
阐述了一种主题发现系统,它能发现数据流中的隐含知识,并将其表述为含有主题/副主题的层次树,每个主题包含与其相关的文档集和文档摘要,以便于用户从层次树中浏览和选择所需主题。并提出了一种增量层次聚类算法,该算法结合了划分聚类和... 阐述了一种主题发现系统,它能发现数据流中的隐含知识,并将其表述为含有主题/副主题的层次树,每个主题包含与其相关的文档集和文档摘要,以便于用户从层次树中浏览和选择所需主题。并提出了一种增量层次聚类算法,该算法结合了划分聚类和凝聚聚类的主要优点。实验结果表明,无论是作为主题检测系统还是分类和概括工具,该算法都是高效的。 展开更多
关键词 文本聚类 主题发现 层次方法 文本挖掘
下载PDF
基于词形规则模板的术语层次关系抽取方法 被引量:11
4
作者 韩红旗 徐硕 +3 位作者 桂婕 乔晓东 朱礼军 安小米 《情报学报》 CSSCI 北大核心 2013年第7期708-715,共8页
术语层次关系抽取是领域概念关系体系构建的重要基础。针对目前术语关系抽取中手工实现的问题,提出了基于词形规则模板匹配的术语层次关系抽取方法,实现从科技论文文本中抽取类属关系(IS-A)和整体部分关系(PART—OF)关系。利用复... 术语层次关系抽取是领域概念关系体系构建的重要基础。针对目前术语关系抽取中手工实现的问题,提出了基于词形规则模板匹配的术语层次关系抽取方法,实现从科技论文文本中抽取类属关系(IS-A)和整体部分关系(PART—OF)关系。利用复合术语的head和modifier特征,比较两个术语之间存在的边缘共用词汇,构造模板来确定它们之间的IS—A和PART-OF关系;提出泛化度指标,用于测量两个术语在概念层次树上的相对位置;提出相关度概念,用于测量两个术语之间在语义上的相关性。对不存在共用词汇和不匹配模板的术语采用泛化度差值和相关度来判断它们之间是否存在层次关系。实验从信息资源管理领域的论文文本中提取层次关系术语对1306对,准确率达到92.5%,证明提出的方法是有效的。 展开更多
关键词 术语关系抽取 层次关系 词形规则 文本挖掘
下载PDF
一种非对称距离下的层次聚类算法 被引量:11
5
作者 韩忠明 陈妮 +1 位作者 张慧 杨伟杰 《模式识别与人工智能》 EI CSCD 北大核心 2014年第5期410-416,共7页
层次聚类算法在数据挖掘领域有着广泛应用,现有的层次聚类算法都依赖于对称距离定义.针对聚类对象的非对称距离下的层次聚类展开研究,提出完整的非对称距离下的层次聚类算法,给出聚类对象选择因子,并定义相应的计算方法.文中提出不同簇... 层次聚类算法在数据挖掘领域有着广泛应用,现有的层次聚类算法都依赖于对称距离定义.针对聚类对象的非对称距离下的层次聚类展开研究,提出完整的非对称距离下的层次聚类算法,给出聚类对象选择因子,并定义相应的计算方法.文中提出不同簇之间的合并方法,形成非对称距离下的单连接、全连接等算法.采集社会化书签系统中的热点标签,基于共现次数定义非对称距离,对所提出的算法进行大量实验,实验结果表明聚类结果与实际结果具有较高的一致性.对算法进行量化指标分析的结果也表明非对称层次聚类算法具有良好性能. 展开更多
关键词 非对称距离 层次聚类 数据挖掘
下载PDF
基于游戏教学的分层数据挖掘方法研究与应用 被引量:9
6
作者 张琳 李小平 +2 位作者 来林静 吴晓兵 孙清亮 《中国电化教育》 CSSCI 北大核心 2019年第2期87-94,共8页
该文基于游戏教学和数据挖掘算法,首次开展了游戏教学的数据挖掘方法问题研究,提出了分层挖掘的概念和应用方法,通过研究游戏教学中的数据元素、教学目的和教学效果之间的关系,完成了游戏教学形态化的设计。提出了游戏教学的数据框架、... 该文基于游戏教学和数据挖掘算法,首次开展了游戏教学的数据挖掘方法问题研究,提出了分层挖掘的概念和应用方法,通过研究游戏教学中的数据元素、教学目的和教学效果之间的关系,完成了游戏教学形态化的设计。提出了游戏教学的数据框架、数据元素、数据定义和数据驱动,构建了分层数据挖掘模型和分层挖掘逻辑结构,分析了数据视点层、数据意义层、数据元素层和元素来源获取层之间的关系,提出了不同视点在教学管理、教学设计下的数据挖掘函数嵌套分量和控制关系。首次提出了游戏知识的获取、知识的聚类和知识挖掘的方法,提出了数据挖掘量化强度的概念,构建了基于数据分层挖掘的游戏设计与能力培养评测关系控制模型,为未来游戏教学设计框架及元素设计提供了参考标准。 展开更多
关键词 数据挖掘 游戏教学 分层挖掘 数据视点 教学控制
下载PDF
基于层次聚类的k均值算法研究 被引量:5
7
作者 黄志红 《电脑开发与应用》 2009年第7期1-2,5,共3页
针对k均值算法需要用户事先确定聚簇数k、阈值t和聚簇中心Q,提出了一种基于层次的k均值聚类算法(HKMA)。该算法首先采用层次方法对文档进行初始聚类,得到的聚类总数作为k均值算法中的k值,在此基础上,通过k均值聚类对聚类结果进行修正。... 针对k均值算法需要用户事先确定聚簇数k、阈值t和聚簇中心Q,提出了一种基于层次的k均值聚类算法(HKMA)。该算法首先采用层次方法对文档进行初始聚类,得到的聚类总数作为k均值算法中的k值,在此基础上,通过k均值聚类对聚类结果进行修正。最后通过实验验证了算法的准确度和时间效率,通过与其他聚类算法的比较,所提出的算法具有更好的性能。 展开更多
关键词 聚簇 k—means 层次方法 文本挖掘
下载PDF
数据挖掘技术在高校教学评估中的应用 被引量:5
8
作者 吕爽 陈高云 《广东广播电视大学学报》 2006年第3期24-28,共5页
本文讨论了数据挖掘技术在高校教学评估中的应用,分别利用聚类和关联规则挖掘方法获取了具有不同成绩特征的学生群体和分析出影响学生成绩的主要教师因素,所得出的结论对高校教学评估和教学工作都具有一定的指导意义。
关键词 教学评估 层次聚类 关联规则 数据挖掘 高校
下载PDF
数据挖掘探析针刺治疗周围性面瘫的选穴规律 被引量:8
9
作者 黄琬苹 傅成伟 +2 位作者 吴彤 邓怡然 姜维 《中国民族民间医药》 2020年第21期1-5,共5页
目的:运用数据挖掘技术,探讨针灸治疗周围性面瘫的选穴及配伍规律。方法:搜索2009~2018年中国知网(CNKI)、中国生物医学数据库(CBM)和万方数据库(WF)关于针灸治疗周围性面瘫的相关文献,建立数据库,运用Python,SPSS Statistics,SPSS Mode... 目的:运用数据挖掘技术,探讨针灸治疗周围性面瘫的选穴及配伍规律。方法:搜索2009~2018年中国知网(CNKI)、中国生物医学数据库(CBM)和万方数据库(WF)关于针灸治疗周围性面瘫的相关文献,建立数据库,运用Python,SPSS Statistics,SPSS Modeler进行频率规则分析、系统聚类规则分析和关联规则分析。结果:本研究最终采用了771条记录,包含160个穴位。频率规则分析显示地仓穴使用频率高,足阳明胃经选穴最多,常用穴位集中在头面部。聚类分析显示常用穴位可分为4类:合谷-地仓-颊车-阳白、足三里-太冲-风池、攒竹-迎香-四白、颧髎-太阳-下关。关联规则分析:合谷-地仓-颊车-阳白的相关性最高。结论:针灸治疗面瘫的选穴以合谷-地仓-颊车-阳白为主要穴组,并根据症状与病程远近配合。 展开更多
关键词 针灸疗法 周围性面瘫 聚类分析 数据挖掘 关联规则分析
下载PDF
利水化瘀法治疗湿热瘀阻型泌尿系结石的用药 被引量:7
10
作者 林谋清 徐嘉辉 +3 位作者 赵冬 翟胜 蔡泽锋 傅永盛 《世界中医药》 CAS 2018年第10期2633-2636,共4页
目的:研究利水化瘀法治疗湿热瘀阻型泌尿系结石的用药规律,为中医药治疗泌尿系结石提供临床思路。方法:选取2015年4月至2016年4月在广东省第二中医院泌尿外科住院的100例324份电子病历及处方,并行回顾性分析。采用药物频数、频率统计及... 目的:研究利水化瘀法治疗湿热瘀阻型泌尿系结石的用药规律,为中医药治疗泌尿系结石提供临床思路。方法:选取2015年4月至2016年4月在广东省第二中医院泌尿外科住院的100例324份电子病历及处方,并行回顾性分析。采用药物频数、频率统计及系统分层聚类分析方法进行分析,并探讨其用药规律。结果:9味药出现频率超过50. 00%,8味药出现频率介于25. 00%~50. 00%,13味药出现频率低于25. 00%。28味中药可以凝聚为4类。结论:利水化瘀法从下焦膀胱湿热瘀阻论治,着重使用膀胱经药物,重视其药物的归经,并且采用地道药材,因地制宜,具有岭南中医药特色。 展开更多
关键词 泌尿系结石 湿热瘀阻型 利水化瘀法 聚类分析 数据挖掘 用药规律 膀胱经 岭南中医药
下载PDF
一种基于加权多代表点的层次聚类算法 被引量:5
11
作者 倪维健 黄亚楼 +1 位作者 李飞 刘赏 《计算机科学》 CSCD 北大核心 2005年第5期150-154,共5页
CURE算法是一种凝聚的层次聚类算法,它首先提出了使用多代表点描述簇的思想。本文通过对已有的基于多代表点的层次聚类算法特点的分析,提出了一种新的基于多代表点的层次聚类算法WRPC。它使用了基于影响因子的簇代表点选取机制和基于k-... CURE算法是一种凝聚的层次聚类算法,它首先提出了使用多代表点描述簇的思想。本文通过对已有的基于多代表点的层次聚类算法特点的分析,提出了一种新的基于多代表点的层次聚类算法WRPC。它使用了基于影响因子的簇代表点选取机制和基于k-近邻方法的小簇合并机制,可以发现形状、尺寸更为复杂的簇。实验结果表明,该算法在保证执行效率的情况下取得了更好的聚类效果。 展开更多
关键词 聚类算法 代表点 加权 K-近邻 影响因子 聚类效果 执行效率 机制
下载PDF
分级存储系统中一种数据自动迁移方法 被引量:7
12
作者 张广艳 丘建平 《计算机研究与发展》 EI CSCD 北大核心 2012年第8期1804-1810,共7页
分级存储系统通过将数据在不同性能设备间动态迁移以达到高性能.已有分级存储系统未能充分利用负载信息导致数据迁移严重影响应用性能.提出了一种分级存储系统中的数据自动迁移方法AutoMig,目标是提高前台应用的I?O性能.AutoMig综合文... 分级存储系统通过将数据在不同性能设备间动态迁移以达到高性能.已有分级存储系统未能充分利用负载信息导致数据迁移严重影响应用性能.提出了一种分级存储系统中的数据自动迁移方法AutoMig,目标是提高前台应用的I?O性能.AutoMig综合文件访问历史、文件大小、设备利用情况等参数,对文件进行动态分级,并使用LRU队列维护快速存储设备中的文件状态;挖掘关联文件用于自动预取;针对不同文件迁移操作采取不同的速率控制策略.对降级操作,根据负载变化动态调整迁移速率,对回迁操作则采取尽力而为的策略.在分级存储系统中的应用表明,与已有方法相比,AutoMig有效缩短了前台I?O响应时间. 展开更多
关键词 分级存储 数据迁移 数据分级 关联挖掘 速率控制
下载PDF
基于文本挖掘的互联网教育课程主题发现与聚类研究 被引量:7
13
作者 李梦杰 刘建国 +2 位作者 郭强 李仁德 汤晓雷 《上海理工大学学报》 CAS 北大核心 2018年第3期259-266,共8页
如何通过有效的数据挖掘对互联网教育平台中的课程主题进行挖掘、聚类是当前互联网教育亟待解决的问题之一。实验基于文本信息对某互联网教育平台的1 472门课程体系的主题分布及类别进行了分析。采集了某平台1 472门课程的描述信息,进... 如何通过有效的数据挖掘对互联网教育平台中的课程主题进行挖掘、聚类是当前互联网教育亟待解决的问题之一。实验基于文本信息对某互联网教育平台的1 472门课程体系的主题分布及类别进行了分析。采集了某平台1 472门课程的描述信息,进而通过自建词典和停用词库对文本进行切词分词,并通过TF-IDF对词频权重进行处理。利用LDA主题模型对课程的主题分布进行识别,发现了230个主题,并得到了每门课程在这230个主题下的文档–主题分布以及主题–词分布。进一步基于分布相似性函数对课程进行层次聚类,发现基于不同抽象层次主题的课程相互关联。最后将16个主题信息进行了可视化,这些主题分别从内容和数量两个角度反映出了课程的主题特征以及课程的聚合分布情况。 展开更多
关键词 主题发现 层次聚类 互联网教育 文本挖掘
下载PDF
一种基于层次聚类的k均值算法研究 被引量:7
14
作者 张红云 李萍萍 《微计算机信息》 2010年第12期228-229,232,共3页
依据信息论的思想,对基于层次的K-均值聚类算法(HKMA)过程进行了分析,该算法首先采用层次方法对文档进行初始聚类,得到的聚类总数作为k均值算法中的k值,在此基础上,通过k均值聚类对聚类结果进行修正。实验结果表明,HKMA执行时间整体上优... 依据信息论的思想,对基于层次的K-均值聚类算法(HKMA)过程进行了分析,该算法首先采用层次方法对文档进行初始聚类,得到的聚类总数作为k均值算法中的k值,在此基础上,通过k均值聚类对聚类结果进行修正。实验结果表明,HKMA执行时间整体上优于k-means算法,而且随着数据量的增大执行时间的增长幅度也较小。 展开更多
关键词 聚簇 K-MEANS 层次方法 文本挖掘
下载PDF
基于层次聚类和语义的标签推荐研究 被引量:6
15
作者 钟青燕 苏一丹 梁胜勇 《微计算机信息》 2010年第36期199-203,共5页
本文在分析传统推荐算法不足的基础上,提出一种新的基于层次聚类和语义挖掘的标签推荐算法,并在此基础上引入用户模型,进行个性化预测。该方法避免了传统协同过滤算法中标签系统陈旧、无法解决冷启动等的问题,提高了标签推荐的预测精度... 本文在分析传统推荐算法不足的基础上,提出一种新的基于层次聚类和语义挖掘的标签推荐算法,并在此基础上引入用户模型,进行个性化预测。该方法避免了传统协同过滤算法中标签系统陈旧、无法解决冷启动等的问题,提高了标签推荐的预测精度,最后通过实验验证了算法的有效性和优越性。 展开更多
关键词 标签分类 层次聚类 语义挖掘 用户模型
下载PDF
基于两阶段聚类的洗钱行为识别 被引量:5
16
作者 吴玉霞 牟援朝 《计算机工程》 CAS CSCD 北大核心 2010年第15期60-62,65,共4页
通过改进层次聚类和k-means聚类,建立两阶段聚类方法。采用两阶段聚类识别出异常点并得到高质量的聚类结果。结合证券公司客户真实交易数据和人工数据,使用Clementine进行建模从而实现聚类过程,识别出异常值并计算可疑记录的可疑程度,... 通过改进层次聚类和k-means聚类,建立两阶段聚类方法。采用两阶段聚类识别出异常点并得到高质量的聚类结果。结合证券公司客户真实交易数据和人工数据,使用Clementine进行建模从而实现聚类过程,识别出异常值并计算可疑记录的可疑程度,为金融情报部门提供了高质量的调查数据。 展开更多
关键词 层次聚类 K-MEANS聚类 数据挖掘 可疑交易 洗钱
下载PDF
基于文本挖掘的话题发现技术 被引量:5
17
作者 高妮 周明全 +2 位作者 耿国华 王学松 贺毅岳 《计算机工程》 CAS CSCD 北大核心 2009年第19期36-38,共3页
在分析灾害新闻特点的基础上,提出一种基于文本挖掘的话题发现技术,采用基于平均分组的层次聚类算法,对灾害新闻资料进行组织,从而生成新闻专题,为用户提供个性化服务,并形成专题检测系统,同时介绍基于时间和地点权值向量的相似度计算... 在分析灾害新闻特点的基础上,提出一种基于文本挖掘的话题发现技术,采用基于平均分组的层次聚类算法,对灾害新闻资料进行组织,从而生成新闻专题,为用户提供个性化服务,并形成专题检测系统,同时介绍基于时间和地点权值向量的相似度计算模型以及基于时间的动态阈值模型。实验结果表明,该算法能够获得较好的性能。 展开更多
关键词 话题发现与跟踪 层次聚类 文本挖掘 动态阈值
下载PDF
基于层次聚类识别数据集前n个全局孤立点 被引量:5
18
作者 梁斌梅 《计算机工程与应用》 CSCD 2012年第9期101-103,107,共4页
孤立数据的存在使数据挖掘结果不准确,甚至错误。现有的孤立点检测算法在通用性、有效性、用户友好性及处理高维大数据集的性能还不完善,为此,提出一种有效的全局孤立点检测方法,该方法进行凝聚层次聚类,根据聚类树和距离矩阵来可视化... 孤立数据的存在使数据挖掘结果不准确,甚至错误。现有的孤立点检测算法在通用性、有效性、用户友好性及处理高维大数据集的性能还不完善,为此,提出一种有效的全局孤立点检测方法,该方法进行凝聚层次聚类,根据聚类树和距离矩阵来可视化判断数据孤立程度,确定孤立点数目。从聚类树自顶向下,无监督地去除离群数据点。在多个数据集上的仿真实验结果表明,该方法能有效识别孤立程度最大的前n个全局孤立点,适用于不同形状的数据集,算法效率高,用户友好,且适用于大型高维数据集的孤立点检测。 展开更多
关键词 孤立点检测 层次聚类 数据挖掘
下载PDF
基于“OBE理念+分层闯关”的应用型课程实践教学研究 被引量:4
19
作者 张道华 《廊坊师范学院学报(自然科学版)》 2022年第2期118-122,共5页
针对电子商务本科专业《数据挖掘与分析》课程实践性强、学生知识储备参差不齐、理论知识获取与解决实际问题能力提升不同步等特点,对照金课两性一度标准,引入OBE理念开展基于分层闯关导向式的混合式实践教学。通过梳理数据挖掘技能图谱... 针对电子商务本科专业《数据挖掘与分析》课程实践性强、学生知识储备参差不齐、理论知识获取与解决实际问题能力提升不同步等特点,对照金课两性一度标准,引入OBE理念开展基于分层闯关导向式的混合式实践教学。通过梳理数据挖掘技能图谱,构思层次性实践项目,设计分层闯关任务,依托实践教学平台发布任务,提出过程性评价方式,构建双螺旋技能提升路径,调动学生深度参与学习的积极性,促进学生沉浸式学习,确保学生学习热情,逐步提高学生解决问题的能力。教学实践证明,学生的专业应用能力和实践创新能力得到了明显提升。 展开更多
关键词 OBE理念 分层闯关 数据挖掘 实验教学
下载PDF
一种基于层次聚类的全局孤立点识别方法 被引量:4
20
作者 梁斌梅 韦琳娜 宋庆祯 《计算机应用研究》 CSCD 北大核心 2011年第5期1731-1733,共3页
针对现有的孤立点检测算法在通用性、有效性、用户友好性及处理高维大数据集的性能还不完善,提出了一种快速有效的基于层次聚类的全局孤立点检测方法。该方法基于层次聚类的结果,根据聚类树和距离矩阵可视化判断数据孤立程度,并确定孤... 针对现有的孤立点检测算法在通用性、有效性、用户友好性及处理高维大数据集的性能还不完善,提出了一种快速有效的基于层次聚类的全局孤立点检测方法。该方法基于层次聚类的结果,根据聚类树和距离矩阵可视化判断数据孤立程度,并确定孤立点数目。从聚类树自顶向下,无监督地去除孤立点。仿真实验验证了本方法能快速有效识别全局孤立点,具有用户友好性,适用于不同形状的数据集,可用于大型高维数据集的孤立点检测。 展开更多
关键词 孤立点检测 层次聚类 数据挖掘 全局孤立点
下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部