期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
微博演化网络的负信息分类方法 被引量:13
1
作者 赵一 何克清 +1 位作者 李昭 黄贻望 《计算机科学与探索》 CSCD 北大核心 2017年第1期91-98,共8页
针对Sina微博博文的转发关系,建立起用户转发博文之间的演化网络,从而利用SMO SVM(sequential minimal optimization support vector machine)分类算法对博文进行分类,筛选出恶意博文、垃圾广告、垃圾营销信息,使用户能够精确地屏蔽不... 针对Sina微博博文的转发关系,建立起用户转发博文之间的演化网络,从而利用SMO SVM(sequential minimal optimization support vector machine)分类算法对博文进行分类,筛选出恶意博文、垃圾广告、垃圾营销信息,使用户能够精确地屏蔽不想要的博文和博主。第一步基于微博转发关系的演化网络和SVM分类算法对整个Sina微博进行分类;第二步利用复杂网络等技术对经常发送恶意广告的博主进行标注,从而在网络中对他们进行屏蔽;最后找出垃圾信息的来源以及分辨出博主是不是恶意转发者,在宏观上能更好地遏制垃圾信息的传播。与用户从UCI数据集中实际反馈情况进行比较,实验结果表明,机器学习分类的实验结果吻合度达到89%。 展开更多
关键词 序列最小优化(SMO) 支持向量机(SVM) 演化网络 uci数据集 负信息
下载PDF
一种改进ID3型决策树挖掘算法 被引量:10
2
作者 潘大胜 屈迟文 《华侨大学学报(自然科学版)》 CAS 北大核心 2016年第1期71-73,共3页
分析经典ID3型决策树挖掘算法中存在的问题,对其熵值计算过程进行改进,构建一种改进的ID3型决策树挖掘算法.重新设计决策树构建中的熵值计算过程,以获得具有全局最优的挖掘结果,并针对UCI数据集中的6类数据集展开挖掘实验.结果表明:改... 分析经典ID3型决策树挖掘算法中存在的问题,对其熵值计算过程进行改进,构建一种改进的ID3型决策树挖掘算法.重新设计决策树构建中的熵值计算过程,以获得具有全局最优的挖掘结果,并针对UCI数据集中的6类数据集展开挖掘实验.结果表明:改进后的挖掘算法在决策树构建的简洁程度和挖掘精度上,都明显优于ID3型决策树挖掘算法. 展开更多
关键词 数据挖掘 ID3型决策树 熵值计算 uci数据集
下载PDF
基于距离度量学习的集成谱聚类 被引量:3
3
作者 牛科 张小琴 贾郭军 《计算机工程》 CAS CSCD 北大核心 2015年第1期207-210,244,共5页
无监督学习聚类算法的性能依赖于用户在输入数据集上指定的距离度量,该距离度量直接影响数据样本之间的相似性计算,因此,不同的距离度量往往对数据集的聚类结果具有重要的影响。针对谱聚类算法中距离度量的选取问题,提出一种基于边信息... 无监督学习聚类算法的性能依赖于用户在输入数据集上指定的距离度量,该距离度量直接影响数据样本之间的相似性计算,因此,不同的距离度量往往对数据集的聚类结果具有重要的影响。针对谱聚类算法中距离度量的选取问题,提出一种基于边信息距离度量学习的谱聚类算法。该算法利用数据集本身蕴涵的边信息,即在数据集中抽样产生的若干数据样本之间是否具有相似性的信息,进行距离度量学习,将学习所得的距离度量准则应用于谱聚类算法的相似度计算函数,并据此构造相似度矩阵。通过在UCI标准数据集上的实验进行分析,结果表明,与标准谱聚类算法相比,该算法的预测精度得到明显提高。 展开更多
关键词 数据挖掘 边信息 相似度矩阵 距离度量学习 谱聚类 uci数据集
下载PDF
基于局部和全局信息的改进聚类算法 被引量:3
4
作者 许小龙 王士同 梅向东 《计算机工程》 CAS CSCD 北大核心 2015年第6期165-171,共7页
传统K-means算法在随机选取初始聚类中心时,容易导致结果不稳定,谱聚类算法直接在相似矩阵上进行分割,对结果的准确性影响较大,而局部和全局正则化聚类算法未考虑数据空间分布对结果的影响。为此,引入离散度矩阵对局部和全局正则化聚类... 传统K-means算法在随机选取初始聚类中心时,容易导致结果不稳定,谱聚类算法直接在相似矩阵上进行分割,对结果的准确性影响较大,而局部和全局正则化聚类算法未考虑数据空间分布对结果的影响。为此,引入离散度矩阵对局部和全局正则化聚类算法进行改进。改进算法考虑数据的分布信息,通过在局部信息目标函数中引入离散度矩阵,结合全局信息的目标函数,将目标函数最小化问题转换为分解稀疏矩阵特征的问题。在UCI机器学习数据集和公共数据挖掘数据集上的实验结果表明,与K-means及标准谱聚类算法相比,该算法的预测精度更高。 展开更多
关键词 K-MEANS算法 谱聚类 离散度矩阵 特征分解 uci数据集
下载PDF
基于模糊时间序列的计算机信息粒构建研究
5
作者 贺适 《自动化技术与应用》 2021年第2期48-50,共3页
计算机信息粒通常是使用概率性方法以判别式学习的方式进行的,当分类任务的性质是识别特定类别的模式时,如在情绪检测的情况下,可以同时从同一个人识别出多种情绪,这通常表明不同的情绪可能涉及特定的关系而不是相互排斥。本文基于模式... 计算机信息粒通常是使用概率性方法以判别式学习的方式进行的,当分类任务的性质是识别特定类别的模式时,如在情绪检测的情况下,可以同时从同一个人识别出多种情绪,这通常表明不同的情绪可能涉及特定的关系而不是相互排斥。本文基于模式时间序列用来识别密集型现实数据实例的分类。并以生命科学的UCI数据集作为实验对象,通过本文提出的方法与常用的概率方法进行比较,结果表明,该方法不仅可以作为概率方法的替代方法,而且还可以捕获概率方法无法实现的更多模式。 展开更多
关键词 计算机信息粒 模式序列 uci数据集 分类任务
下载PDF
基于记忆传递旗鱼优化的K均值混合迭代聚类 被引量:5
6
作者 黄鹤 熊武 +3 位作者 吴琨 王会峰 茹锋 王珺 《上海交通大学学报》 EI CAS CSCD 北大核心 2022年第12期1638-1648,共11页
针对现有K均值聚类(KMC)算法受初始化影响较大,随机产生的聚类中心极易使聚类结果陷入局部最优而停止迭代,导致聚类精度低、鲁棒性差的问题,提出一种基于记忆传递旗鱼优化的K均值混合迭代聚类(MTSFO-HIKMC)算法.首先,借鉴已有改进思路,... 针对现有K均值聚类(KMC)算法受初始化影响较大,随机产生的聚类中心极易使聚类结果陷入局部最优而停止迭代,导致聚类精度低、鲁棒性差的问题,提出一种基于记忆传递旗鱼优化的K均值混合迭代聚类(MTSFO-HIKMC)算法.首先,借鉴已有改进思路,引入最大最小距离积来初始化KMC聚类中心,避免随机初始化带来的不确定性;同时,在迭代过程中,令当前最优解在局部进行自适应记忆传递修正,解决由于旗鱼算法搜索路径单一带来的全局寻优能力差和搜索精度不足的问题.利用Iris、Seeds、CMC和Wine国际标准数据集对MTSFO-HIKMC、旗鱼优化的K均值混合迭代聚类(SFO-KMC)算法、引入改进飞蛾扑火的K均值交叉迭代聚类(IMFO-KMC)算法、KMC算法和模糊C均值(FCM)算法进行比较测试,从得到的收敛曲线和性能指标可知,所提出的MTSFO-HIKMC算法相较于IMFO-KMC算法具有更快的收敛速度;在高维度空间较IMFO-KMC算法具有更高的搜索精度;相较于KMC和FCM算法具有更高的搜索精度;相比SFO-KMC算法在收敛速度和搜索精度方面都有明显提升,在高维数据集方面尤其明显. 展开更多
关键词 旗鱼算法 自适应记忆传递修正策略 K均值聚类 最大最小距离积法 uci标准数据集
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部