-
题名一种基于属性值权重的k-modes聚类分析算法
被引量:1
- 1
-
-
作者
郝荣丽
胡立华
-
机构
太原科技大学计算机科学与技术学院
-
出处
《计算机与数字工程》
2023年第5期1001-1004,1119,共5页
-
文摘
针对k-modes方法未考虑各属性值在属性空间的分布特征而导致分类变量间差异性度量不准确的问题,提出了一种基于属性值权重的k-modes聚类分析算法。该算法利用属性值之间的差异和属性值的权重,重新定义了相异度度量公式;采用属性值频率和各属性值的权重,给出一种聚类中心更新迭代公式,有效地体现了属性值在属性空间中的分布特征和属性之间的重要性差异;采用UCI数据集,验证了算法的有效性。
-
关键词
聚类分析
k-modes
属性值权重
属性值频率
相异度度量
-
Keywords
clustering analysis
k-modes
attribute value weight
attribute value frequency
dissimilarity measure
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名实例加权的隐朴素贝叶斯算法在学生成绩预测中的应用
- 2
-
-
作者
王狄
余良俊
-
机构
湖北师范大学计算机与信息工程学院
湖北第二师范学院计算机学院
-
出处
《湖北第二师范学院学报》
2023年第8期101-108,共8页
-
基金
湖北省科技厅技术创新专项揭榜制项目(2019AEE020)
智能地学信息处理湖北省重点实验室开放基金项目(KLIGIP-2018A05)
+1 种基金
湖北第二师范学院人才引进科研启动经费项目(20RC07)
湖北第二师范学院校级教改项目(X2022002)。
-
文摘
采用实例加权的隐朴素贝叶斯算法对教育数据进行分析和预测。通过对教育数据进行分析和预测,采用属性值频率加权的方法提升了模型准确性。通过计算不同属性值所占的属性值频率对实例进行加权,实例的权重表示了不同的实例对实验结果的影响。实验使用了UCI提供的葡萄牙中学学生成绩数据集,对比了多种贝叶斯算法,并经过十次十折交叉验证方法验证模型性能。准确率、召回率、AUC指标和F-score指标的实验结果表明,IWHNB算法在649个实例的数据集上表现最佳,展现出优异的分类性能。
-
关键词
大数据
隐朴素贝叶斯
实例加权
十折交叉验证
属性值频率
-
Keywords
big data
hidden naive bayes
instance weighting
ten fold cross verification
attribute value frequency
-
分类号
TP39
[自动化与计算机技术—计算机应用技术]
-