-
题名一种改进的支持向量机的文本分类算法
被引量:37
- 1
-
-
作者
巩知乐
张德贤
胡明明
-
机构
河南工业大学信息科学工程学院
西安电子科技大学计算机学院
-
出处
《计算机仿真》
CSCD
北大核心
2009年第7期164-167,共4页
-
基金
河南省科技攻关项目(0321220024)
-
文摘
在文本分类中,应用支持向量机(SVM)算法能使分类在小样本的条件下具有良好的泛化能力。但支持向量机的参数取值决定了其学习性能和泛化能力。为提高支持向量机算法的性能,提出了一种采用免疫算法对支持向量机参数进行优化的文本分类算法(IA-SVM)。算法减少了对支持向量机参数选择的盲目性,提高了SVM的预测精度。实验表明,IA-SVM算法在文本分类问题上明显提高了分类正确率,学习速度也有提高。
-
关键词
免疫算法
支持向量机
文本分类
-
Keywords
Immune algorithm (IA)
Support vector machines ( SVM )
Text classification ( TC )
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
TP301
[自动化与计算机技术—计算机科学与技术]
-
-
题名融合LLE和ISOMAP的非线性降维方法
被引量:12
- 2
-
-
作者
张少龙
巩知乐
廖海斌
-
机构
平顶山工业职业技术学院计算机与软件工程学院
湖北科技学院计算机科技与技术学院
-
出处
《计算机应用研究》
CSCD
北大核心
2014年第1期277-280,共4页
-
基金
中央高校基本科研业务费专项资金资助项目(20102120103000004)
河南省重大科技攻关项目(072SGZS38042)
-
文摘
局部线性嵌入(LLE)和等距映射(ISOMAP)在降维过程中都只单一地保留数据集的某一种特性结构,从而使降维后的数据集往往存在顾此失彼的情况。针对这种情况,借助流形学习的核框架,提出融合LLE和ISOMAP的非线性降维方法。新的融合方法使降维后的数据集既保持着数据点间的局部邻域关系,也保持着数据点间的全局距离关系。在仿真数据集和实际数据集上的实验结果证实了该方法的优越性。
-
关键词
人脸识别
流形学习
数据降维
全局距离保持
局部结构保持
-
Keywords
face recognition manifold learning data dimensionality reduction global distances preservation local structures preservation
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-
-
题名因子分析判别准则的线性降维方法研究
被引量:3
- 3
-
-
作者
巩知乐
张少龙
廖海斌
-
机构
平顶山工业职业技术学院计算机与软件工程学院
湖北科技学院计算机科学与技术学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2016年第3期145-149,共5页
-
基金
国家自然科学基金(No.61271256)
河南省重大科技攻关项目(No.072SGZS38042)
湖北科技学院博士启动基金资助项目(No.BK1418)
-
文摘
提取稳定且具有判别性的低维特征是模式识别研究中的关键问题。在深入研究Fisher判别准则的基础上,从因子分析的实际角度考虑,提出基于因子分析的判别准则,解决Fisher判别准则类内和类间散布矩阵非最优定义问题。通过在合成数据集和真实人脸数据集上进行实验比较表明,该方法在解决数据集中的边缘类和人脸的表情、姿态变化等问题上比Fisher判别准则更优。
-
关键词
特征提取
线性降维
FISHER判别准则
因子分析
人脸识别
-
Keywords
feature extraction
linear dimension reduction
Fisher criterion
factors analysis
face recognition
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名文本挖掘理论概述
被引量:2
- 4
-
-
作者
巩知乐
张德贤
-
机构
河南工业大学信息科学与工程学院
-
出处
《福建电脑》
2008年第9期21-22,共2页
-
基金
河南省科技攻关项目(0324220024)
-
文摘
文本挖掘是一个从非结构化文本信息中获取用户关心或感兴趣模式的过程。对文本挖掘进行深入的研究将大大提高从海量的文本数据中获取有用知识的效率。本文首先介绍了文本数据挖掘的研究概况,之后着力对当前基于Web文本挖掘的一般处理过程进行了详细的描述,同时总结了文本分类和文本聚类的一些主要算法,在文章的最后对文本挖掘在信息技术中的发展前景做了合理的预测和展望。
-
关键词
文本挖掘
WEB文本挖掘
文本分类
文本聚类
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
TU621
[自动化与计算机技术—计算机科学与技术]
-