-
题名序列蛋白质-GDP绑定位点预测
被引量:2
- 1
-
-
作者
石大宏
何雪
-
机构
南京理工大学计算机科学与工程学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2016年第13期55-59,75,共6页
-
基金
国家自然科学基金(No.61373062)
-
文摘
正确地识别蛋白质-二磷酸鸟苷(Guanosine Diphosphate,GDP)绑定位点对于蛋白质功能分析和药物设计有非常重要的意义。蛋白质-GDP绑定位点预测是一个典型的不平衡学习问题。直接应用传统的机器学习方法是不合适的,而且会使预测结果偏向大多数类。为了解决这个问题,在基于稀疏表示的位置特异性得分矩阵特征基础上,提出了加权下采样方法来使得样本平衡,采用支持向量机算法来预测。实验结果表明提出的方法能获得更高的预测性能。
-
关键词
蛋白质-GDP绑定预测
位置特异性得分矩阵
稀疏表示
加权下采样
支持向量机
-
Keywords
protein-GDP binding prediction
position specific scoring matrix
sparse representation
weighted under-sampling
support vector machine
-
分类号
TP39
[自动化与计算机技术—计算机应用技术]
-
-
题名权重润饰和改进的分类对不平衡数据的处理
被引量:1
- 2
-
-
作者
王和勇
-
机构
华南理工大学电子商务系
-
出处
《计算机应用与软件》
CSCD
2009年第8期144-146,161,共4页
-
文摘
不平衡数据集是指某类样本数量明显少于其它类样本数量的数据集,传统的分类算法在处理不平衡数据分类问题时会倾向于多数类,而导致少数类的分类精度较低。针对文本数据的不平衡情况,首先采用权重润饰(Weight-retouching)的方法进行特征提取,然后采用欠取样(Under sampling)的支持向量机SVM(Support Vector Machine)方法进行文本分类。通过实验发现,使用权重润饰和欠取样的SVM方法可以提高处理不平衡数据的分类精度。
-
关键词
文本分类
机器学习
权重润饰
欠取样
-
Keywords
Text categorization Machine learning weight-retouching under sampling
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
S512.103.7
[自动化与计算机技术—计算机科学与技术]
-