期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
序列蛋白质-GDP绑定位点预测 被引量:2
1
作者 石大宏 何雪 《计算机工程与应用》 CSCD 北大核心 2016年第13期55-59,75,共6页
正确地识别蛋白质-二磷酸鸟苷(Guanosine Diphosphate,GDP)绑定位点对于蛋白质功能分析和药物设计有非常重要的意义。蛋白质-GDP绑定位点预测是一个典型的不平衡学习问题。直接应用传统的机器学习方法是不合适的,而且会使预测结果偏向... 正确地识别蛋白质-二磷酸鸟苷(Guanosine Diphosphate,GDP)绑定位点对于蛋白质功能分析和药物设计有非常重要的意义。蛋白质-GDP绑定位点预测是一个典型的不平衡学习问题。直接应用传统的机器学习方法是不合适的,而且会使预测结果偏向大多数类。为了解决这个问题,在基于稀疏表示的位置特异性得分矩阵特征基础上,提出了加权下采样方法来使得样本平衡,采用支持向量机算法来预测。实验结果表明提出的方法能获得更高的预测性能。 展开更多
关键词 蛋白质-GDP绑定预测 位置特异性得分矩阵 稀疏表示 加权下采样 支持向量机
下载PDF
权重润饰和改进的分类对不平衡数据的处理 被引量:1
2
作者 王和勇 《计算机应用与软件》 CSCD 2009年第8期144-146,161,共4页
不平衡数据集是指某类样本数量明显少于其它类样本数量的数据集,传统的分类算法在处理不平衡数据分类问题时会倾向于多数类,而导致少数类的分类精度较低。针对文本数据的不平衡情况,首先采用权重润饰(Weight-retouching)的方法进行特征... 不平衡数据集是指某类样本数量明显少于其它类样本数量的数据集,传统的分类算法在处理不平衡数据分类问题时会倾向于多数类,而导致少数类的分类精度较低。针对文本数据的不平衡情况,首先采用权重润饰(Weight-retouching)的方法进行特征提取,然后采用欠取样(Under sampling)的支持向量机SVM(Support Vector Machine)方法进行文本分类。通过实验发现,使用权重润饰和欠取样的SVM方法可以提高处理不平衡数据的分类精度。 展开更多
关键词 文本分类 机器学习 权重润饰 欠取样
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部