期刊文献+

改进的LSSVM算法在垃圾标签检测上的应用

下载PDF
导出
摘要 为了解决Folksonomy存在垃圾标签的问题,提出垃圾标签检测模型。利用向量空间模型表征用户特征,再用支持向量机将Folksonomy用户二分类。通过检测出隐藏在正常用户群体中的垃圾投放人,以此减少垃圾标签数量。垃圾标签数据集具有数量大,纬度高的特点。面对传统svm算法处理高维大规模数据集上过于复杂,存在速度和精度的瓶颈的问题,笔者曾经提出用lssvm算法进行垃圾标签检测处理,取得一定的效果。但是,lssvm算法本身也存在稀疏性以及处理重要数据点不敏感的问题,所以针对这点,提出了用剪切法进行解决,通过实验表明,改进的LSSVM提高了建模的精度,而稀疏化的处理虽然对精度有一定影响,但大大减少了训练数据量,从而有效减轻了计算负担,使快速性得到了保障。
出处 《山东工业技术》 2015年第8期132-133,共2页 Journal of Shandong Industrial Technology
  • 相关文献

参考文献11

  • 1KIM C J, HWANG K B. Naive Bayes classier, learning with featureselection for spam detection in social bookmarking[C]//Lecture Notes in Computer Science. Berlin: Springer-Verlag, 2008. 被引量:1
  • 2覃希,夏宁霞,苏一丹.基于支持向量机的垃圾标签检测模型[J].计算机应用研究,2010,27(10):3893-3895. 被引量:11
  • 3GRAMME P, CHEVALIER J F. Rank for spam dsetection[C]/ /Lecture Notes in Computer Science. Berlin: Springer- Verlag, 2008. 被引量:1
  • 4Van 6estel, T. S., Vanthienen, J J., Benchmarking classifiers", Mach. Suykens, J.A.K., Baesens, B., Viaene, , Dedene, 6., De Moor, B., Vandewalle, least squares support vector machine Learning, vol 54, vm5-32, 2003. 被引量:1
  • 5ADKOUR A, HEFNI T, HEFNY A, et al. Using semantic featuresto detect spamming in social bookmarking systems [C] // LectureNotes in Computer Science. Berlin: Springer- Verlag, 2008. 被引量:1
  • 6HOTHO A, JASCHKE R, SCHMJTZ C, et al. Emergent semantics in BibSonomy [ M ] . Liskowsky: Gl Jahrestagung, 2006:305-312. 被引量:1
  • 7SALTON G, McGILL M J. Introduction to modern information retrieval [M]. New York: McGraw-Hill, 1983: 1-I2. 被引量:1
  • 8http://www. csie. ntu. edu. tw/-cjlin/libsvmtools/datasets/. 被引量:1
  • 9BROADLY. Social spam definition [EB/OL]. (2008-7-21) http://www, bryanchen, com /2008 /07 /21 / social-spam /. 被引量:1
  • 10Kuh, A., De Wilde, P. "Comments on pruning error minimization in least squares support vector machines". IEEE Trans. Neural Networks, vol 18 (2). 2007. 被引量:1

二级参考文献9

  • 1BROADLY. Social spam definition [ EB/OL ]. (2008- 7- 21 ). http ://www. bryanehen.com/2008/07/21/soeial-spam/. 被引量:1
  • 2KIM C J, HWANG K B. Naive Bayes classier learning with feature selection for spam detection in social bookmarking [ C ]//Lecture Notes in Computer Science. Berlin : Springer-Verlag,2008. 被引量:1
  • 3GRAMME P, CHEVALIER J F. Rank for spam detection[ C]//Lecture Notes in Computer Science. Berlin: Springer-Verlag,2008. 被引量:1
  • 4MADKOUR A, HEFNI T, HEFNY A, et al. Using semantic features to detect spamming in social bookmarking systems [ C ]//Lecture Notes in Computer Science. Berlin : Springer-Verlag,2008. 被引量:1
  • 5VAPNIK V N. The nature of statistical learning theory[ M ]. 2nd ed. New York : Springer-Verlag, 1995 : 30- 90. 被引量:1
  • 6CORTES C, VAPNIK V N. Support vector networks [ J]. Machine Learning, 1995,20 ( 3 ) :272-297. 被引量:1
  • 7邓乃阳,田英杰.数据挖掘中的新方法-支持向量机[M].北京:科学出版社,2004. 被引量:3
  • 8HOTHO A, JASCHKE R, SCHMITZ C, et al. Emergent semantics in BibSonomy[M]. Liskowsky:GI Jahrestagung,2006:305-312. 被引量:1
  • 9SALTON G, McGILL M J. Introduction to modem information retrieval[ M ]. New York : McGraw-Hill, 1983 : 1 - 12. 被引量:1

共引文献10

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部