期刊文献+

论文抄袭检测中特征选择 被引量:3

Feature Selection in Plagiarism Detection of Academic Dissertation
下载PDF
导出
摘要 选取多少个最佳特征以及采用什么评估函数,针对不同的问题选取策略也有所不同。针对论文抄袭检测问题,如何确定特征选择数量和选择评估函数是文章研究的目的。在分析论文抄袭的主要形式和手段基础上,针对文本内容抄袭,阐述了文本特征表示的主要方法和特征选择常用策略,最后对实验结果进行分析,得出基本结论。
作者 赵俊杰
出处 《计算机系统应用》 2009年第9期101-103,126,共4页 Computer Systems & Applications
基金 教育部社科研究基金青年项目(07JC870006) 安徽财经大学教研重点项目(ACJYZD200914)
  • 相关文献

参考文献8

二级参考文献22

  • 1张云涛,龚玲,王永成.An improved TF-IDF approach for text classification[J].Journal of Zhejiang University-Science A(Applied Physics & Engineering),2005,6(1):49-55. 被引量:5
  • 2张宁,贾自艳,史忠植.使用KNN算法的文本分类[J].计算机工程,2005,31(8):171-172. 被引量:99
  • 3曹志刚 钱亚生.通信原理[M].北京:清华大学出版社,2001.. 被引量:2
  • 4CristianiniN Shawe-TaylorJ 李国正译.支持向量机导论[M].北京:电子工业出版社,2004.. 被引量:111
  • 5Yang Y,http://citeseernjneccom/yang97comparativehtml,1997年 被引量:1
  • 6陈克利.基于大规模真实文本的平衡语料分析与文本分类方法[C]..Advances in Computation of Oriental Languages[C].北京:清华大学出版社,2003.. 被引量:9
  • 7John G H,Kohavi R,Pfleger K,Irrelevant feature and the subset selection problem[EB/OL] ,http://www,stanford,edu/-kpfleger/copy/publications/relevance4,ps,gz,1994. 被引量:1
  • 8Yang Y,Pedersen J P,A comparative study on feature selection in text categorization[A] ,In:Proc of the 14th Int' l ConferenceMachine Learning (ICML'97)[C],1997 ,412 -420. 被引量:1
  • 9Mladenic D,Grobelnk M,Feature selection for unbalanced class distribution and Na 1ve bayes [ A ],In:Proc of the 16th Int'l Confon Machine Learning (ICML'99) [C],San Francisco:Morgan Kaufmann Publishers,1999,258- 267. 被引量:1
  • 10ladenic M D,Machine Learning on non-homogeneous,distributed text data [EB/OL],http://www,cs,cmu,edu/afs/cs/project/theo-4/text-learning/www/pww/papers/PhD/PhDBib,ps,gz,1998. 被引量:1

共引文献148

同被引文献44

引证文献3

二级引证文献7

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部