期刊文献+

现当代文学作品的作者身份识别研究 被引量:21

Research on authorship attribution of contemporary literature
下载PDF
导出
摘要 主要利用了SVM统计机器学习模型对中国现当代文学八位代表人物的作品进行了作者身份识别研究,在识别过程中选取了以词汇为基础的多种统计量作为识别特征,并且采取了基于低密度多特征的训练方法,在跨文体的作品的作者身份识别中取得了非常优异的识别性能。 This paper uses the statistical model (SVM) for the identification of the author of contemporary Chinese literature works to eight representatives.In the identification process to select a vocabulary based on a variety of statistics as identifying features,and to take training methods based on the low-density and more features,having achieved better result in cross-style works of the author identification.
出处 《计算机工程与应用》 CSCD 北大核心 2010年第4期226-229,共4页 Computer Engineering and Applications
基金 国家社会科学基金项目 No.07BYY050~~
关键词 作者身份识别 机器学习 计算风格学 现当代文学 authorship attribution machine learning computational stylistics contemporary literature
  • 相关文献

参考文献11

  • 1Yule G U.On sentence length as a statistical characteristic of style in prose with application to two cases of disputed authorship[J]. Biometrika, 1938,30 : 363-390. 被引量:1
  • 2Gani J.Literature and statistics[M]//Kotz S,Jonhnson N L.Encyclopedia of Statistics.[S.l.] : Wiley, 1985 : 90-95. 被引量:1
  • 3Valenza R J.Are the Thisted-Efron authorship tests valid? [J].Computer and the Humanities,1991,25:27-46. 被引量:1
  • 4Khmelev D,Tweedy F J.Using Markov chains for identification of Writers[J].Literary and Linguistic Computing,2001,16(4):299-307. 被引量:1
  • 5De Vel O,Anderson A,Comey M,et al.Muhi-topic E-mail authorship attribution forensics[C]//Proc Workshop on Data Mining for Security Applications,8th ACM Conference on Computer Security, CCS'2001,2001. 被引量:1
  • 6Short text authorship attribution via sequence kernels,Markov chains and author unmasking:An investigation[C]//Proceedings of International Conference on Empirical Methods in Natural Language Processing(EMNLP),Sydney, 2006:482-491. 被引量:1
  • 7曾毅平,朱晓文.计算方法在汉语风格学研究中的应用[J].福建师范大学学报(哲学社会科学版),2006(1):14-17. 被引量:21
  • 8金明哲.中文文章的作者识别[R]..第二届中国社会语言学国际学术研讨会暨中国社会语言学会成立大会[C].澳门,2003年11月.. 被引量:3
  • 9武晓春,黄萱菁,吴立德.基于语义分析的作者身份识别方法研究[J].中文信息学报,2006,20(6):61-68. 被引量:25
  • 10钱锋,陈光磊.关于发展汉语计算风格学的献议[M]//胡裕树,宗廷虎.修辞学发凡与中国修辞学.上海:复旦大学出版社,1983. 被引量:2

二级参考文献27

共引文献44

同被引文献376

引证文献21

二级引证文献225

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部