期刊文献+

HSK作文切题指标的计量研究

下载PDF
导出
摘要 HSK是来华留学生所需要参加的汉语水平考试,当前对HSK作文评分自动化的需求逐步上升,而在作文自动评分中,切题指标是影响分数的重要指标。切题指标用来描述作者写作的文章与题目所设定主题的相符程度。基于HSK作文数据集进行研究,通过提取文章的关键词,计算其与对应题目词的相似度来得到这一指标。将4种文章关键词提取方法 (LDA、TextRank、TF-IDF和H-point)和两种相似度计算方法 (基于Word2vec的词向量法和基于JS散度的主题分布相似性法)组合得出8种计算切题指标分数的方法,并通过切题指标分数与文章总分的相关系数来评估方法的合理性。实验结果表明,在这8种方法中,TextRank+主题分布相似性法计算出来的切题指标分数与实际总分的相关系数表现最佳,得出的切题指标分数最为合理。
作者 张恒源
出处 《电脑编程技巧与维护》 2020年第10期9-11,共3页 Computer Programming Skills & Maintenance
基金 大学生创新创业项目 项目编号:202010032023 获奖类别:国家级创新训练项目。
  • 相关文献

参考文献5

二级参考文献42

  • 1王燕.一种改进的K-means聚类算法[J].计算机应用与软件,2004,21(10):122-123. 被引量:9
  • 2冯志伟.当前自然语言处理发展的几个特点[J].暨南大学华文学院学报,2006(1):34-40. 被引量:15
  • 3Blei D, Ng A, Jordan M. Latent dirichlet allocation. Journal of Machine Learning Research, 2003, 3:993-1022 被引量:1
  • 4Blei D, Lafferty J. Correlated topic models//Weiss Y, Seholkopf B, Platt J eds. Advances in Neural Information Processing Systems 18. Cambridge, MA: MIT Press, 2006 被引量:1
  • 5Li W, McCallum A. Pachinko allocation: DAG-struetured mixture models of topic correlations//Proceedings of the International Conference on Machine Learning (ICML). Pittsburgh, Pennsylvania, 2006: 577-584 被引量:1
  • 6Xing E, Yan R, Hauptmann A. Mining associated text and images with dual-wing harmoniums//Proceedings of the 21th Annual Conference on Uncertainty in Artificial Intelligence (UAI-05). Edinburgh, Scotland, 2005:633-641 被引量:1
  • 7Li F-F, Perona P. A bayesian hierarchical model for learning natural scene categories//Proceedings of the 2005 IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR). Washington, DC, USA, 2005: 524-531 被引量:1
  • 8Wei X, Croft W B. LDA-based document models for ad-hoc retrieval/ /Proceedings of the 29th SIGIR Conference. 2006: 178-185 被引量:1
  • 9Deerwester S, Dumais S, Furnas G, Lanouauer T, Harshman R. Indexing by latent semantic analysis. Journal of the American Society for Information Science, 1990, 41: 391- 407 被引量:1
  • 10Hofmann T. Probabilistic latent semantic indexing//Proceedings of the 22nd International ACM SIGIR Conference on Research and Development in Information Retrieval. Berkeley, CA, USA, 1999:50-57 被引量:1

共引文献189

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部