期刊文献+

基于机器学习的自动文摘研究综述 被引量:16

A Review on Machine Learning Oriented Automatic Summarization
原文传递
导出
摘要 探讨基于机器学习的自动文摘研究中的特征选取、算法选择、模型训练、文摘提取和模型评测等主要过程;重点分析3种主要的机器学习算法:朴素贝叶斯、隐马尔科夫和条件随机场,阐释3种算法的基本思想,在对相关研究进行系统梳理的基础上,给出作者的思考;对3种机器学习算法在训练方法、协同训练与主动学习、类别平衡以及词汇分布等方面存在的共性问题进行深入讨论并提出未来的主要研究方向。 This paper probes into the process of automatic summarization based on machine learning, including fea- tures selection, algorithm selection, model training, abstracts extraction, model evaluation. The Review focuses on three main machine learning algorithms: Naive Bayes, Hidden Markov Model and Conditional Random Fields, mainly elabora- ting the idea of these algorithms, summarizing related research, and giving reflections. Then it discusses the common problems with three machine learning algorithms, including training methods, collaborative training and active learning, category balance, terms distribution. In the end, future research directions are explored.
出处 《图书情报工作》 CSSCI 北大核心 2014年第18期122-130,共9页 Library and Information Service
基金 国家社会科学基金重大招标项目"面向学科领域的网络信息资源深度聚合与服务研究"(项目编号:12&ZD221) 国家自然科学基金项目"融合范式视角下的链接分析理论集成框架及其实证研究"(项目编号:71273125)研究成果之一
关键词 自动文摘 机器学习 NB HMM CRF automatic summarization machine learning NB HMM CRF
  • 相关文献

参考文献73

  • 1Luhn H P. The automatic creation of literature abstracts[J]. IBM Journal of Research and Development, 1958, 2(2): 159-165. 被引量:1
  • 2Mani I, Maybury M T. Advances in automatic text summarization[M]. Cambridge: MIT Press, 1999. 被引量:1
  • 3Mani I, Bloedorn E. Machine learning of generic and user-focused summarization[C]//Proceedings of the Fifteenth National Conference on Artificial Intelligence.Reston VA:AAAI Press, 1998: 821-826. 被引量:1
  • 4Mitchell T M. Machine learning[M]. Burr Ridge: McGraw Hill, 1997:45. 被引量:1
  • 5郭燕慧,钟义信,马志勇,姚均勇.自动文摘综述[J].情报学报,2002,21(5):582-591. 被引量:24
  • 6Jones K S. Automatic summarizing:Factors and directions[C]//Advances in Automatic Text Summarization. Cambridge: MIT Press,1999:1-12. 被引量:1
  • 7Hovy E, Marcu D. Automated text summarization[C]//The Oxford Handbook of Computational Linguistics. USA: Oxford University Press,2005:583-598. 被引量:1
  • 8Baxendale P B. Machine-made index for technical literature:An experiment[J]. IBM Journal of Research and Development, 1958, 2(4): 354-361. 被引量:1
  • 9Edmundson H P. New methods in automatic extracting[J]. Journal of the ACM (JACM), 1969, 16(2): 264-285. 被引量:1
  • 10Ramezania M, Feizi-Derakhshi M. Automated text summarization:An overview[J]. Applied Artificial Intelligence:An International Journal,2014, 28(2):178-215. 被引量:1

二级参考文献87

共引文献58

同被引文献187

引证文献16

二级引证文献98

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部