动态多文档文摘模型被引量：9

Dynamic Multi-Document Summarization Model

下载PDF

导出

摘要从网络信息的动态演化性出发,对同一话题不同时序阶段的文档集合进行识别和分析,在度量演化内容差异性的基础上实现动态性,给出了两种实现动态多文档文摘的模型,即基于矩阵子空间分析和基于文本相似度累加的动态多文档文摘模型.在此基础上,提出了高效的动态句子加权方法.TAC 2008的Update Summarization测试数据上的实验证明了所提出的动态多文档文摘模型的有效性. This paper introduces two models to describe dynamic evolution of network information： identify and analysis the document collection on the same topic in different stages. In order to construct dynamic of evolution content differences, two dynamic multi-document summarization models are presented, which are matrix subspace analysis model, text similarity cumulative model. Based on these models, some efficient dynamic sentence weighting algorithms are implemented. Experiments on the test data of Update Summarization in TAC 2008 and comparative results between new models and TAC 2008 evaluation, shows the effectiveness of the models.

作者刘美玲郑德权赵铁军于洋

机构地区教育部-微软语言语音重点实验室(哈尔滨工业大学) 东北林业大学信息与计算机工程学院

出处《软件学报》 EI CSCD 北大核心 2012年第2期289-298,共10页 Journal of Software

基金国家自然科学基金(60736014 60773069 61073130) 国家高技术研究发展计划(863)(2006AA010108)

关键词多文档文摘差异性分析矩阵模型相似度累加动态演化 multi-document summarization otherness analysis matrix model similarity cumulative dynamic evolvement

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献15

1Mani I. Automatic Summarization. John Benjarnins Publishing Company, 2001. 被引量：1
2Zhang S, Zhao TJ, Yu H, Zhao H. The research on the influence of the types of document sets on multi-document summarization. Journal of Computational Information Systems, 2007,3(3):1201-1206. 被引量：1
3Dang HT, Owczarzak K. Overview of the TAC 2008 Update Summarization Task. In: Proc. of the Text Analysis Conf. 2008. 被引量：1
4Allan J, Jin H, Rajman M, Wayne C, Gildea D, Lavrenko V, Hoberman R, Caputo D. Topic-Based novelty detection. Technical Report, ws99, Baltimore: Center for Language and Speech Processing, Johns Hopkins University, 1999. 被引量：1
5Allan J, Papka R, Lavrenko V. On-Line new event detection and tracking. In: Proc. of the 21st Annual Int'l ACM SIGIR Conf. on Research and Development in Information Retrieval. Melbourne, 1998.37-45. [doi: 10.1145/290941.290954]. 被引量：1
6Mani I. Recent developments in temporal information extraction. In: Nicolov N, Mitkov R, eds. Proc. of the RANLP. 2004. 被引量：1
7http://projects.ldc.upenn.edu/ace/intro.html. 被引量：1
8Makkonen J. Investigations on event evolution in TDT. In: Proc. of the Student Workshop of Human Language Technology Conf. of the North American Chapter of the Association for Computational Linguistics. Edmonton, 2003. 43-48. Idol: 10.3115/1073416. 1073424]. 被引量：1
9Mani I, Wilson G. Robust temporal processing of news. In: Proc. of the 38th Annual Meeting on Association for Computational Linguistics. Hong Kong, 2000. 69-76. [doi: 10.3115/1075218:1075228]. 被引量：1
10Lin CY, Hovy E. Automatic evaluation of summaries using N-gram cooccurrence statistics. In: Proc. of the 2003 Conf. of the North American Chapter of the Association for Computational Linguistics on Human Language Technology (NAACL 2003). Morristown: Association for Computational Linguistics, 2003.71-78. [doi: 10.3115/1073445.1073465]. 被引量：1

同被引文献121

1秦兵,刘挺,李生.基于局部主题判定与抽取的多文档文摘技术[J].自动化学报,2004,30(6):905-910. 被引量：10
2刘德荣 ,王永成 ,刘传汉 .基于主题概念的多文档自动摘要研究[J].情报学报,2005,24(1):69-74. 被引量：7
3郭庆琳,樊孝忠,柳长安.文本聚类在自动文摘中的应用研究[J].计算机应用,2005,25(5):1036-1038. 被引量：4
4秦兵,刘挺,李生.多文档自动文摘综述[J].中文信息学报,2005,19(6):13-20. 被引量：51
5朱嫣岚,闵锦,周雅倩,黄萱菁,吴立德.基于HowNet的词汇语义倾向计算[J].中文信息学报,2006,20(1):14-20. 被引量：327
6郭庆琳,樊孝忠,柳长安.基于文本聚类的自动文摘系统的研究与实现[J].计算机工程,2006,32(4):30-32. 被引量：8
7傅间莲,陈群秀.一种新的自动文摘系统评价方法[J].计算机工程与应用,2006,42(18):176-177. 被引量：9
8魏继增,孙济洲,秦兵.多文档文摘评价标准的研究[J].计算机工程与应用,2007,43(2):180-183. 被引量：3
9张其文,李明.多文档文摘提取方法的研究[J].兰州理工大学学报,2007,33(1):96-99. 被引量：4
1012321 网络不良与垃圾信息举报受理中心.2011 年下半年手机短信息状况调查报告[R/OL].[2012-08-17]. http://12321.cn/pdf/ sms1102.pdf. 被引量：1

引证文献9

1刘金岭,倪晓红,王新功.手机短信文本信息流的自动文摘生成[J].现代图书情报技术,2013(2):43-49. 被引量：4
2于洋,范文义,刘美玲,王慧强.相似度质心多层过滤策略的动态文摘方法[J].哈尔滨工程大学学报,2014,35(10):1236-1241.
3郭海蓉,张晖,赵旭剑,李波,杨春明.一种基于改进K-means的动态文摘提取方法[J].软件导刊,2015,14(5):77-79. 被引量：2
4宋俊,韩啸宇,黄宇,黄廷磊,付琨.一种面向实体的演化式多文档摘要生成方法[J].广西师范大学学报（自然科学版）,2015,33(2):36-41. 被引量：2
5王俊丽,魏绍臣,管敏.基于图排序算法的自动文摘研究综述[J].计算机科学,2015,42(12):1-7. 被引量：12
6郭海蓉,张晖,赵旭剑,李波,杨春明.基于增量图聚类的动态多文档摘要算法[J].计算机应用研究,2016,33(7):2034-2038. 被引量：2
7张璐,曹杰,蒲朝仪,伍之昂.基于词句协同排序的单文档自动摘要算法[J].计算机应用,2017,37(7):2100-2105. 被引量：8
8袁弛,余小清,杨凯,万旺根.基于改进隐式狄利克雷分布算法的新浪微博话题检测[J].工业控制计算机,2017,30(12):37-38.
9刘美玲,王慧强,陈广胜,于洋.中文文本挖掘的动态文摘建模方法[J].哈尔滨工程大学学报,2019,40(4):820-826. 被引量：1

二级引证文献30

1张永军,刘金岭,马甲林.中文短信文本信息流中多话题的分类抽取[J].现代图书情报技术,2014(7):101-106. 被引量：2
2王连喜.自动摘要研究中的若干问题[J].图书情报工作,2014,58(20):13-22. 被引量：7
3宗慧,刘金岭.基于短文本信息流的热点话题检测[J].数据采集与处理,2015,30(2):464-468. 被引量：4
4李明丽,孙连英,邢邗,石晓达.密度峰值算法在中文自动文摘中的应用研究[J].北京联合大学学报,2016,30(2):46-49. 被引量：1
5徐维林,张晖,殷玉娇,刘金岭.基于微博的热点话题跟踪技术研究[J].电脑知识与技术,2016,0(5):186-188. 被引量：4
6徐瑞朝,曾一昕.国内信息过载研究述评与思考[J].图书馆学研究,2017(18):21-25. 被引量：18
7王玮,欧阳纯萍,阳小华,罗凌云,刘志明.融合句子情感和主题相似性的中文新闻文本情感摘要[J].计算机应用研究,2017,34(12):3543-3546. 被引量：4
8王志宏,过弋.基于词句重要性的中文专利关键词自动抽取研究[J].情报理论与实践,2018,41(9):123-129. 被引量：5
9荀静,杨玉珍.基于TextRank的文本情感摘要提取方法[J].计算机应用与软件,2018,35(10):80-84. 被引量：8
10吴仁守,刘凯,王红玲.一种基于局部—全局主题关系的演化式摘要系统[J].中文信息学报,2018,32(9):75-83. 被引量：5

1于洋,范文义,刘美玲,王慧强.相似度质心多层过滤策略的动态文摘方法[J].哈尔滨工程大学学报,2014,35(10):1236-1241.
2郭海蓉,张晖,赵旭剑,李波,杨春明.基于增量图聚类的动态多文档摘要算法[J].计算机应用研究,2016,33(7):2034-2038. 被引量：2
3张瑾,许洪波,程学旗.面向网络演化信息的动态文摘方法研究[J].计算机学报,2008,31(4):696-701. 被引量：8
4Rong ZHANG,Wenzhe YU,Chaofeng SHA,Xiaofeng HE,Aoying ZHOU.Product-oriented review summarization and scoring[J].Frontiers of Computer Science,2015,9(2):210-223. 被引量：1
5周大明,吕梅柏,许辉.基于1553B总线下某型导弹发控系统的设计与仿真[J].计算机与现代化,2013(6):207-211. 被引量：3
6刘美玲,任洪娥,于洋,郑德权,赵铁军.基于网络的动态多文档文摘系统框架[J].软件学报,2013,24(5):1006-1021. 被引量：3
7刘庆华,张维强,赵芙生.基于C++ Builder的汽油发动机数据采集系统[J].农业机械学报,2003,34(1):38-40. 被引量：9
8赵斌,吉根林,徐伟,顾彦慧.基于拓扑结构的微博话题摘要生成算法[J].数据采集与处理,2014,29(5):720-729. 被引量：2
9杨晓兰,钟义信.基于文本理解的自动文摘系统研究与实现[J].电子学报,1998,26(7):155-158. 被引量：17
10Wen Qu,Yifei Zhang,Daling Wang,Shi Feng,Ge Yu.Semantic movie summarization based on string of IE-Role Nets[J].Computational Visual Media,2015,1(2):129-141.

软件学报

2012年第2期

浏览历史

内容加载中请稍等...

动态多文档文摘模型被引量：9

参考文献15

同被引文献121

引证文献9

二级引证文献30

相关作者

相关机构

相关主题

浏览历史

动态多文档文摘模型 被引量：9

参考文献15

同被引文献121

引证文献9

二级引证文献30

相关作者

相关机构

相关主题

浏览历史

动态多文档文摘模型被引量：9