期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
融合词、句层级信息的抽取式摘要优化框架
1
作者 林心宜 严睿 赵东岩 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2018年第2期229-235,共7页
提出一个混合的抽取式摘要优化框架,在优化单词层级信息的同时,将句子层级信息作为优化约束。在约束条件下,该优化框架迭代地进行摘要文本中单元的替换,得到不断逼近目标函数的最优解。与传统方法对比,该框架在DUC数据集上获得ROUGE评... 提出一个混合的抽取式摘要优化框架,在优化单词层级信息的同时,将句子层级信息作为优化约束。在约束条件下,该优化框架迭代地进行摘要文本中单元的替换,得到不断逼近目标函数的最优解。与传统方法对比,该框架在DUC数据集上获得ROUGE评测的高分,证明了该框架的有效性。 展开更多
关键词 抽取式摘要生成 词层级信息 句层级信息 混合迭代优化框架
下载PDF
一种句子级别的中文文本复制检测方法 被引量:1
2
作者 卢小康 王小华 王荣波 《杭州电子科技大学学报(自然科学版)》 2009年第6期45-48,共4页
该文提出了一种句子级别的中文文本复制检测方法。该方法以句子为基本复制检测单位,运用最长公共子序列算法计算两篇文本之间的重复度,根据所得的重复度值来检测两篇文本是否存在复制现象以及复制的程度。在方法中,剔除句子的其他成分,... 该文提出了一种句子级别的中文文本复制检测方法。该方法以句子为基本复制检测单位,运用最长公共子序列算法计算两篇文本之间的重复度,根据所得的重复度值来检测两篇文本是否存在复制现象以及复制的程度。在方法中,剔除句子的其他成分,提取句子中的名词作为句子的文本特征,增加了算法的鲁棒性;建立句子与文档的倒排索引,可快速索引得到存在该句子的所有文档的集合,提高了算法的速度,为大规模文本复制检测提供了一种可行的方法。实验表明,该算法对于普通网页文本复制检测能取得很好效果。 展开更多
关键词 复制检测 句子级别 倒排索引 中文信息处理
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部