期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
融合词、句层级信息的抽取式摘要优化框架
1
作者
林心宜
严睿
赵东岩
《北京大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2018年第2期229-235,共7页
提出一个混合的抽取式摘要优化框架,在优化单词层级信息的同时,将句子层级信息作为优化约束。在约束条件下,该优化框架迭代地进行摘要文本中单元的替换,得到不断逼近目标函数的最优解。与传统方法对比,该框架在DUC数据集上获得ROUGE评...
提出一个混合的抽取式摘要优化框架,在优化单词层级信息的同时,将句子层级信息作为优化约束。在约束条件下,该优化框架迭代地进行摘要文本中单元的替换,得到不断逼近目标函数的最优解。与传统方法对比,该框架在DUC数据集上获得ROUGE评测的高分,证明了该框架的有效性。
展开更多
关键词
抽取式摘要生成
词层级信息
句层级信息
混合迭代优化框架
下载PDF
职称材料
一种句子级别的中文文本复制检测方法
被引量:
1
2
作者
卢小康
王小华
王荣波
《杭州电子科技大学学报(自然科学版)》
2009年第6期45-48,共4页
该文提出了一种句子级别的中文文本复制检测方法。该方法以句子为基本复制检测单位,运用最长公共子序列算法计算两篇文本之间的重复度,根据所得的重复度值来检测两篇文本是否存在复制现象以及复制的程度。在方法中,剔除句子的其他成分,...
该文提出了一种句子级别的中文文本复制检测方法。该方法以句子为基本复制检测单位,运用最长公共子序列算法计算两篇文本之间的重复度,根据所得的重复度值来检测两篇文本是否存在复制现象以及复制的程度。在方法中,剔除句子的其他成分,提取句子中的名词作为句子的文本特征,增加了算法的鲁棒性;建立句子与文档的倒排索引,可快速索引得到存在该句子的所有文档的集合,提高了算法的速度,为大规模文本复制检测提供了一种可行的方法。实验表明,该算法对于普通网页文本复制检测能取得很好效果。
展开更多
关键词
复制检测
句子级别
倒排索引
中文信息处理
下载PDF
职称材料
题名
融合词、句层级信息的抽取式摘要优化框架
1
作者
林心宜
严睿
赵东岩
机构
北京大学计算机科学技术研究所
北京大学信息科学技术学院
出处
《北京大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2018年第2期229-235,共7页
基金
国家自然科学基金(61672058)
国家高技术研究发展计划(2015AA015403)
CCF-腾讯科研基金资助
文摘
提出一个混合的抽取式摘要优化框架,在优化单词层级信息的同时,将句子层级信息作为优化约束。在约束条件下,该优化框架迭代地进行摘要文本中单元的替换,得到不断逼近目标函数的最优解。与传统方法对比,该框架在DUC数据集上获得ROUGE评测的高分,证明了该框架的有效性。
关键词
抽取式摘要生成
词层级信息
句层级信息
混合迭代优化框架
Keywords
extractive
summarization
word-
level
information
sentence
-
level
information
hybrid
optimization
framework
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
一种句子级别的中文文本复制检测方法
被引量:
1
2
作者
卢小康
王小华
王荣波
机构
杭州电子科技大学计算机应用研究所
出处
《杭州电子科技大学学报(自然科学版)》
2009年第6期45-48,共4页
文摘
该文提出了一种句子级别的中文文本复制检测方法。该方法以句子为基本复制检测单位,运用最长公共子序列算法计算两篇文本之间的重复度,根据所得的重复度值来检测两篇文本是否存在复制现象以及复制的程度。在方法中,剔除句子的其他成分,提取句子中的名词作为句子的文本特征,增加了算法的鲁棒性;建立句子与文档的倒排索引,可快速索引得到存在该句子的所有文档的集合,提高了算法的速度,为大规模文本复制检测提供了一种可行的方法。实验表明,该算法对于普通网页文本复制检测能取得很好效果。
关键词
复制检测
句子级别
倒排索引
中文信息处理
Keywords
copy
detection
sentence
level
inverted
index
Chinese
information
processing
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
融合词、句层级信息的抽取式摘要优化框架
林心宜
严睿
赵东岩
《北京大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2018
0
下载PDF
职称材料
2
一种句子级别的中文文本复制检测方法
卢小康
王小华
王荣波
《杭州电子科技大学学报(自然科学版)》
2009
1
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部