期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于文本摘要的无监督关键词抽取方法
1
作者
尤泽顺
周喜
+2 位作者
董瑞
张洋宁
杨奉毅
《计算机工程与设计》
北大核心
2024年第9期2779-2784,共6页
为克服基于嵌入的关键词抽取方法在长文档上性能下降的问题,提出一种基于文本摘要的方法(summarization-based document embedding rank,SDERank)。将句向量的加权和作为文档嵌入,根据每个句子与文档主题的语义相关度赋予权重。以往基...
为克服基于嵌入的关键词抽取方法在长文档上性能下降的问题,提出一种基于文本摘要的方法(summarization-based document embedding rank,SDERank)。将句向量的加权和作为文档嵌入,根据每个句子与文档主题的语义相关度赋予权重。以往基于嵌入的方法选择关键词时忽略候选词之间的关联,针对该问题,在SDERank的改进版SDERank+中,PageRank算法被用于提取候选词之间的共现权重作为相似度分数的修正。实验结果表明,在4个广泛使用的数据集上SDERank和SDERank+比之前最好的模型MDERank的F1分数平均高出2.2%和3.29%。
展开更多
关键词
自动关键词抽取
文本摘要
长
文档
建模
文档
主题分析
语义处理
权重优化
向量相似性
下载PDF
职称材料
题名
基于文本摘要的无监督关键词抽取方法
1
作者
尤泽顺
周喜
董瑞
张洋宁
杨奉毅
机构
中国科学院新疆理化技术研究所
中国科学院大学计算机科学与技术学院
新疆民族语音语言信息处理实验室
新疆农业大学计算机与信息工程学院
出处
《计算机工程与设计》
北大核心
2024年第9期2779-2784,共6页
基金
新疆维吾尔自治区自然科学基金项目(2022D01E04)
新疆维吾尔自治区重大科技专项基金项目(2020A02001-1)
+1 种基金
中国科学院西部青年学者基金项目(2019-XBQNXZ-B-008)
中国科学院青年创新促进会基金项目(2021436)。
文摘
为克服基于嵌入的关键词抽取方法在长文档上性能下降的问题,提出一种基于文本摘要的方法(summarization-based document embedding rank,SDERank)。将句向量的加权和作为文档嵌入,根据每个句子与文档主题的语义相关度赋予权重。以往基于嵌入的方法选择关键词时忽略候选词之间的关联,针对该问题,在SDERank的改进版SDERank+中,PageRank算法被用于提取候选词之间的共现权重作为相似度分数的修正。实验结果表明,在4个广泛使用的数据集上SDERank和SDERank+比之前最好的模型MDERank的F1分数平均高出2.2%和3.29%。
关键词
自动关键词抽取
文本摘要
长
文档
建模
文档
主题分析
语义处理
权重优化
向量相似性
Keywords
automatic keyword extraction
text summarization
long document modeling
document topic analysis
semantic proce-ssing
weight optimization
similarity matches
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于文本摘要的无监督关键词抽取方法
尤泽顺
周喜
董瑞
张洋宁
杨奉毅
《计算机工程与设计》
北大核心
2024
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部