期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
5
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
文本配图系统的设计与实现
被引量:
1
1
作者
张明西
乐水波
+1 位作者
李学民
董一鹏
《包装工程》
CAS
北大核心
2020年第19期252-258,共7页
目的设计并开发文本配图系统,实现面向文本数据的在线自动配图。方法基于图片和文本之间的描述关系构建“图片-标签”二分网络,然后基于“图片-标签”的二分网络,利用重启随机游走模型进行图片与标签之间的相关性计算。采用TextRank模...
目的设计并开发文本配图系统,实现面向文本数据的在线自动配图。方法基于图片和文本之间的描述关系构建“图片-标签”二分网络,然后基于“图片-标签”的二分网络,利用重启随机游走模型进行图片与标签之间的相关性计算。采用TextRank模型提取关键字,并将关键字构成的集合作为查询,将关键字视为标签。基于离线计算结果,在线整合标签与图片之间的相关性,得到文本与图片的相关性。依据相关性由大到小进行排序,并返回前k个最相关的图片。结果实验结果表明,前5个返回结果的MAP值能够达到0.839,能够准确地返回用户期望的图片。结论系统能够依据输入文本进行准确的图片匹配。
展开更多
关键词
TF-IDF模型
文本配图
重启随机游走
textrank
模型
下载PDF
职称材料
基于中文专利的产业概念层次体系构建方法研究
2
作者
李贞贞
钟永恒
《情报杂志》
CSSCI
北大核心
2020年第9期73-80,共8页
[目的/意义]构建丰富的产业概念层次体系,有助于对产业数据资源进行有序组织,研究构建过程中关键词识别与层级关系确定的方法。[方法/过程]以产业中文专利数据为来源,引入平衡语料与平均信息熵提取通用词并过滤;融合位置、词性、TF-IDF...
[目的/意义]构建丰富的产业概念层次体系,有助于对产业数据资源进行有序组织,研究构建过程中关键词识别与层级关系确定的方法。[方法/过程]以产业中文专利数据为来源,引入平衡语料与平均信息熵提取通用词并过滤;融合位置、词性、TF-IDF与外部知识库特征,改进TextRank模型有效识别关键词;最后结合产业专家知识、深度学习和近邻传播聚类(AP)算法生成产业概念层次体系。[结果/结论]实验选取“汽车制造”产业进行实证分析,结果显示在关键词抽取上较传统方法有了明显的提高,自动生成的三层次体系包含6个一级关键词和23个二级关键词。该方法能够有效提升构建效率,实现高效的动态更新,为产业数据资源科学管理提供新思路。
展开更多
关键词
产业概念层次体系
中文专利
textrank
模型
近邻传播聚类算法
通用词
平均信息熵
下载PDF
职称材料
词语位置加权TextRank的关键词抽取研究
被引量:
76
3
作者
夏天
《现代图书情报技术》
CSSCI
北大核心
2013年第9期30-34,共5页
把关键词抽取问题看作是构成文档词语的重要性排序问题,基于TextRank基本思想,构建候选关键词图,引入覆盖影响力、位置影响力和频度影响力用于计算词语之间的影响力概率转移矩阵,通过迭代法实现候选关键词分值计算,并挑选前N个作为关键...
把关键词抽取问题看作是构成文档词语的重要性排序问题,基于TextRank基本思想,构建候选关键词图,引入覆盖影响力、位置影响力和频度影响力用于计算词语之间的影响力概率转移矩阵,通过迭代法实现候选关键词分值计算,并挑选前N个作为关键词抽取结果。实验结果表明,对词语位置加权的TextRank方法优于传统的TextRank方法和基于LDA主题模型的关键词抽取方法。
展开更多
关键词
关键词抽取
词排序
textrank
图模型LDA
原文传递
融合LDA与TextRank的关键词抽取研究
被引量:
70
4
作者
顾益军
夏天
《现代图书情报技术》
CSSCI
北大核心
2014年第7期41-47,共7页
【目的】通过将单一文档内部的结构信息和文档整体的主题信息融合到一起进行关键词抽取。【方法】利用LDA对文档集进行主题建模和候选关键词的主题影响力计算,进而对TextRank算法进行改进,将候选关键词的重要性按照主题影响力和邻接关...
【目的】通过将单一文档内部的结构信息和文档整体的主题信息融合到一起进行关键词抽取。【方法】利用LDA对文档集进行主题建模和候选关键词的主题影响力计算,进而对TextRank算法进行改进,将候选关键词的重要性按照主题影响力和邻接关系进行非均匀传递,并构建新的概率转移矩阵用于词图迭代计算和关键词抽取。【结果】实现LDA与TextRank的有效融合,当数据集呈现较强的主题分布时,可以显著改善关键词抽取效果。【局限】融合方法需要进行代价较高的多文档主题分析。【结论】关键词既与文档本身相关,也与文档所在的文档集合相关,二者结合是改进关键词抽取结果的有效途径。
展开更多
关键词
关键词抽取
LDA
textrank
图模型
原文传递
融合Word2vec与TextRank的关键词抽取研究
被引量:
66
5
作者
宁建飞
刘降珍
《现代图书情报技术》
CSSCI
2016年第6期20-27,共8页
【目的】通过融合单个文档内部结构信息和文档整体的词向量关系进行关键词抽取。【方法】利用Word2vec将文档集中所有词汇进行向量表征,并且通过词向量计算词汇之间的相似度,进而对Text Rank算法进行改进,将候选关键词的权重按照词汇之...
【目的】通过融合单个文档内部结构信息和文档整体的词向量关系进行关键词抽取。【方法】利用Word2vec将文档集中所有词汇进行向量表征,并且通过词向量计算词汇之间的相似度,进而对Text Rank算法进行改进,将候选关键词的权重按照词汇之间的相似度和邻接关系进行非均匀分配,并构建对应的概率转移矩阵用于词汇图模型的迭代计算以及关键词抽取。【结果】实现Word2vec与Text Rank的有效融合,且当训练文档集词汇分布合理时,关键词抽取效果较明显。【局限】需要进行成本较高的文档集训练,获取词向量以及词关系矩阵。【结论】文档集中的词关系有助于修正单文档内部的词关系,提升单文档的关键词抽取准确性。
展开更多
关键词
抽取
Word2vec
textrank
图模型
词向量
原文传递
题名
文本配图系统的设计与实现
被引量:
1
1
作者
张明西
乐水波
李学民
董一鹏
机构
上海理工大学
出处
《包装工程》
CAS
北大核心
2020年第19期252-258,共7页
基金
国家自然科学基金(62002225)
上海市自然科学基金(16ZR1422800)
+1 种基金
上海理工大学国家级项目培育基金(16HJPY-QN04)
国家新闻出版广电总局准重点实验室招标课题(ZBKT201809)。
文摘
目的设计并开发文本配图系统,实现面向文本数据的在线自动配图。方法基于图片和文本之间的描述关系构建“图片-标签”二分网络,然后基于“图片-标签”的二分网络,利用重启随机游走模型进行图片与标签之间的相关性计算。采用TextRank模型提取关键字,并将关键字构成的集合作为查询,将关键字视为标签。基于离线计算结果,在线整合标签与图片之间的相关性,得到文本与图片的相关性。依据相关性由大到小进行排序,并返回前k个最相关的图片。结果实验结果表明,前5个返回结果的MAP值能够达到0.839,能够准确地返回用户期望的图片。结论系统能够依据输入文本进行准确的图片匹配。
关键词
TF-IDF模型
文本配图
重启随机游走
textrank
模型
Keywords
TF-IDF
model
text
matching
picture
random
walk
with
restart
textrank
model
分类号
TP317.4 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
基于中文专利的产业概念层次体系构建方法研究
2
作者
李贞贞
钟永恒
机构
中国科学院武汉文献情报中心
科技大数据湖北省重点实验室
出处
《情报杂志》
CSSCI
北大核心
2020年第9期73-80,共8页
基金
中国科学院武汉文献情报中心前瞻性项目“领域术语自动抽取方法研究”(编号:Y9KZ401)研究成果之一。
文摘
[目的/意义]构建丰富的产业概念层次体系,有助于对产业数据资源进行有序组织,研究构建过程中关键词识别与层级关系确定的方法。[方法/过程]以产业中文专利数据为来源,引入平衡语料与平均信息熵提取通用词并过滤;融合位置、词性、TF-IDF与外部知识库特征,改进TextRank模型有效识别关键词;最后结合产业专家知识、深度学习和近邻传播聚类(AP)算法生成产业概念层次体系。[结果/结论]实验选取“汽车制造”产业进行实证分析,结果显示在关键词抽取上较传统方法有了明显的提高,自动生成的三层次体系包含6个一级关键词和23个二级关键词。该方法能够有效提升构建效率,实现高效的动态更新,为产业数据资源科学管理提供新思路。
关键词
产业概念层次体系
中文专利
textrank
模型
近邻传播聚类算法
通用词
平均信息熵
Keywords
industrial
concept
hierarchy
Chinese
patent
textrank
model
affinity
propagation
clustering
algorithm
general
word
average
information
entropy
分类号
G350 [文化科学—情报学]
下载PDF
职称材料
题名
词语位置加权TextRank的关键词抽取研究
被引量:
76
3
作者
夏天
机构
中国人民大学数据工程与知识工程教育部重点实验室
中国人民大学信息资源管理学院
出处
《现代图书情报技术》
CSSCI
北大核心
2013年第9期30-34,共5页
基金
国家社会科学基金项目"Web2.0环境下的网络舆情采集与分析"(项目编号:09CTQ027)
国家社会科学基金重大项目"云计算环境下的信息资源集成与服务研究"(项目编号:12&ZD220)的研究成果之一
文摘
把关键词抽取问题看作是构成文档词语的重要性排序问题,基于TextRank基本思想,构建候选关键词图,引入覆盖影响力、位置影响力和频度影响力用于计算词语之间的影响力概率转移矩阵,通过迭代法实现候选关键词分值计算,并挑选前N个作为关键词抽取结果。实验结果表明,对词语位置加权的TextRank方法优于传统的TextRank方法和基于LDA主题模型的关键词抽取方法。
关键词
关键词抽取
词排序
textrank
图模型LDA
Keywords
Keyword
extraction
Word
rank
textrank
Graph
model
LDA
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
原文传递
题名
融合LDA与TextRank的关键词抽取研究
被引量:
70
4
作者
顾益军
夏天
机构
中国人民公安大学网络安全保卫学院
中国人民大学数据工程与知识工程教育部重点实验室
中国人民大学信息资源管理学院
出处
《现代图书情报技术》
CSSCI
北大核心
2014年第7期41-47,共7页
基金
国家社会科学基金项目"Web2.0环境下的网络舆情采集与分析"(项目编号:09CTQ027)
北京高等学校青年英才计划项目"基于链接和主题分析的微博社区挖掘研究"(项目编号:YETP0215)的研究成果之一
文摘
【目的】通过将单一文档内部的结构信息和文档整体的主题信息融合到一起进行关键词抽取。【方法】利用LDA对文档集进行主题建模和候选关键词的主题影响力计算,进而对TextRank算法进行改进,将候选关键词的重要性按照主题影响力和邻接关系进行非均匀传递,并构建新的概率转移矩阵用于词图迭代计算和关键词抽取。【结果】实现LDA与TextRank的有效融合,当数据集呈现较强的主题分布时,可以显著改善关键词抽取效果。【局限】融合方法需要进行代价较高的多文档主题分析。【结论】关键词既与文档本身相关,也与文档所在的文档集合相关,二者结合是改进关键词抽取结果的有效途径。
关键词
关键词抽取
LDA
textrank
图模型
Keywords
Keyword
extraction
LDA
textrank
Graph
model
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
原文传递
题名
融合Word2vec与TextRank的关键词抽取研究
被引量:
66
5
作者
宁建飞
刘降珍
机构
罗定职业技术学院电子信息系
出处
《现代图书情报技术》
CSSCI
2016年第6期20-27,共8页
文摘
【目的】通过融合单个文档内部结构信息和文档整体的词向量关系进行关键词抽取。【方法】利用Word2vec将文档集中所有词汇进行向量表征,并且通过词向量计算词汇之间的相似度,进而对Text Rank算法进行改进,将候选关键词的权重按照词汇之间的相似度和邻接关系进行非均匀分配,并构建对应的概率转移矩阵用于词汇图模型的迭代计算以及关键词抽取。【结果】实现Word2vec与Text Rank的有效融合,且当训练文档集词汇分布合理时,关键词抽取效果较明显。【局限】需要进行成本较高的文档集训练,获取词向量以及词关系矩阵。【结论】文档集中的词关系有助于修正单文档内部的词关系,提升单文档的关键词抽取准确性。
关键词
抽取
Word2vec
textrank
图模型
词向量
Keywords
Keyword
extraction
Word2vec
textrank
Graphical
model
Word
vector
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
原文传递
题名
作者
出处
发文年
被引量
操作
1
文本配图系统的设计与实现
张明西
乐水波
李学民
董一鹏
《包装工程》
CAS
北大核心
2020
1
下载PDF
职称材料
2
基于中文专利的产业概念层次体系构建方法研究
李贞贞
钟永恒
《情报杂志》
CSSCI
北大核心
2020
0
下载PDF
职称材料
3
词语位置加权TextRank的关键词抽取研究
夏天
《现代图书情报技术》
CSSCI
北大核心
2013
76
原文传递
4
融合LDA与TextRank的关键词抽取研究
顾益军
夏天
《现代图书情报技术》
CSSCI
北大核心
2014
70
原文传递
5
融合Word2vec与TextRank的关键词抽取研究
宁建飞
刘降珍
《现代图书情报技术》
CSSCI
2016
66
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部