期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于相邻词的中文关键词自动抽取
被引量:
10
1
作者
王灿辉
张敏
+1 位作者
马少平
黄宇
《广西师范大学学报(自然科学版)》
CAS
北大核心
2007年第2期161-164,共4页
文档关键词概括了文档的主题和内容,在信息检索、文本分类、文本聚类等领域有着重要应用。在总结前人研究成果的基础上,提出了一种基于相邻词的中文关键词自动抽取算法。在对50篇学术论文自动抽取关键词的实验中,采用精确匹配的评价获得...
文档关键词概括了文档的主题和内容,在信息检索、文本分类、文本聚类等领域有着重要应用。在总结前人研究成果的基础上,提出了一种基于相邻词的中文关键词自动抽取算法。在对50篇学术论文自动抽取关键词的实验中,采用精确匹配的评价获得了38.9%的精度和34.9%的召回率,采用近似匹配的评价获得了70.7%的精度和68.8%的召回率,能够为进一步的研究提供帮助。
展开更多
关键词
相邻
词
关键
词
抽取
信息检索
下载PDF
职称材料
基于同义替换和相邻词合并的关键词特征权重计算新方法
被引量:
1
2
作者
司红娜
姚力文
李向军
《计算机与现代化》
2010年第4期115-117,121,共4页
特征项权重计算是文本挖掘中关键词提取的核心,其计算方法的好坏对文本挖掘的结果有着重要的影响。本文在对关键词提取特征项权重计算的传统TFIDF算法分析的基础上,为减少该算法特征权重计算时对词频的过于依赖,提出一种基于同义替换和...
特征项权重计算是文本挖掘中关键词提取的核心,其计算方法的好坏对文本挖掘的结果有着重要的影响。本文在对关键词提取特征项权重计算的传统TFIDF算法分析的基础上,为减少该算法特征权重计算时对词频的过于依赖,提出一种基于同义替换和相邻词合并(KSRAM)的特征权重计算方法。为检验算法性能,对KSRAM算法和传统TFIDF算法进行了关键词提取对比实验,实验表明KSRAM算法在关键词提取的准确率和召回率方面比传统TFIDF算法有明显的提高。
展开更多
关键词
同义替换
相邻
词
TFIDF
KSRAM
特征权重
下载PDF
职称材料
基于马尔科夫模型的汉语语句相似度计算
被引量:
1
3
作者
郜炎峰
林燕芬
王忠建
《哈尔滨商业大学学报(自然科学版)》
CAS
2017年第1期73-76,共4页
语句相似度计算在自然语言处理领域是一项非常重要的实用技术,基于马尔科夫模型的汉语语句相似度计算方法通过对语句进行分词处理、构建特征词向量以及权重值向量的方式实现了语句相似度计算.该方法以关系向量模型为基础,通过深入研究...
语句相似度计算在自然语言处理领域是一项非常重要的实用技术,基于马尔科夫模型的汉语语句相似度计算方法通过对语句进行分词处理、构建特征词向量以及权重值向量的方式实现了语句相似度计算.该方法以关系向量模型为基础,通过深入研究汉语语句的特征,利用前后相邻词的共现对权重值向量进行加权处理,以调整不同特征词的权重.方法重点考虑了关键词词形的相似度,结合了句长、词序等表面信息的相似度,并考虑了同义词的情况.最后采用两种不同的方案与关系向量模型进行了对比实验,结果表明方法可以更好的处理长度差很大的两个语句的相似度计算问题,尤其在检索相关新闻标题时准确率较高.
展开更多
关键词
马尔科夫
语句相似度
相邻
词
词
形
下载PDF
职称材料
题名
基于相邻词的中文关键词自动抽取
被引量:
10
1
作者
王灿辉
张敏
马少平
黄宇
机构
清华大学信息科学技术学院
北京交通大学计算机与信息技术学院
出处
《广西师范大学学报(自然科学版)》
CAS
北大核心
2007年第2期161-164,共4页
基金
国家"973"计划基金资助项目(2004CB318108)
国家自然科学基金资助项目(60223004
+3 种基金
60321002
60303005
60503064)
教育部科学技术研究重点项目(104236)
文摘
文档关键词概括了文档的主题和内容,在信息检索、文本分类、文本聚类等领域有着重要应用。在总结前人研究成果的基础上,提出了一种基于相邻词的中文关键词自动抽取算法。在对50篇学术论文自动抽取关键词的实验中,采用精确匹配的评价获得了38.9%的精度和34.9%的召回率,采用近似匹配的评价获得了70.7%的精度和68.8%的召回率,能够为进一步的研究提供帮助。
关键词
相邻
词
关键
词
抽取
信息检索
Keywords
neighbour words
keyword extraction
information retrieval
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于同义替换和相邻词合并的关键词特征权重计算新方法
被引量:
1
2
作者
司红娜
姚力文
李向军
机构
南昌大学信息工程学院
出处
《计算机与现代化》
2010年第4期115-117,121,共4页
文摘
特征项权重计算是文本挖掘中关键词提取的核心,其计算方法的好坏对文本挖掘的结果有着重要的影响。本文在对关键词提取特征项权重计算的传统TFIDF算法分析的基础上,为减少该算法特征权重计算时对词频的过于依赖,提出一种基于同义替换和相邻词合并(KSRAM)的特征权重计算方法。为检验算法性能,对KSRAM算法和传统TFIDF算法进行了关键词提取对比实验,实验表明KSRAM算法在关键词提取的准确率和召回率方面比传统TFIDF算法有明显的提高。
关键词
同义替换
相邻
词
TFIDF
KSRAM
特征权重
Keywords
synonymy replace
adjacent merge
TFIDF
KSRAM
feature item weighting
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
基于马尔科夫模型的汉语语句相似度计算
被引量:
1
3
作者
郜炎峰
林燕芬
王忠建
机构
哈尔滨商业大学计算机与信息工程学院
出处
《哈尔滨商业大学学报(自然科学版)》
CAS
2017年第1期73-76,共4页
基金
黑龙江省自然科学基金(F201243)
黑龙江省教育厅科研项目(12511127)
文摘
语句相似度计算在自然语言处理领域是一项非常重要的实用技术,基于马尔科夫模型的汉语语句相似度计算方法通过对语句进行分词处理、构建特征词向量以及权重值向量的方式实现了语句相似度计算.该方法以关系向量模型为基础,通过深入研究汉语语句的特征,利用前后相邻词的共现对权重值向量进行加权处理,以调整不同特征词的权重.方法重点考虑了关键词词形的相似度,结合了句长、词序等表面信息的相似度,并考虑了同义词的情况.最后采用两种不同的方案与关系向量模型进行了对比实验,结果表明方法可以更好的处理长度差很大的两个语句的相似度计算问题,尤其在检索相关新闻标题时准确率较高.
关键词
马尔科夫
语句相似度
相邻
词
词
形
Keywords
Markov
sentence similarity
adjacent word
morphology
分类号
O177 [理学—数学]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于相邻词的中文关键词自动抽取
王灿辉
张敏
马少平
黄宇
《广西师范大学学报(自然科学版)》
CAS
北大核心
2007
10
下载PDF
职称材料
2
基于同义替换和相邻词合并的关键词特征权重计算新方法
司红娜
姚力文
李向军
《计算机与现代化》
2010
1
下载PDF
职称材料
3
基于马尔科夫模型的汉语语句相似度计算
郜炎峰
林燕芬
王忠建
《哈尔滨商业大学学报(自然科学版)》
CAS
2017
1
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部