期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
8
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于LDA模型的主题词抽取方法
被引量:
47
1
作者
石晶
李万龙
《计算机工程》
CAS
CSCD
北大核心
2010年第19期81-83,共3页
以LDA模型表示文本词汇的概率分布,通过香农信息抽取体现主题的关键词。采用背景词汇聚类及主题词联想的方式将主题词扩充到待分析文本之外,尝试挖掘文本的主题内涵。模型拟合基于快速Gibbs抽样算法进行。实验结果表明,快速Gibbs算法的...
以LDA模型表示文本词汇的概率分布,通过香农信息抽取体现主题的关键词。采用背景词汇聚类及主题词联想的方式将主题词扩充到待分析文本之外,尝试挖掘文本的主题内涵。模型拟合基于快速Gibbs抽样算法进行。实验结果表明,快速Gibbs算法的速度约比传统Gibbs算法高5倍,准确率和抽取效率均较高。
展开更多
关键词
LDA模型
GIBBS抽样
主题词
抽取
下载PDF
职称材料
一种基于词共现图的受限领域自动问答系统
被引量:
16
2
作者
钱强
庞林斌
高尚
《计算机应用研究》
CSCD
北大核心
2013年第3期841-843,共3页
提出了一种基于高频词和共现词的文本主题词抽取方法。该方法充分考虑到文档的统计信息和语义信息,通过对提问问题和答案库中答案的相似度计算排序,输出候选答案。提出一种具体的应用模型,分别从问题的分析、信息检索和答案抽取三个模...
提出了一种基于高频词和共现词的文本主题词抽取方法。该方法充分考虑到文档的统计信息和语义信息,通过对提问问题和答案库中答案的相似度计算排序,输出候选答案。提出一种具体的应用模型,分别从问题的分析、信息检索和答案抽取三个模块进行系统的设计,具有一定的应用价值。
展开更多
关键词
自动问答
主题词
抽取
词共现图
下载PDF
职称材料
基于Morphology处理和主题词抽取的垃圾邮件过滤方法
被引量:
4
3
作者
胡健
马范援
《上海交通大学学报》
EI
CAS
CSCD
北大核心
2005年第12期1963-1966,共4页
考虑到垃圾邮件预处理的重要性,提出了利用M orpho logy对垃圾邮件内容进行还原.为了提高邮件分类的性能,对邮件进行主题词抽取,并且结合邮件其他的属性特征,利用贝叶斯方法对邮件进行分类.实验表明,这种基于M orpho logy处理和主题词...
考虑到垃圾邮件预处理的重要性,提出了利用M orpho logy对垃圾邮件内容进行还原.为了提高邮件分类的性能,对邮件进行主题词抽取,并且结合邮件其他的属性特征,利用贝叶斯方法对邮件进行分类.实验表明,这种基于M orpho logy处理和主题词抽取的垃圾邮件过滤方法十分有效.
展开更多
关键词
词态学
主题词
抽取
反垃圾邮件
信息过滤
下载PDF
职称材料
基于维基百科和条件随机场的领域主题词抽取方法
被引量:
1
4
作者
齐保元
史忠植
《高技术通讯》
CAS
CSCD
北大核心
2014年第6期602-608,共7页
针对传统的手工整理主题词表的方法因耗时、更新速度慢而无法满足应用要求的问题,提出了一种基于维基百科(Wikipedia)和条件随机场(CRF)的领域主题词抽取方法。该方法根据特定领域现有主题词的构词特点、统计分布特点,充分利用维基百科...
针对传统的手工整理主题词表的方法因耗时、更新速度慢而无法满足应用要求的问题,提出了一种基于维基百科(Wikipedia)和条件随机场(CRF)的领域主题词抽取方法。该方法根据特定领域现有主题词的构词特点、统计分布特点,充分利用维基百科独特的结构优势,自动地从维基百科中获取新的领域主题词,补充现有主题词表。该方法采用条件随机场作为训练、测试的模型,将多方面的特征进行综合建模,取得了较好的实验效果。实验结果表明,使用该方法可以将主题词识别的F值提高到83%左右。
展开更多
关键词
主题词
表构建
主题词
抽取
维基百科(Wikipedia)
条件随机场(CRF)
下载PDF
职称材料
人工智能“为你写诗”
被引量:
1
5
作者
吴甜
和为
《人工智能》
2018年第1期132-140,共9页
在人工智能给人们的生活带来便利的同时,其在艺术等领域的应用也获得了研究人员的关注。其中,现在的机器作诗工作几乎可以达到对非文学专业的普通群众'以假乱真'的水平。基于主题规划的写诗方法解决了机器写诗主题相关性弱的问...
在人工智能给人们的生活带来便利的同时,其在艺术等领域的应用也获得了研究人员的关注。其中,现在的机器作诗工作几乎可以达到对非文学专业的普通群众'以假乱真'的水平。基于主题规划的写诗方法解决了机器写诗主题相关性弱的问题,其基本思路是:通过对诗歌题目的解析,规划得到全诗每一句的主题词,并结合序列到序列生成机制,依次完成每一句诗歌的生成过程。
展开更多
关键词
主题词
抽取
NMT
关注度
序列到序列
一句诗
古代诗人
人工智能
基于
主题
TextRank
三句诗
五言诗
编码器
人工评价
下载PDF
职称材料
基于局部密度的无监督作文跑题检测方法
被引量:
1
6
作者
李霞
温启帆
《中文信息学报》
CSCD
北大核心
2017年第6期205-213,共9页
针对现有的无监督作文跑题检测方法中,使用作文内容向量表示作文存在非主题词噪声所导致的相似度不准确问题,该文提出一种基于作文主题词抽取和局部密度阈值选择的无监督作文跑题检测方法。首先使用LDA主题生成模型挖掘待测作文的主题词...
针对现有的无监督作文跑题检测方法中,使用作文内容向量表示作文存在非主题词噪声所导致的相似度不准确问题,该文提出一种基于作文主题词抽取和局部密度阈值选择的无监督作文跑题检测方法。首先使用LDA主题生成模型挖掘待测作文的主题词,并使用分布式表示向量寻找与题目词项语义相似的词,作为对作文题目的主题词扩展,在此基础上使用提出的切题度计算方法计算待测作文的切题度,并使用所提出的基于作文集切题度局部密度的阈值抽取方法动态选取切题阈值,进而实现一种无需训练集和主题无关的无监督作文跑题检测方法。在以英语为母语的学习者和以汉语为母语的学习者所写的8个作文集共9 381篇作文上的实验结果表明,该文提出的作文跑题检测方法能有效识别跑题作文,加入拼写检查预处理后,平均F1值为79.64%,单个作文题目下F1值最好为96.1%。
展开更多
关键词
作文跑题检测
主题词
抽取
切题度
阈值选取
下载PDF
职称材料
基于Hadoop云平台的文本复合主题词抽取
7
作者
王晓龙
张婉琳
《电脑编程技巧与维护》
2019年第2期92-93,99,共3页
在自然语言处理和文本挖掘领域,主题词提取是一个关键内容,在信息提取、生成抽象、文本分类和文本聚类中起着重要作用。将云计算技术应用于文本复合主题词提取,对于促进文本挖掘和自然语言处理的发展具有重要作用。在此基础上,结合云计...
在自然语言处理和文本挖掘领域,主题词提取是一个关键内容,在信息提取、生成抽象、文本分类和文本聚类中起着重要作用。将云计算技术应用于文本复合主题词提取,对于促进文本挖掘和自然语言处理的发展具有重要作用。在此基础上,结合云计算技术,分析设计了一种基于Hadoop平台的文本复合主题词提取系统,以不同方式对文本进行全面的主题词提取。
展开更多
关键词
主题词
抽取
云计算
HADOOP平台
下载PDF
职称材料
浅析英文自动摘要技术
8
作者
刘郑
杜祝平
《魅力中国》
2008年第28期63-64,共2页
自然语言处理是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。语言是人类区别其他动物的本质特性。在所有生物中,只有人类才具有语言能力。人类的多种智能都和...
自然语言处理是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。语言是人类区别其他动物的本质特性。在所有生物中,只有人类才具有语言能力。人类的多种智能都和语言有着密切的关系。人类的逻辑思维以语言为形式。
展开更多
关键词
主题词
抽取
词频统计
文本结构分析
内容词
文件格式
下载PDF
职称材料
题名
基于LDA模型的主题词抽取方法
被引量:
47
1
作者
石晶
李万龙
机构
长春工业大学计算机科学与工程学院
吉林大学计算机科学与技术学院
出处
《计算机工程》
CAS
CSCD
北大核心
2010年第19期81-83,共3页
基金
长春工业大学博士基金资助项目(2008A02)
文摘
以LDA模型表示文本词汇的概率分布,通过香农信息抽取体现主题的关键词。采用背景词汇聚类及主题词联想的方式将主题词扩充到待分析文本之外,尝试挖掘文本的主题内涵。模型拟合基于快速Gibbs抽样算法进行。实验结果表明,快速Gibbs算法的速度约比传统Gibbs算法高5倍,准确率和抽取效率均较高。
关键词
LDA模型
GIBBS抽样
主题词
抽取
Keywords
Latent Dirichlet Allocation(LDA) model
Gibbs sampling
extraction of topic words
分类号
TP301 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
一种基于词共现图的受限领域自动问答系统
被引量:
16
2
作者
钱强
庞林斌
高尚
机构
江苏科技大学计算机科学与工程学院
出处
《计算机应用研究》
CSCD
北大核心
2013年第3期841-843,共3页
文摘
提出了一种基于高频词和共现词的文本主题词抽取方法。该方法充分考虑到文档的统计信息和语义信息,通过对提问问题和答案库中答案的相似度计算排序,输出候选答案。提出一种具体的应用模型,分别从问题的分析、信息检索和答案抽取三个模块进行系统的设计,具有一定的应用价值。
关键词
自动问答
主题词
抽取
词共现图
Keywords
automatic question-answering
keyprase extraction
term co-occurrence graphic
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于Morphology处理和主题词抽取的垃圾邮件过滤方法
被引量:
4
3
作者
胡健
马范援
机构
上海交通大学计算机科学与工程系
出处
《上海交通大学学报》
EI
CAS
CSCD
北大核心
2005年第12期1963-1966,共4页
文摘
考虑到垃圾邮件预处理的重要性,提出了利用M orpho logy对垃圾邮件内容进行还原.为了提高邮件分类的性能,对邮件进行主题词抽取,并且结合邮件其他的属性特征,利用贝叶斯方法对邮件进行分类.实验表明,这种基于M orpho logy处理和主题词抽取的垃圾邮件过滤方法十分有效.
关键词
词态学
主题词
抽取
反垃圾邮件
信息过滤
Keywords
morphology
key words extraction
anti-spam
information filtering
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于维基百科和条件随机场的领域主题词抽取方法
被引量:
1
4
作者
齐保元
史忠植
机构
中国科学院大学
中国科学院计算技术研究所智能信息处理重点实验室
出处
《高技术通讯》
CAS
CSCD
北大核心
2014年第6期602-608,共7页
基金
973计划(2013CB329502)
国家自然科学基金(61035003
+5 种基金
60933004
61202212
61072085)
863计划(2012AA011003)
国家科技支撑计划(2012BA107B02)
中国信息安全测评中心(CNITSEC-KY-2012-006/1)资助项目
文摘
针对传统的手工整理主题词表的方法因耗时、更新速度慢而无法满足应用要求的问题,提出了一种基于维基百科(Wikipedia)和条件随机场(CRF)的领域主题词抽取方法。该方法根据特定领域现有主题词的构词特点、统计分布特点,充分利用维基百科独特的结构优势,自动地从维基百科中获取新的领域主题词,补充现有主题词表。该方法采用条件随机场作为训练、测试的模型,将多方面的特征进行综合建模,取得了较好的实验效果。实验结果表明,使用该方法可以将主题词识别的F值提高到83%左右。
关键词
主题词
表构建
主题词
抽取
维基百科(Wikipedia)
条件随机场(CRF)
Keywords
thesaurus construction, subject word extraction, Wikipedia, conditional random fields (CRF)
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
人工智能“为你写诗”
被引量:
1
5
作者
吴甜
和为
机构
百度
百度自然语言处理部
出处
《人工智能》
2018年第1期132-140,共9页
文摘
在人工智能给人们的生活带来便利的同时,其在艺术等领域的应用也获得了研究人员的关注。其中,现在的机器作诗工作几乎可以达到对非文学专业的普通群众'以假乱真'的水平。基于主题规划的写诗方法解决了机器写诗主题相关性弱的问题,其基本思路是:通过对诗歌题目的解析,规划得到全诗每一句的主题词,并结合序列到序列生成机制,依次完成每一句诗歌的生成过程。
关键词
主题词
抽取
NMT
关注度
序列到序列
一句诗
古代诗人
人工智能
基于
主题
TextRank
三句诗
五言诗
编码器
人工评价
分类号
I207.25 [文学—中国文学]
TP18 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
基于局部密度的无监督作文跑题检测方法
被引量:
1
6
作者
李霞
温启帆
机构
广东外语外贸大学语言工程与计算实验室
广东外语外贸大学信息科学与技术学院
出处
《中文信息学报》
CSCD
北大核心
2017年第6期205-213,共9页
基金
国家自然科学基金(61402119)
广东省普通高校科技创新项目(2013KJCX0071)
文摘
针对现有的无监督作文跑题检测方法中,使用作文内容向量表示作文存在非主题词噪声所导致的相似度不准确问题,该文提出一种基于作文主题词抽取和局部密度阈值选择的无监督作文跑题检测方法。首先使用LDA主题生成模型挖掘待测作文的主题词,并使用分布式表示向量寻找与题目词项语义相似的词,作为对作文题目的主题词扩展,在此基础上使用提出的切题度计算方法计算待测作文的切题度,并使用所提出的基于作文集切题度局部密度的阈值抽取方法动态选取切题阈值,进而实现一种无需训练集和主题无关的无监督作文跑题检测方法。在以英语为母语的学习者和以汉语为母语的学习者所写的8个作文集共9 381篇作文上的实验结果表明,该文提出的作文跑题检测方法能有效识别跑题作文,加入拼写检查预处理后,平均F1值为79.64%,单个作文题目下F1值最好为96.1%。
关键词
作文跑题检测
主题词
抽取
切题度
阈值选取
Keywords
off-topic essay detection
topic word extraction
on-topic score
threshold extraction
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于Hadoop云平台的文本复合主题词抽取
7
作者
王晓龙
张婉琳
机构
石家庄邮电职业技术学院
出处
《电脑编程技巧与维护》
2019年第2期92-93,99,共3页
文摘
在自然语言处理和文本挖掘领域,主题词提取是一个关键内容,在信息提取、生成抽象、文本分类和文本聚类中起着重要作用。将云计算技术应用于文本复合主题词提取,对于促进文本挖掘和自然语言处理的发展具有重要作用。在此基础上,结合云计算技术,分析设计了一种基于Hadoop平台的文本复合主题词提取系统,以不同方式对文本进行全面的主题词提取。
关键词
主题词
抽取
云计算
HADOOP平台
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
浅析英文自动摘要技术
8
作者
刘郑
杜祝平
机构
信息工程大学信息工程学院
出处
《魅力中国》
2008年第28期63-64,共2页
文摘
自然语言处理是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。语言是人类区别其他动物的本质特性。在所有生物中,只有人类才具有语言能力。人类的多种智能都和语言有着密切的关系。人类的逻辑思维以语言为形式。
关键词
主题词
抽取
词频统计
文本结构分析
内容词
文件格式
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于LDA模型的主题词抽取方法
石晶
李万龙
《计算机工程》
CAS
CSCD
北大核心
2010
47
下载PDF
职称材料
2
一种基于词共现图的受限领域自动问答系统
钱强
庞林斌
高尚
《计算机应用研究》
CSCD
北大核心
2013
16
下载PDF
职称材料
3
基于Morphology处理和主题词抽取的垃圾邮件过滤方法
胡健
马范援
《上海交通大学学报》
EI
CAS
CSCD
北大核心
2005
4
下载PDF
职称材料
4
基于维基百科和条件随机场的领域主题词抽取方法
齐保元
史忠植
《高技术通讯》
CAS
CSCD
北大核心
2014
1
下载PDF
职称材料
5
人工智能“为你写诗”
吴甜
和为
《人工智能》
2018
1
下载PDF
职称材料
6
基于局部密度的无监督作文跑题检测方法
李霞
温启帆
《中文信息学报》
CSCD
北大核心
2017
1
下载PDF
职称材料
7
基于Hadoop云平台的文本复合主题词抽取
王晓龙
张婉琳
《电脑编程技巧与维护》
2019
0
下载PDF
职称材料
8
浅析英文自动摘要技术
刘郑
杜祝平
《魅力中国》
2008
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部