期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
基于LDA模型的主题词抽取方法 被引量:47
1
作者 石晶 李万龙 《计算机工程》 CAS CSCD 北大核心 2010年第19期81-83,共3页
以LDA模型表示文本词汇的概率分布,通过香农信息抽取体现主题的关键词。采用背景词汇聚类及主题词联想的方式将主题词扩充到待分析文本之外,尝试挖掘文本的主题内涵。模型拟合基于快速Gibbs抽样算法进行。实验结果表明,快速Gibbs算法的... 以LDA模型表示文本词汇的概率分布,通过香农信息抽取体现主题的关键词。采用背景词汇聚类及主题词联想的方式将主题词扩充到待分析文本之外,尝试挖掘文本的主题内涵。模型拟合基于快速Gibbs抽样算法进行。实验结果表明,快速Gibbs算法的速度约比传统Gibbs算法高5倍,准确率和抽取效率均较高。 展开更多
关键词 LDA模型 GIBBS抽样 主题词抽取
下载PDF
一种基于词共现图的受限领域自动问答系统 被引量:16
2
作者 钱强 庞林斌 高尚 《计算机应用研究》 CSCD 北大核心 2013年第3期841-843,共3页
提出了一种基于高频词和共现词的文本主题词抽取方法。该方法充分考虑到文档的统计信息和语义信息,通过对提问问题和答案库中答案的相似度计算排序,输出候选答案。提出一种具体的应用模型,分别从问题的分析、信息检索和答案抽取三个模... 提出了一种基于高频词和共现词的文本主题词抽取方法。该方法充分考虑到文档的统计信息和语义信息,通过对提问问题和答案库中答案的相似度计算排序,输出候选答案。提出一种具体的应用模型,分别从问题的分析、信息检索和答案抽取三个模块进行系统的设计,具有一定的应用价值。 展开更多
关键词 自动问答 主题词抽取 词共现图
下载PDF
基于Morphology处理和主题词抽取的垃圾邮件过滤方法 被引量:4
3
作者 胡健 马范援 《上海交通大学学报》 EI CAS CSCD 北大核心 2005年第12期1963-1966,共4页
考虑到垃圾邮件预处理的重要性,提出了利用M orpho logy对垃圾邮件内容进行还原.为了提高邮件分类的性能,对邮件进行主题词抽取,并且结合邮件其他的属性特征,利用贝叶斯方法对邮件进行分类.实验表明,这种基于M orpho logy处理和主题词... 考虑到垃圾邮件预处理的重要性,提出了利用M orpho logy对垃圾邮件内容进行还原.为了提高邮件分类的性能,对邮件进行主题词抽取,并且结合邮件其他的属性特征,利用贝叶斯方法对邮件进行分类.实验表明,这种基于M orpho logy处理和主题词抽取的垃圾邮件过滤方法十分有效. 展开更多
关键词 词态学 主题词抽取 反垃圾邮件 信息过滤
下载PDF
基于维基百科和条件随机场的领域主题词抽取方法 被引量:1
4
作者 齐保元 史忠植 《高技术通讯》 CAS CSCD 北大核心 2014年第6期602-608,共7页
针对传统的手工整理主题词表的方法因耗时、更新速度慢而无法满足应用要求的问题,提出了一种基于维基百科(Wikipedia)和条件随机场(CRF)的领域主题词抽取方法。该方法根据特定领域现有主题词的构词特点、统计分布特点,充分利用维基百科... 针对传统的手工整理主题词表的方法因耗时、更新速度慢而无法满足应用要求的问题,提出了一种基于维基百科(Wikipedia)和条件随机场(CRF)的领域主题词抽取方法。该方法根据特定领域现有主题词的构词特点、统计分布特点,充分利用维基百科独特的结构优势,自动地从维基百科中获取新的领域主题词,补充现有主题词表。该方法采用条件随机场作为训练、测试的模型,将多方面的特征进行综合建模,取得了较好的实验效果。实验结果表明,使用该方法可以将主题词识别的F值提高到83%左右。 展开更多
关键词 主题词表构建 主题词抽取 维基百科(Wikipedia) 条件随机场(CRF)
下载PDF
人工智能“为你写诗” 被引量:1
5
作者 吴甜 和为 《人工智能》 2018年第1期132-140,共9页
在人工智能给人们的生活带来便利的同时,其在艺术等领域的应用也获得了研究人员的关注。其中,现在的机器作诗工作几乎可以达到对非文学专业的普通群众'以假乱真'的水平。基于主题规划的写诗方法解决了机器写诗主题相关性弱的问... 在人工智能给人们的生活带来便利的同时,其在艺术等领域的应用也获得了研究人员的关注。其中,现在的机器作诗工作几乎可以达到对非文学专业的普通群众'以假乱真'的水平。基于主题规划的写诗方法解决了机器写诗主题相关性弱的问题,其基本思路是:通过对诗歌题目的解析,规划得到全诗每一句的主题词,并结合序列到序列生成机制,依次完成每一句诗歌的生成过程。 展开更多
关键词 主题词抽取 NMT 关注度 序列到序列 一句诗 古代诗人 人工智能 基于主题 TextRank 三句诗 五言诗 编码器 人工评价
下载PDF
基于局部密度的无监督作文跑题检测方法 被引量:1
6
作者 李霞 温启帆 《中文信息学报》 CSCD 北大核心 2017年第6期205-213,共9页
针对现有的无监督作文跑题检测方法中,使用作文内容向量表示作文存在非主题词噪声所导致的相似度不准确问题,该文提出一种基于作文主题词抽取和局部密度阈值选择的无监督作文跑题检测方法。首先使用LDA主题生成模型挖掘待测作文的主题词... 针对现有的无监督作文跑题检测方法中,使用作文内容向量表示作文存在非主题词噪声所导致的相似度不准确问题,该文提出一种基于作文主题词抽取和局部密度阈值选择的无监督作文跑题检测方法。首先使用LDA主题生成模型挖掘待测作文的主题词,并使用分布式表示向量寻找与题目词项语义相似的词,作为对作文题目的主题词扩展,在此基础上使用提出的切题度计算方法计算待测作文的切题度,并使用所提出的基于作文集切题度局部密度的阈值抽取方法动态选取切题阈值,进而实现一种无需训练集和主题无关的无监督作文跑题检测方法。在以英语为母语的学习者和以汉语为母语的学习者所写的8个作文集共9 381篇作文上的实验结果表明,该文提出的作文跑题检测方法能有效识别跑题作文,加入拼写检查预处理后,平均F1值为79.64%,单个作文题目下F1值最好为96.1%。 展开更多
关键词 作文跑题检测 主题词抽取 切题度 阈值选取
下载PDF
基于Hadoop云平台的文本复合主题词抽取
7
作者 王晓龙 张婉琳 《电脑编程技巧与维护》 2019年第2期92-93,99,共3页
在自然语言处理和文本挖掘领域,主题词提取是一个关键内容,在信息提取、生成抽象、文本分类和文本聚类中起着重要作用。将云计算技术应用于文本复合主题词提取,对于促进文本挖掘和自然语言处理的发展具有重要作用。在此基础上,结合云计... 在自然语言处理和文本挖掘领域,主题词提取是一个关键内容,在信息提取、生成抽象、文本分类和文本聚类中起着重要作用。将云计算技术应用于文本复合主题词提取,对于促进文本挖掘和自然语言处理的发展具有重要作用。在此基础上,结合云计算技术,分析设计了一种基于Hadoop平台的文本复合主题词提取系统,以不同方式对文本进行全面的主题词提取。 展开更多
关键词 主题词抽取 云计算 HADOOP平台
下载PDF
浅析英文自动摘要技术
8
作者 刘郑 杜祝平 《魅力中国》 2008年第28期63-64,共2页
自然语言处理是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。语言是人类区别其他动物的本质特性。在所有生物中,只有人类才具有语言能力。人类的多种智能都和... 自然语言处理是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。语言是人类区别其他动物的本质特性。在所有生物中,只有人类才具有语言能力。人类的多种智能都和语言有着密切的关系。人类的逻辑思维以语言为形式。 展开更多
关键词 主题词抽取 词频统计 文本结构分析 内容词 文件格式
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部