期刊文献+
共找到63篇文章
< 1 2 4 >
每页显示 20 50 100
融合多特征的藏文新闻热点事件检测研究 被引量:1
1
作者 孔春伟 吕学强 +1 位作者 张乐 赵海兴 《中文信息学报》 CSCD 北大核心 2023年第2期53-61,共9页
针对藏文舆情分析需求,该文以藏文新闻文本数据为研究对象,提出一种融合多特征的藏文新闻热点事件检测方法。首先研究藏文新闻热点事件产生的特点,分析热词的词频、词频增长率、网站影响力特征,提出热度度量方法,通过热度过滤获取热词... 针对藏文舆情分析需求,该文以藏文新闻文本数据为研究对象,提出一种融合多特征的藏文新闻热点事件检测方法。首先研究藏文新闻热点事件产生的特点,分析热词的词频、词频增长率、网站影响力特征,提出热度度量方法,通过热度过滤获取热词集。其次分析事件词对分布特点,建立词对生成模型和词对语义引力模型,通过热度筛选获取词对集。最后采用凝聚式层次聚类方法,聚类混合表示的热词和词对,实现藏文新闻热点事件检测。测试结果表明,该方法最优F值达到0.6000,优于对比方法,可以较有效地检测热点事件,具有一定的应用价值。 展开更多
关键词 事件检测 语义引力 层次聚类
下载PDF
情绪与词对性质对学习判断影响的实证研究 被引量:2
2
作者 陈珏 江雷 《教学研究》 2012年第4期1-3,123,共3页
元记忆监测在教育中的作用受到众多研究者的关注,学习判断是元记忆监测的一种重要形式。通过对大学生进行学习判断实验,探讨不同的情绪状态和词对性质对大学生学习判断的影响。结果表明:学习情绪在学习判断上的主效应显著,在回忆成绩上... 元记忆监测在教育中的作用受到众多研究者的关注,学习判断是元记忆监测的一种重要形式。通过对大学生进行学习判断实验,探讨不同的情绪状态和词对性质对大学生学习判断的影响。结果表明:学习情绪在学习判断上的主效应显著,在回忆成绩上的主效应不显著;词对性质在学习判断上主效应显著,同时在回忆成绩上的主效应也显著;在学习判断、回忆成绩上,学习情绪和词对性质的交互作用均不显著。 展开更多
关键词 情绪 大学生 学习判断 JOL
下载PDF
基于词对建模的句子对齐研究
3
作者 丁颖 李军辉 周国栋 《计算机工程》 CAS CSCD 北大核心 2019年第6期211-217,共7页
句子对齐是将源文本中的句子映射到目标文本中对应翻译的过程。在神经网络的框架下,基于相互对齐的源端和目标端句子中包含大量相互对齐的单词,提出一种句子对齐方法。使用门关联网络捕获源端句子和目标端句子词对之间的语义关系,并通... 句子对齐是将源文本中的句子映射到目标文本中对应翻译的过程。在神经网络的框架下,基于相互对齐的源端和目标端句子中包含大量相互对齐的单词,提出一种句子对齐方法。使用门关联网络捕获源端句子和目标端句子词对之间的语义关系,并通过语义关系来确定源端句子和目标端句子是否对齐。对非单调文本进行对齐评估,结果表明,该方法F1值达到93.8%,有效提高了句子对齐的准确率。 展开更多
关键词 句子 双向循环神经网络 门关联网络 语义关系
下载PDF
-ing和-ed情感形容词对的用法新解
4
作者 张阳 田慧芳 《陕西教育(高教版)》 2012年第9期52-52,47,共2页
-ing和-ed情感形容词对由表达情感的及物动词转化而来。-ing描述情感的根源或原因;-ed描述情感的体验者。-ed形容词做表语、定语时施事和被修饰的名词分别是该情感的体验者。-ing形容词做表语、定语时施事、被修饰的名词是情感的根源或... -ing和-ed情感形容词对由表达情感的及物动词转化而来。-ing描述情感的根源或原因;-ed描述情感的体验者。-ed形容词做表语、定语时施事和被修饰的名词分别是该情感的体验者。-ing形容词做表语、定语时施事、被修饰的名词是情感的根源或原因。纠正了中学语法的过度归纳:-ed与人有关,修饰人;-ing与事有关,修饰物。interesting/interested teacher,boring/bored teacher在语法语义上都是可接受的。 展开更多
关键词 -ing形容 -ed形容 情感形容 情感根源 体验者
下载PDF
一种短文本主题特征的改进方法
5
作者 郑诚 代宁 《工业控制计算机》 2015年第8期110-112,共3页
主题模型被用来进行文本主题挖掘已经被证明是一个非常有效的手段,随着即时通讯的发展,挖掘短文本的主题特征也变得越来越重要。由于短文本的稀疏性,把传统的主题模型(如LDA)直接用在短文本上,生成的主题特征效果并不好。在研究LDA主题... 主题模型被用来进行文本主题挖掘已经被证明是一个非常有效的手段,随着即时通讯的发展,挖掘短文本的主题特征也变得越来越重要。由于短文本的稀疏性,把传统的主题模型(如LDA)直接用在短文本上,生成的主题特征效果并不好。在研究LDA主题模型的基础上,提出一种改进的短文本主题特征提取方法。在此方法中,通过对每篇短文本获取"词对"共现的方式来对文本建模,代替传统的"词"共现的方式,这种方式一定程度上能缓解数据稀疏的问题,提高了主题特征的效果。在真实数据集上的实验表明,方法相比于传统主题模型,在短文本特征提取方面有较好的提升。 展开更多
关键词 数据挖掘 短文本 LDA 主题模型
下载PDF
基于语义分析的评价对象-情感词对抽取 被引量:61
6
作者 江腾蛟 万常选 +2 位作者 刘德喜 刘喜平 廖国琼 《计算机学报》 EI CSCD 北大核心 2017年第3期617-633,共17页
评价对象-情感词对是情感词及其所修饰评价对象的组合,评价对象-情感词对的识别是细粒度情感分析的一个原子任务和关键任务.现有的研究大多集中在商品评论上,随着金融大数据的涌现,金融评论的情感挖掘意义凸显.与商品评论不同,中文金融... 评价对象-情感词对是情感词及其所修饰评价对象的组合,评价对象-情感词对的识别是细粒度情感分析的一个原子任务和关键任务.现有的研究大多集中在商品评论上,随着金融大数据的涌现,金融评论的情感挖掘意义凸显.与商品评论不同,中文金融评论中评价对象数目繁多且构成形式复杂,虚指评价对象和隐式评价对象也更常见;情感词的词性更丰富,其在句中的句法成分也更灵活、语义更丰富.针对金融评论的这些特点,该文提出了基于浅层语义与语法分析相结合的评价对象-情感词对抽取方法.考虑到金融评论多动词情感词,设计了语义角色标注与依存句法分析相结合的评价对象-情感词对抽取规则,解决了评价对象构成的复杂性问题;基于语义和领域知识对虚指评价对象进行了判别和替换,以明确其实际的指向和含义;基于特殊情感词搭配表、上下文搭配表及频繁搭配表提出了隐式评价对象识别的新思路,能有效地识别出缺省和隐含评价对象.在大规模的中文金融评论上进行了详细的实验测试,实验结果表明了该方法的有效性. 展开更多
关键词 情感分析 中文金融评论 评价象-情感 语义角色标注 依存句法分析
下载PDF
基于BTM的微博舆情热点发现 被引量:27
7
作者 王亚民 胡悦 《情报杂志》 CSSCI 北大核心 2016年第11期119-124,140,共7页
[目的/意义]作为一种新兴的社交新闻媒体,近年来,微博在许多热点事件的发布和传播中发挥了重要作用。但由于其文本的特殊性,传统方法不能有效地对其进行建模发现热点话题。因此,如何高效、准确地从微博数据中发现并提取有意义的热点信... [目的/意义]作为一种新兴的社交新闻媒体,近年来,微博在许多热点事件的发布和传播中发挥了重要作用。但由于其文本的特殊性,传统方法不能有效地对其进行建模发现热点话题。因此,如何高效、准确地从微博数据中发现并提取有意义的热点信息是一个很有价值的研究课题。[方法/过程]提出一种基于BTM模型的微博舆情热点发现方法。首先,对微博文本采用BTM建模,改进TF-IDF权重计算算法,以适应微博短文本的特征。并将BTM建模结果与改进的TF-IDF权重算法结合对微博文本进行特征提取及相似性度量,然后采用K-means聚类方法发现热点话题。[结果/结论]通过对新浪微博数据集的对比实验及结果分析验证了本方法的有效性。本方法能够有效解决传统模型在文本建模中所面临的高维度和稀疏性问题,显著改善热点话题的发现质量。 展开更多
关键词 主题模型 短文本 微博舆情 相似性度量
下载PDF
一种改进的基于《知网》的词语相似度计算方法 被引量:26
8
作者 林丽 薛方 任仲晟 《计算机应用》 CSCD 北大核心 2009年第1期217-220,共4页
《知网》是一部比较详尽的中文语义知识词典,共用1618个义原描述词语,故相关的词语用《知网》的概念描述时,有相同的义原。通过这一规律,与当前的词语相似度计算方法结合,提出改进的方法计算相关词对的相似度。并引入弱义原的概念,排除... 《知网》是一部比较详尽的中文语义知识词典,共用1618个义原描述词语,故相关的词语用《知网》的概念描述时,有相同的义原。通过这一规律,与当前的词语相似度计算方法结合,提出改进的方法计算相关词对的相似度。并引入弱义原的概念,排除弱义原对词语相似度计算的干扰。实验证明:该改进方法更符合人的直观,更适用于文本挖掘。 展开更多
关键词 《知网》 语相似度 相关 弱义原
下载PDF
基于共现关键词统计的图书馆学情报学学科研究趋势分析 被引量:23
9
作者 蒋永新 詹华清 《图书情报工作》 CSSCI 北大核心 2008年第9期28-31,共4页
以17种图书馆学情报学核心期刊中40634篇文献的142303个关键词为调研对象,运用词对关键词、相对词频统计和理论词对关键词矩阵方法,分析近10年来我国图书馆学情报学核心研究的热点论题分布及其变化趋势,据此给出图书馆学情报学研究的核... 以17种图书馆学情报学核心期刊中40634篇文献的142303个关键词为调研对象,运用词对关键词、相对词频统计和理论词对关键词矩阵方法,分析近10年来我国图书馆学情报学核心研究的热点论题分布及其变化趋势,据此给出图书馆学情报学研究的核心课题、高频词对关键词时间变化特征以及尚处于研究空白的一些论题。 展开更多
关键词 关键 图书馆学情报学 趋势分析
原文传递
基于自然语言词对法的文献主题新颖性探测研究 被引量:21
10
作者 许丹 徐爽 +3 位作者 陈斯斯 韩爽 杨颖 郭继军 《图书情报工作》 CSSCI 北大核心 2018年第8期130-138,共9页
[目的/意义]提出一个全新的量化指标——文档主题新颖度,通过自然语言词对方法对文献主题内容的新颖性进行探测研究,并探讨其可行性和优缺点以及新颖度与F1000推荐文献和引文指标之间的关系。[方法/过程]以F1000为基础,选取hematol... [目的/意义]提出一个全新的量化指标——文档主题新颖度,通过自然语言词对方法对文献主题内容的新颖性进行探测研究,并探讨其可行性和优缺点以及新颖度与F1000推荐文献和引文指标之间的关系。[方法/过程]以F1000为基础,选取hematology主题近一个月内推荐的文献,在Pubmed中查找并获取该推荐文献发表之前6个月内密切相关的文献,构成整个文献集。定义自然语言法新颖度的概念、计算公式并利用Oracle数据库PL/SQL语言进行编程,通过MetaMap软件提取自然语言词汇进行文献主题新颖度的运算。[结果/结论]自然语言法在文献主题新颖性探测的运算上具有一定的可行性;文档主题新颖度与F1000推荐文献、引用情况并非成等价关系,分属于科技论文评价的不同维度、不同范畴,不可一概而论。应将文档主题新颖度这一新指标与同行评议情况和文献计量学等其他相关论文评价指标结合起来对文献进行综合评价分析,选取优质文献给予推荐。 展开更多
关键词 文献主题新颖性探测 自然语言 MetaMap F1000 引文指标
原文传递
在线产品评论用户满意度综合评价研究 被引量:17
11
作者 吕品 钟珞 唐琨皓 《电子学报》 EI CAS CSCD 北大核心 2014年第4期740-746,共7页
文中提出一种基于灰色理论的用户满意度评价方法。基本思想:根据对各种类型的产品和对象(如旅社、酒店等)的评价具有相对性、不确定性和模糊性(这三种特性统称为灰色性)的特征,将用户满意度分为很满意,满意,一般,不满意和很不满意等五... 文中提出一种基于灰色理论的用户满意度评价方法。基本思想:根据对各种类型的产品和对象(如旅社、酒店等)的评价具有相对性、不确定性和模糊性(这三种特性统称为灰色性)的特征,将用户满意度分为很满意,满意,一般,不满意和很不满意等五种类型,克服了已有方法将情感分为满意和不满意的粗粒度定性评价缺陷。构建了用户满意度灰色评估模型,为了扩大对各类型产品评价的适应性,引用了相似性情感词匹配词对和对象对应产品的对应性热点词匹配词对来构建用户对产品和对象的满意度评测指标。以实际产品为实验数据对象,仿真结果表明:提出的方法不仅能获得产品或对象的总体满意度结论值VB,还能得到各项评测指标(影响产品或对象的因素)的量化评估结论值VBi,有效解决了定性评价方法的不足,为消费者提供了更详细的消费指导,为商业机构提供了有针对性的生产销售措施。 展开更多
关键词 在线产品评论 满意度评价 灰色理论 观点挖掘 相似性情感匹配 应性热点匹配
下载PDF
语义关系相似度计算中的数据标准化方法比较 被引量:16
12
作者 王正鹏 谢志鹏 邱培超 《计算机工程》 CAS CSCD 2012年第10期38-40,共3页
研究数据标准化处理对语义关系相似度计算的影响。从大规模文本语料中提取词法模式,生成词对-词法模式矩阵,利用3种数据标准化方式对矩阵数据进行处理,通过规律学习方法对隐含语义关系相似度进行计算。实验结果表明,不做数据标准化、z-s... 研究数据标准化处理对语义关系相似度计算的影响。从大规模文本语料中提取词法模式,生成词对-词法模式矩阵,利用3种数据标准化方式对矩阵数据进行处理,通过规律学习方法对隐含语义关系相似度进行计算。实验结果表明,不做数据标准化、z-score标准化、范围标准化、熵加权标准化处理的分类准确率分别为0.87、0.89、0.95、0.96。 展开更多
关键词 语义关系 相似度 法模式 -法模式矩阵 数据标准化 WEB数据挖掘
下载PDF
基于锚点词对的双语词对齐算法 被引量:10
13
作者 张孝飞 陈肇雄 +1 位作者 黄河燕 王建德 《小型微型计算机系统》 CSCD 北大核心 2006年第2期330-334,共5页
双语词对齐是指在源、译文中找到词汇级的对译关系,是自然语言处理领域一个非常有用而又比较困难的研究课题,其中涉及词法、语法、语义以及英汉语言间的固有差异和翻译习惯等诸多问题.文章在词法分析的基础上,利用有限的语言资源(主要... 双语词对齐是指在源、译文中找到词汇级的对译关系,是自然语言处理领域一个非常有用而又比较困难的研究课题,其中涉及词法、语法、语义以及英汉语言间的固有差异和翻译习惯等诸多问题.文章在词法分析的基础上,利用有限的语言资源(主要只使用了一部双语词典),采取多级匹配和消歧策略,将词对齐问题转化为迭代求解锚点词对的过程,使得词对齐既有较高的准确率又有较高的召回率.经过对真实语料的测试,词对齐准确率达93.0%,召回率达77.3%,F值达84.2%,基本上满足了有关应用的实际要求. 展开更多
关键词 自然语言处理 双语 语料 锚点
下载PDF
基于共现关键词统计的教育技术学研究趋势分析 被引量:11
14
作者 孙立会 赵蔚 《现代远程教育研究》 CSSCI 2010年第5期28-31,70,共5页
2004-2008年度《CNKI中国优秀硕士学位论文全文数据库》收录了2178篇教育技术学硕士学位论文,针对这些论文中的3853个关键词,运用词对关键词、相对词频统计和理论词对关键词矩阵方法等进行统计分析发现:近5年我国教育技术学研究热点是:... 2004-2008年度《CNKI中国优秀硕士学位论文全文数据库》收录了2178篇教育技术学硕士学位论文,针对这些论文中的3853个关键词,运用词对关键词、相对词频统计和理论词对关键词矩阵方法等进行统计分析发现:近5年我国教育技术学研究热点是:信息技术、教学设计、网络课程、教育技术学基本理论等。总体来说,教育技术学的研究领域尚未形成某一方面的研究群体,研究的深度还不够;还有一些研究空白,需要研究者关注。 展开更多
关键词 教育技术学 关键 统计分析 学科发展
下载PDF
基于词对依存分类的藏语树库半自动构建研究 被引量:8
15
作者 华却才让 姜文斌 +1 位作者 赵海兴 刘群 《中文信息学报》 CSCD 北大核心 2013年第5期166-172,共7页
依据依存句法理论,该文制订了藏语句法标注体系及层次结构。通过分析构建藏语依存树库中存在的问题,提出了半自动依存树库构建模式,针对藏语特性提出了融合丰富特征的词对依存分类模型和依存边标注模型,实现了依存树库构建可视化工具,... 依据依存句法理论,该文制订了藏语句法标注体系及层次结构。通过分析构建藏语依存树库中存在的问题,提出了半自动依存树库构建模式,针对藏语特性提出了融合丰富特征的词对依存分类模型和依存边标注模型,实现了依存树库构建可视化工具,校对构建了1.1万句藏语依存句法树后,在基线系统下经实验验证,依存识别正确率提高了3%,使构建藏语依存树库工作取得了有效进展。 展开更多
关键词 藏语依存句法 依存分类 藏语树库 藏语依存标注工具
下载PDF
面向短文本分析的分布式表示模型 被引量:7
16
作者 梁吉业 乔洁 +1 位作者 曹付元 刘晓琳 《计算机研究与发展》 EI CSCD 北大核心 2018年第8期1631-1640,共10页
短文本的分布式表示已经成为文本数据挖掘的一项重要任务.然而,直接应用分布式表示模型Paragraph Vector尚有不足,其根本原因是其在训练过程中并没有利用到语料库级别的信息,从而不能有效改善短文本中语境信息不足的情况.鉴于此,提出了... 短文本的分布式表示已经成为文本数据挖掘的一项重要任务.然而,直接应用分布式表示模型Paragraph Vector尚有不足,其根本原因是其在训练过程中并没有利用到语料库级别的信息,从而不能有效改善短文本中语境信息不足的情况.鉴于此,提出了一种面向短文本分析的分布式表示模型——词对主题句向量模型(biterm topic paragraph vector,BTPV),该模型通过将词对主题模型(biterm topic model,BTM)得出的主题信息融入Paragraph Vector中,不仅使得模型训练过程中利用到了全局语料库的信息,而且还利用BTM显性的主题表示完善了Paragraph Vector隐性的空间向量.实验采用爬取到的热门新闻评论作为数据集,并选用K-Means聚类算法对各模型的短文本表示效果进行比较.实验结果表明,基于BTPV模型的分布式表示较常见的分布式向量化模型word2vec和Paragraph Vector来说能取得更好的短文本聚类效果,从而显现出该模型面向短文本分析的优势. 展开更多
关键词 分布式表示 短文本 文本分析 句向量 主题模型
下载PDF
基于旋转注意力的命名实体识别模型
17
作者 来小孟 魏嘉银 《电脑与电信》 2024年第1期21-25,共5页
针对命名实体识别中实体词对关系建模分类性能不高的问题,提出一种基于旋转注意力的命名实体识别方法,该方法首先用BERT模型和Bi-LSTM进行编码,然后用卷积神经网络对输入的文本进行特征提取,接着将提取的特征序列输入旋转注意力模型中... 针对命名实体识别中实体词对关系建模分类性能不高的问题,提出一种基于旋转注意力的命名实体识别方法,该方法首先用BERT模型和Bi-LSTM进行编码,然后用卷积神经网络对输入的文本进行特征提取,接着将提取的特征序列输入旋转注意力模型中计算输出概率,最后使用MLP层对输出进行分类。实验结果表明,本文提出的方法在CADEC、GENIA和CoNLL2003等标准英文数据集上均取得了较好的性能,验证其在命名实体识别任务中的有效性和可行性。 展开更多
关键词 命名实体识别 旋转注意力 关系 分类
下载PDF
基于特征融合的K-means微博话题发现模型 被引量:6
18
作者 李海磊 杨文忠 +2 位作者 李东昊 温杰彬 钱芸芸 《电子技术应用》 2020年第4期24-28,33,共6页
针对传统话题检测方法在微博短文本上存在高维稀疏的缺陷,提出了一种基于特征融合的K-means微博话题发现模型。为了更好地表达微博话题的语义信息,使用在句子中共现的词对向量模型(Biterm_VSM)代替传统的向量空间模型(Vector Space Mode... 针对传统话题检测方法在微博短文本上存在高维稀疏的缺陷,提出了一种基于特征融合的K-means微博话题发现模型。为了更好地表达微博话题的语义信息,使用在句子中共现的词对向量模型(Biterm_VSM)代替传统的向量空间模型(Vector Space Model,VSM),并结合主题模型(Latent Dirichlet Allocation,LDA)挖掘出微博短文本中的潜在语义,把两个模型得到的特征进行特征融合,并应用K-means聚类算法进行话题的发现。实验结果表明,与传统的话题检测方法相比,该模型的调整兰德系数(Adjusted Rand index,ARI)为0.80,比传统的话题检测方法提高了3%~6%。 展开更多
关键词 话题检测 向量模型 LDA 特征融合 K-MEANS
下载PDF
融合多窗口特征的词对标记情感三元组抽取
19
作者 林杰 刘建华 +2 位作者 陈林颖 郑智雄 孙水华 《计算机工程与应用》 CSCD 北大核心 2024年第16期159-167,共9页
方面情感三元组抽取旨在从句子中抽取方面词、意见词和对应的情感极性。针对目前研究未充分挖掘局部上下文语义信息,缺乏对局部范围内的方面意见词对关联学习,以及遭受错误传播等问题,提出一种融合多窗口特征的词对标记情感三元组抽取... 方面情感三元组抽取旨在从句子中抽取方面词、意见词和对应的情感极性。针对目前研究未充分挖掘局部上下文语义信息,缺乏对局部范围内的方面意见词对关联学习,以及遭受错误传播等问题,提出一种融合多窗口特征的词对标记情感三元组抽取模型。该模型利用BERT对句子信息进行处理,获取句子编码特征,采用多窗口特征学习机制学习局部范围内的情感特征关联,并挖掘句子包含的潜在语义信息,使用多头注意力图转换模块将所学习到的特征聚合成标记分布概率,利用改进的词对标记方案标记句子并解码得到三元组。在SemEval-ASTE的四个基准数据集上进行实验分析,相比GTS-BERT模型,所提模型在三元组抽取任务上F1分值分别提高了2.33、6.57、2.97、4.84个百分点。实验结果表明,所提模型可以有效学习局部语义信息,准确标记方面意见跨度,较为精确地提取情感三元组。 展开更多
关键词 方面情感三元组 情感极性 特征学习 多头注意力 标记方案
下载PDF
双重共现潜在语义向量空间模型研究
20
作者 王世昌 陈瑾 《中文科技期刊数据库(文摘版)图书情报》 2024年第5期0163-0168,共6页
文本的向量表示对文本聚类研究具有重要意义。共现潜在语义向量空间模型(CLSVSM)通过挖掘共现词对的语义关联性,进一步提升了聚类精度。方法 为补充不共现词对的语义关联性,提出在特征词的基础上引入特征项,形成“文献-摘要-关键词”关... 文本的向量表示对文本聚类研究具有重要意义。共现潜在语义向量空间模型(CLSVSM)通过挖掘共现词对的语义关联性,进一步提升了聚类精度。方法 为补充不共现词对的语义关联性,提出在特征词的基础上引入特征项,形成“文献-摘要-关键词”关系链。首先基于两层潜在语义关系构建双重共现潜在语义向量空间模型(D-CLSVSM)。然后通过改进的词频G指数方法提取高频特征词,对模型矩阵进行压缩。局限:研究对象较为单一,仅研究了中文数据。结果/结论 D-CLSVSM增加了对共现词对及不共现词对的双重语义信息的补充,文本表示更充分,聚类结果更好。 展开更多
关键词 文本聚类 文本表示 不共现 D-CLSVSM
下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部