期刊文献+
共找到189篇文章
< 1 2 10 >
每页显示 20 50 100
基于语义分析的评价对象-情感词对抽取 被引量:61
1
作者 江腾蛟 万常选 +2 位作者 刘德喜 刘喜平 廖国琼 《计算机学报》 EI CSCD 北大核心 2017年第3期617-633,共17页
评价对象-情感词对是情感词及其所修饰评价对象的组合,评价对象-情感词对的识别是细粒度情感分析的一个原子任务和关键任务.现有的研究大多集中在商品评论上,随着金融大数据的涌现,金融评论的情感挖掘意义凸显.与商品评论不同,中文金融... 评价对象-情感词对是情感词及其所修饰评价对象的组合,评价对象-情感词对的识别是细粒度情感分析的一个原子任务和关键任务.现有的研究大多集中在商品评论上,随着金融大数据的涌现,金融评论的情感挖掘意义凸显.与商品评论不同,中文金融评论中评价对象数目繁多且构成形式复杂,虚指评价对象和隐式评价对象也更常见;情感词的词性更丰富,其在句中的句法成分也更灵活、语义更丰富.针对金融评论的这些特点,该文提出了基于浅层语义与语法分析相结合的评价对象-情感词对抽取方法.考虑到金融评论多动词情感词,设计了语义角色标注与依存句法分析相结合的评价对象-情感词对抽取规则,解决了评价对象构成的复杂性问题;基于语义和领域知识对虚指评价对象进行了判别和替换,以明确其实际的指向和含义;基于特殊情感词搭配表、上下文搭配表及频繁搭配表提出了隐式评价对象识别的新思路,能有效地识别出缺省和隐含评价对象.在大规模的中文金融评论上进行了详细的实验测试,实验结果表明了该方法的有效性. 展开更多
关键词 情感分析 中文金融评论 评价对象-情感词对 语义角色标注 依存句法分析
下载PDF
中文微博情感分析研究与实现 被引量:28
2
作者 李勇敢 周学广 +1 位作者 孙艳 张焕国 《软件学报》 EI CSCD 北大核心 2017年第12期3183-3205,共23页
中文微博的大数据、指数传播和跨媒体等特性,决定了依托人工方式监控和处理中文微博是不现实的,迫切需要依托计算机开展中文微博情感自动分析研究.该项研究可分为3个任务:中文微博观点句识别、情感倾向性分类和情感要素抽取.为完成上述... 中文微博的大数据、指数传播和跨媒体等特性,决定了依托人工方式监控和处理中文微博是不现实的,迫切需要依托计算机开展中文微博情感自动分析研究.该项研究可分为3个任务:中文微博观点句识别、情感倾向性分类和情感要素抽取.为完成上述任务,研制了一个评测系统:通过构建多级词库、制定成词规则、开展串频统计等给出一种基于规则和统计的新词识别方法,在情感词和评价对象的依存模式的基础上给出基于词语特征的观点句识别算法;以词序流表示文本的LDA-Collocation模型,采用吉布斯抽样法推导了算法,实现中文微博情感倾向性自动分类;针对中文微博情感要素抽取召回率较低的问题,利用依存关系分析理论,按主语类和宾语类把依存模式分为两类,建立了6个优先级的评价对象和情感词汇的依存模式,通过评价对象归并算法实现计算机自动抽取情感要素.实验包括两个部分:一是参加NLP&CC2012的公开评测,所提方法在微博观点句识别任务中的准确率为第2,在中文微博情感要素抽取任务中的准确率和F值均为第2,验证了该算法的实用性;二是在分析公开评测结果的基础上,分别比较了参加公开评测的各类算法在处理中文微博情感分析时的效率,给出了相关结论. 展开更多
关键词 中文微博 情感分析 依存分析 情感倾向性分类 情感要素抽取 无监督主题情感模型
下载PDF
基于依存分析的开放式中文实体关系抽取方法 被引量:27
3
作者 李明耀 杨静 《计算机工程》 CAS CSCD 北大核心 2016年第6期201-207,共7页
实体关系抽取是信息抽取的组成部分,其目标是确定实体之间是否存在某种语义关系。由于中文语法错综复杂、表达方式灵活、语义多样等固有性质的限制,导致在中文中以动词作为关系表述容易引起实体间的关系含糊不清。为此,利用依存分析,提... 实体关系抽取是信息抽取的组成部分,其目标是确定实体之间是否存在某种语义关系。由于中文语法错综复杂、表达方式灵活、语义多样等固有性质的限制,导致在中文中以动词作为关系表述容易引起实体间的关系含糊不清。为此,利用依存分析,提出一种开放式中文实体关系抽取方法。对输入的单句进行依存分析,通过依存分析输出的依存弧判断单句是否为动词谓语句,如果是动词谓语句则结合中文语法启发式规则抽取关系表述。根据距离确定论元位置,对三元组进行评估,输出符合条件的三元组。在Sogou CA和Sogou CS语料库上的实验结果表明,提出的方法适用于大规模语料库,具有较好的性能与可移植性。与基于卷积树核的无监督层次聚类方法相比,F值提高了16.68%。 展开更多
关键词 开放式信息抽取 中文实体关系抽取 依存分析 无监督 启发式规则
下载PDF
基于依存句法分析的电力设备缺陷文本信息精确辨识方法 被引量:26
4
作者 邵冠宇 王慧芳 +3 位作者 吴向宏 陆金龙 李建红 何奔腾 《电力系统自动化》 EI CSCD 北大核心 2020年第12期178-185,共8页
电力设备缺陷文本包含大量设备缺陷历史信息,从文本中精确辨识缺陷信息,可提供对于设备的故障率建模和健康状态评价问题的有效指导。引入依存句法分析技术,提出"左贪心"出栈规则和基于神经网络的依存关系状态转移分析模型,实... 电力设备缺陷文本包含大量设备缺陷历史信息,从文本中精确辨识缺陷信息,可提供对于设备的故障率建模和健康状态评价问题的有效指导。引入依存句法分析技术,提出"左贪心"出栈规则和基于神经网络的依存关系状态转移分析模型,实现了电力设备实际缺陷文本和缺陷分类标准文本的依存句法树构建,并结合缺陷文本特点提出了电力设备依存句法树的剪枝、切分和重构方法。同时,提出了基于依存关系的树匹配算法,实现实际缺陷和标准缺陷依存句法树的匹配。以主变压器缺陷文本为例,研究了基于依存句法分析的缺陷信息辨识方法的可行性和有效性。结果表明,所提方法相比于其他树匹配算法和语义相似度计算方法在效率和准确性上有明显提升。 展开更多
关键词 文本挖掘 电力设备 依存句法分析 依存句法树匹配 信息辨识
下载PDF
基于依存分析和错误驱动的中文时间表达式识别 被引量:21
5
作者 贺瑞芳 秦兵 +2 位作者 刘挺 潘越群 李生 《中文信息学报》 CSCD 北大核心 2007年第5期36-40,共5页
时间表达式识别是进行时间表达式归一化的基础,其识别结果的好坏直接影响归一化的效果。本文提出一种基于依存分析和错误驱动识别中文时间表达式的新方法。首先以时间触发词为切入点,据依存关系递归地识别时间表达式,大大地提高了识别效... 时间表达式识别是进行时间表达式归一化的基础,其识别结果的好坏直接影响归一化的效果。本文提出一种基于依存分析和错误驱动识别中文时间表达式的新方法。首先以时间触发词为切入点,据依存关系递归地识别时间表达式,大大地提高了识别效果;然后,采用错误驱动学习来进一步增强识别效果,根据错误识别结果和人工标注的差异自动地获取和改进规则,使系统的性能又提高了近3.5%。最终在封闭测试集和开放测试集上,F1值达到了76.38%和76.57%。 展开更多
关键词 计算机应用 中文信息处理 时间表达式识别 触发词 依存分析 错误驱动学习
下载PDF
基于语义分析的中文微博情感分类方法 被引量:23
6
作者 杨佳能 阳爱民 周咏梅 《山东大学学报(理学版)》 CAS CSCD 北大核心 2014年第11期14-21,30,共9页
通过分析微博的结构特点,提出了一种基于语义分析的中文微博情感分类方法。首先构建了表情符号情感词典和网络用语情感词典;然后结合词典资源对微博文本进行依存句法分析并且构建情感表达式树;最后根据制定的规则计算微博文本的情感强度... 通过分析微博的结构特点,提出了一种基于语义分析的中文微博情感分类方法。首先构建了表情符号情感词典和网络用语情感词典;然后结合词典资源对微博文本进行依存句法分析并且构建情感表达式树;最后根据制定的规则计算微博文本的情感强度,依据强度值判断微博的情感倾向类别。实验结果验证了该方法的有效性,也表明所构建的表情符号情感词典和网络用语情感词典能够有效增强情感分类器的性能。 展开更多
关键词 中文微博 情感分析 依存句法分析 表情符号 网络用语
原文传递
基于依存分析的事件识别 被引量:19
7
作者 付剑锋 刘宗田 +2 位作者 付雪峰 周文 仲兆满 《计算机科学》 CSCD 北大核心 2009年第11期217-219,共3页
事件抽取是信息抽取的重要组成部分,事件识别是事件抽取的基础,事件识别的效果直接影响了事件抽取的结果。基于机器学习的方法识别事件需要从词汇中发掘更多的特征。针对当前事件识别方法中存在的不足,提出了一种基于依存分析的事件识... 事件抽取是信息抽取的重要组成部分,事件识别是事件抽取的基础,事件识别的效果直接影响了事件抽取的结果。基于机器学习的方法识别事件需要从词汇中发掘更多的特征。针对当前事件识别方法中存在的不足,提出了一种基于依存分析的事件识别方法。用依存分析发掘触发词与其它词之间的句法关系,以此为特征在SVM分类器上对事件进行分类,最终实现事件识别。实验表明,基于依存分析的事件识别优于传统的事件识别方法,而融合多特征的事件识别F值可提高到69.3%。 展开更多
关键词 事件识别 依存分析 支持向量机
下载PDF
面向信息内容安全的文本过滤模型研究 被引量:18
8
作者 刘梅彦 黄改娟 《中文信息学报》 CSCD 北大核心 2017年第2期126-131,138,共7页
该文设计了一种面向信息内容安全的不良文本信息过滤模型。该模型采用主题信息过滤和倾向性过滤两级过滤模式,以语句为基本处理单元,采用依存句法获取语句的语义框架,结合基于知网的词汇褒贬倾向性判别,识别文本中的不良信息并予以过滤... 该文设计了一种面向信息内容安全的不良文本信息过滤模型。该模型采用主题信息过滤和倾向性过滤两级过滤模式,以语句为基本处理单元,采用依存句法获取语句的语义框架,结合基于知网的词汇褒贬倾向性判别,识别文本中的不良信息并予以过滤。实验表明,该模型能够较好地提高文本过滤效率和准确率。 展开更多
关键词 文本信息过滤 不良文本 语义分析 依存句法分析
下载PDF
一种基于句法分析的情感标签抽取方法 被引量:18
9
作者 李纲 刘广兴 +1 位作者 毛进 叶光辉 《图书情报工作》 CSSCI 北大核心 2014年第14期12-20,共9页
指出情感标签由评价对象和情感词组成,包含评论的关键要素,能清楚地表达评价者的观点意见。提出一种针对产品网络评论的情感标签抽取模型,利用依存句法分析设计情感标签抽取算法,通过情感极性计算对抽取出的情感标签进行过滤。通过放宽... 指出情感标签由评价对象和情感词组成,包含评论的关键要素,能清楚地表达评价者的观点意见。提出一种针对产品网络评论的情感标签抽取模型,利用依存句法分析设计情感标签抽取算法,通过情感极性计算对抽取出的情感标签进行过滤。通过放宽的抽取规则与情感极性过滤相结合,以提高情感标签的召回率,实现潜在评价对象的抽取。最后用网络抓取的产品评论语料作为测试数据集对模型进行测试,获得较高的抽取准确率和召回率,并对模型中存在的问题进行总结,作为模型改善的指导。 展开更多
关键词 情感标签 观点挖掘 依存句法分析 产品评论
原文传递
基于依存句法的跨语言细粒度情感分析 被引量:18
10
作者 唐晓波 刘一平 《情报理论与实践》 CSSCI 北大核心 2018年第6期124-129,共6页
[目的/意义]粗粒度的跨语言情感分析往往只考虑篇章段落中的情感分布信息,而忽略深层次的语义关系。为弥补这一缺陷,文章提出一种基于依存句法的跨语言细粒度情感分析算法。[方法/过程]首先对中文文本进行依存句法分析,从深层的语义关... [目的/意义]粗粒度的跨语言情感分析往往只考虑篇章段落中的情感分布信息,而忽略深层次的语义关系。为弥补这一缺陷,文章提出一种基于依存句法的跨语言细粒度情感分析算法。[方法/过程]首先对中文文本进行依存句法分析,从深层的语义关系入手,提出一系列识别规则,提取情感评价单元;然后利用机器翻译对情感评价单元进行语言转换;最后通过与英文情感词典的匹配分析,对情感评价单元的情感极性进行判定。[结果/结论]实验结果表明,与原有的情感评价单元提取方法相比,本文的方法在一定程度上提高了提取效率;同基础的单语言情感分析方法相较,借助英文情感词典所做的跨语言情感分类结果更为理想。 展开更多
关键词 依存句法分析 细粒度情感分析 情感词典 情感评价单元 情感分类
原文传递
中外情报学论文创新性特征硏究 被引量:17
11
作者 曹树金 闫欣阳 +1 位作者 张倩 卓伊玲 《图书情报工作》 CSSCI 北大核心 2020年第1期80-92,共13页
扩展到全文,充分利用句子结构和句法特征识别领域创新内容,探讨近年中外情报学论文在创新对象、主题、类别等方面的特征,并做对比分析,最后通过对自动分类的论文集合进行定性的内容分析,总结归纳出中外情报学论文创新的表达范式。[结果... 扩展到全文,充分利用句子结构和句法特征识别领域创新内容,探讨近年中外情报学论文在创新对象、主题、类别等方面的特征,并做对比分析,最后通过对自动分类的论文集合进行定性的内容分析,总结归纳出中外情报学论文创新的表达范式。[结果/结论]从创新的表达来看,中外情报学论文创新句的分布情况基本一致,英文期刊论文创新的表达更丰富。从创新性特征来看,英文情报学期刊论文创新主题较集中,而中文主题多样和分散;具体方法的创新是近年情报学领域的创新热点,而在研究方法上创新不足;中英文情报学期刊论文的创新性特点都反映了应用研究、实证研究的成果较多,而理论创新推动缓慢的趋势。 展开更多
关键词 创新性特征 学术论文 句法解析 句子分类
原文传递
基于词性标注和依存句法的Web金融信息情感计算 被引量:17
12
作者 万常选 江腾蛟 +1 位作者 钟敏娟 边海容 《计算机研究与发展》 EI CSCD 北大核心 2013年第12期2554-2569,共16页
基于词袋模型的文本情感倾向性分析没有考虑句子的句法结构对句子语义的理解,基于依存句法分析的方法试图解决这一问题.目前基于依存句法分析的方法对影响文本情感的依存关系的选择多根据人为观察,带有随意性.根据影响句子情感倾向性的... 基于词袋模型的文本情感倾向性分析没有考虑句子的句法结构对句子语义的理解,基于依存句法分析的方法试图解决这一问题.目前基于依存句法分析的方法对影响文本情感的依存关系的选择多根据人为观察,带有随意性.根据影响句子情感倾向性的原极性、修饰极性和动态极性,1)找出了影响句子情感倾向性的4种词性:形容词、动词、副词和名词;2)从词性和汉语句子成分理解的角度,逐一分析了24种依存关系对句子情感计算的影响,找出了可能影响句子情感倾向性的8种依存关系;3)根据这8种依存关系中可能的词性组合设计了6种情感计算规则,并提出了基于二叉树的情感计算策略,设计了情感计算二叉树的构建算法和基于情感计算二叉树的情感计算算法;4)在Web金融信息上进行了实验测试,实验结果表明了该方法的有效性. 展开更多
关键词 情感计算 情感倾向性分析 Web金融信息 词性标注 依存句法分析
下载PDF
面向食品安全事件新闻文本的实体关系抽取研究 被引量:16
13
作者 郑丽敏 齐珊珊 +1 位作者 田立军 杨璐 《农业机械学报》 EI CAS CSCD 北大核心 2020年第7期244-253,共10页
为解决从大规模网络文本中快速、准确识别食品安全事件并进行实体关系抽取受中文复杂语法特性限制的问题,提出一种基于依存分析的面向食品安全事件新闻文本的实体关系抽取方法FSE_ERE(Entity relation extraction of food safety events... 为解决从大规模网络文本中快速、准确识别食品安全事件并进行实体关系抽取受中文复杂语法特性限制的问题,提出一种基于依存分析的面向食品安全事件新闻文本的实体关系抽取方法FSE_ERE(Entity relation extraction of food safety events,FSE_ERE)。该方法结合句子的依存分析结果和实体关系抽取模型,对非结构化中文文本进行无监督的实体关系抽取,并引入一种将文本相似度结合到PU学习(Positive and unlabeled learning)的半监督分类方法,利用改进的特征加权处理方法提高分类精度,使得FSE_ERE方法能够在高质量的食品安全事件新闻文本中完成实体关系抽取工作。实验结果表明,FSE_ERE方法在食品安全事件新闻文本数据集和多类型混合新闻文本数据集上的实体关系抽取均达到了先进的性能,F值分别达到了71.21%和67.42%,证明了FSE_ERE方法的有效性和可移植性。 展开更多
关键词 食品安全事件 实体关系抽取 依存分析 PU学习 文本相似度
下载PDF
基于短语句法结构和依存句法分析的情感评价单元抽取 被引量:15
14
作者 王娟 曹树金 谢建国 《情报理论与实践》 CSSCI 北大核心 2017年第3期107-113,共7页
文章建立了一套不受领域约束、在各个领域中通用的情感评价单元抽取模式,实现自动且准确地抽取情感评价单元。首先,基于短语的内部结构和句法功能,深入地分析评价对象及其对应的评价短语在句中的句法位置;其次,结合情感句中词性和词对... 文章建立了一套不受领域约束、在各个领域中通用的情感评价单元抽取模式,实现自动且准确地抽取情感评价单元。首先,基于短语的内部结构和句法功能,深入地分析评价对象及其对应的评价短语在句中的句法位置;其次,结合情感句中词性和词对间的依存关系进行情感评价单元的抽取;最后,通过手工构建通用和领域情感词典进行情感评价单元抽取和情感倾向性计算的对比实验,进一步验证抽取模式的有效性。结合短语句法结构和依存句法进行情感评价单元抽取,准确地挖掘出评价对象及其对应的评价短语之间的句法关系。实验结果表明,在应用到后续情感倾向性计算的实验时,整体准确率得到大幅度提升。 展开更多
关键词 情感分析 依存句法分析 情感评价单元 短语 句法结构
原文传递
基于依存句法分析的微博主题挖掘模型研究 被引量:14
15
作者 唐晓波 肖璐 《情报科学》 CSSCI 北大核心 2015年第9期61-65,共5页
近年来,微博成为人们获取与发布信息的重要方式,每天有大量微博数据产生,对其进行热点主题挖掘意义重大。数据挖掘中的聚类分析是挖掘热点主题的重要方法,但由于篇幅限制,传统聚类效果有限。本文据此提出用依存句法分析来改进传统文本... 近年来,微博成为人们获取与发布信息的重要方式,每天有大量微博数据产生,对其进行热点主题挖掘意义重大。数据挖掘中的聚类分析是挖掘热点主题的重要方法,但由于篇幅限制,传统聚类效果有限。本文据此提出用依存句法分析来改进传统文本相似矩阵,以提高聚类准确性。首先采用传统文本处理方法构建文本相似矩阵;再利用依存句法分析句子的结构,获取微博信息的依存树,找到有效依存词对,并据此计算文本相似度,构建另一个相似矩阵。综合两个矩阵得到更准确的微博文本相似矩阵,在此基础上运行聚类算法,挖掘出热点主题。最后根据评论数和转发数挖掘出重要主题与重要微博,完成微博主题的深入分析。 展开更多
关键词 热点主题 依存句法分析 依存树
原文传递
基于图卷积神经网络和依存句法分析的网民负面情感分析研究 被引量:14
16
作者 范涛 王昊 吴鹏 《数据分析与知识发现》 CSSCI CSCD 北大核心 2021年第9期97-106,共10页
【目的】探索结合网络舆情文本的语义特征和依存结构信息进行网民负面情感分析研究。【方法】提出基于图卷积神经网络和依存句法分析的网民负面情感分析模型。模型结合双向长短期记忆网络和自注意力机制抽取文本特征作为依存句法图中的... 【目的】探索结合网络舆情文本的语义特征和依存结构信息进行网民负面情感分析研究。【方法】提出基于图卷积神经网络和依存句法分析的网民负面情感分析模型。模型结合双向长短期记忆网络和自注意力机制抽取文本特征作为依存句法图中的节点特征,应用图卷积神经网络对生成的节点特征和依存句法图对应的邻接矩阵进行训练学习,输出负面情感类别(愤怒、厌恶、恐惧和悲伤)。【结果】结合新冠疫情等网络舆情数据进行实证研究,并与相关基线模型作比较。实验结果表明,所提模型具有一定的优越性,在"恐惧"这一情感类别中,识别准确率达到93.535%。【局限】所提模型仅在网络舆情数据集中进行测试,未在公开数据集中进一步验证。【结论】依存句法结构信息的加入以及图卷积神经网络和注意力机制的应用能够有效提升模型的负面情感分析能力。 展开更多
关键词 网络舆情 负面情感 图卷积神经网络 自注意力机制 依存句法
原文传递
基于字符的中文分词、词性标注和依存句法分析联合模型 被引量:14
17
作者 郭振 张玉洁 +1 位作者 苏晨 徐金安 《中文信息学报》 CSCD 北大核心 2014年第6期1-8,17,共9页
目前,基于转移的中文分词、词性标注和依存句法分析联合模型存在两大问题:一是任务的融合方式有待改进;二是模型性能受限于全标注语料的规模。针对第一个问题,该文利用词语内部结构将基于词语的依存句法树扩展成了基于字符的依存句法树... 目前,基于转移的中文分词、词性标注和依存句法分析联合模型存在两大问题:一是任务的融合方式有待改进;二是模型性能受限于全标注语料的规模。针对第一个问题,该文利用词语内部结构将基于词语的依存句法树扩展成了基于字符的依存句法树,采用转移策略,实现了基于字符的中文分词、词性标注和依存句法分析联合模型;依据序列标注的中文分词方法,将基于转移的中文分词处理方案重新设计为4种转移动作:Shift_S、Shift_B、Shift_M和Shift_E,同时能够将以往中文分词的研究成果融入联合模型。针对第二个问题,该文使用具有部分标注信息的语料,从中抽取字符串层面的n-gram特征和结构层面的依存子树特征融入联合模型,实现了半监督的中文分词、词性标注和依存句法分析联合模型。在宾州中文树库上的实验结果表明,该文的模型在中文分词、词性标注和依存分析任务上的F1值分别达到了98.31%、94.84%和81.71%,较单任务模型的结果分别提升了0.92%、1.77%和3.95%。其中,中文分词和词性标注在目前公布的研究结果中取得了最好成绩。 展开更多
关键词 联合模型 中文分词和词性标注 依存句法分析 词语内部依存结构 半监督学习
下载PDF
基于HNC理论和依存句法的句子相似度计算 被引量:13
18
作者 吴佐衍 王宇 《计算机工程与应用》 CSCD 2014年第3期97-102,共6页
句子相似度计算是自然语言处理的重要研究内容。运用自然语言处理的概念层次网络(HNC)理论和依存句法理论提出一种句子相似度的计算方法。该方法认为句子的相似度是由词语的语义相似度和句法结构相似度共同决定的,利用HNC理论词汇层面... 句子相似度计算是自然语言处理的重要研究内容。运用自然语言处理的概念层次网络(HNC)理论和依存句法理论提出一种句子相似度的计算方法。该方法认为句子的相似度是由词语的语义相似度和句法结构相似度共同决定的,利用HNC理论词汇层面联想的概念表述体系来计算词语之间的相似度,利用依存句法理论来获取句子中词语的词语搭配和构成特征,与现有典型的句子相似度算法和人工判断进行了比较。实验结果表明,该方法能够较好地反应句子之间的语义差别,是一种可行有效的方法。 展开更多
关键词 概念层次网络 依存句法 句子相似度 自然语言处理
下载PDF
短语结构树库向依存结构树库转化研究 被引量:12
19
作者 李正华 车万翔 刘挺 《中文信息学报》 CSCD 北大核心 2008年第6期14-19,共6页
汉语依存树库的建设相对其他语言如英语,在规模和质量上还有一些差距。树库标注需要付出很大的人力物力,并且保证树库质量也比较困难。该文尝试通过规则和统计相结合的方法,将宾州汉语短语树库PennChinese Treebank转化为哈工大依存树库... 汉语依存树库的建设相对其他语言如英语,在规模和质量上还有一些差距。树库标注需要付出很大的人力物力,并且保证树库质量也比较困难。该文尝试通过规则和统计相结合的方法,将宾州汉语短语树库PennChinese Treebank转化为哈工大依存树库HIT-IR-CDT的体系结构,从而增大现有依存树库的规模。将转化后的树库加入HIT-IR-CDT,训练和测试依存句法分析器的性能。实验表明,加入少量经转化后的树库后,依存句法分析器的性能有所提高;但加入大量树库后,性能反而下降。经过细致分析,作为一种利用多种树库提高依存句法分析器性能的方法,短语转依存还存在很多需要深入研究的方面。 展开更多
关键词 计算机应用 中文信息处理 短语结构树库 依存结构树库 依存句法分析
下载PDF
基于依存句法分析的社会媒体文本挖掘方法——以饮食习惯特色分析为例 被引量:13
20
作者 任彬 车万翔 刘挺 《中文信息学报》 CSCD 北大核心 2014年第6期208-215,共8页
在进行社会媒体文本挖掘时,传统的基于词表的方法,存在准确率较低、词表难获得等问题。该文提出一种基于依存句法分析的文本挖掘方法,通过规则匹配的方式从社会媒体文本中提取信息。该方法不依赖词表,且实验证明了相比基于词表的方法在... 在进行社会媒体文本挖掘时,传统的基于词表的方法,存在准确率较低、词表难获得等问题。该文提出一种基于依存句法分析的文本挖掘方法,通过规则匹配的方式从社会媒体文本中提取信息。该方法不依赖词表,且实验证明了相比基于词表的方法在准确率上有大幅提高。应用基于依存句法分析的文本挖掘方法,我们在微博文本上进行了饮食习惯特色分析,实现了性别、地区、时间等维度的饮食习惯特色分析并可进行交叉分析,最终用词云的方式展示了结果。 展开更多
关键词 依存句法分析 文本挖掘 社会媒体 饮食习惯特色分析
下载PDF
上一页 1 2 10 下一页 到第
使用帮助 返回顶部