期刊文献+
共找到38篇文章
< 1 2 >
每页显示 20 50 100
基于语义信息的核心技术主题识别与演化趋势分析方法研究 被引量:23
1
作者 马铭 王超 +3 位作者 周勇 许海云 胡正银 熊广华 《情报理论与实践》 CSSCI 北大核心 2021年第9期106-113,共8页
[目的/意义]将自然语言处理、深层语义信息与技术主题分析相结合进行研究与探索,有助于科学家识别领域重点,把握科技发展机遇。[方法/过程]通过提取科技论文和专利文本数据的SAO结构,提出核心技术主题识别与发展阶段分析方法,构建SAO语... [目的/意义]将自然语言处理、深层语义信息与技术主题分析相结合进行研究与探索,有助于科学家识别领域重点,把握科技发展机遇。[方法/过程]通过提取科技论文和专利文本数据的SAO结构,提出核心技术主题识别与发展阶段分析方法,构建SAO语义信息网络,采用点度、中介中心度和特征向量中心度等社会网络分析指标分析核心技术主题演化趋势。[结果/结论]将该方法应用于造血干细胞领域,以2000—2018年为研究区间,验证了方法的科学性和有效性,预测肿瘤疾病治疗将是该领域未来的演化趋势,且发现该领域中存在流行性偏见的发展特点。 展开更多
关键词 科技论文 专利文本数据 自然语言处理 深层语义信息 核心主题识别 演化趋势分析
原文传递
计算文本相似度的方法体系与应用分析 被引量:16
2
作者 黄文彬 车尚锟 《情报理论与实践》 CSSCI 北大核心 2019年第11期128-134,共7页
[目的/意义]文本间的相似度是信息检索、文档检测和文本挖掘等任务核心参考的指标之一。梳理现有计算文本相似度的方法、分类体系及应用,有助于研究人员选择合适的计算方法提高特定场景应用的性能。[方法/过程]文章将算法利用文本语义... [目的/意义]文本间的相似度是信息检索、文档检测和文本挖掘等任务核心参考的指标之一。梳理现有计算文本相似度的方法、分类体系及应用,有助于研究人员选择合适的计算方法提高特定场景应用的性能。[方法/过程]文章将算法利用文本语义信息的程度、基础语义信息类型、模型类型以及关联关系类型作为划分依据构建方法体系,并从原理和应用上梳理算法间的异同。[结果/结论]将文本相似度计算方法分为无语义信息、基于浅层语义信息、基于深层语义信息三个大类,对参考的语义信息、算法的基本原理和该类的典型应用做了探索分析。[创新/价值]使文本相似度计算方法具有更清晰和完整的体系,使研究人员能更好地区分相似度计算方法间的计算需求与应用场景的差异。 展开更多
关键词 文本挖掘 文本相似度 分类体系 语义信息 应用
原文传递
多重检验加权融合的短文本相似度计算方法 被引量:12
3
作者 石彩霞 李书琴 刘斌 《计算机工程》 CAS CSCD 北大核心 2021年第2期95-102,共8页
传统相似度计算方法仅考虑文本结构特征或语义信息,从而导致准确率较低。结合短文本特征稀疏的特性,提出一种多重检验加权融合的短文本相似度计算方法 MCWFS。使用基于改进编辑距离、考虑词频、基于Word2vec与LSTM的3种方法分别计算相似... 传统相似度计算方法仅考虑文本结构特征或语义信息,从而导致准确率较低。结合短文本特征稀疏的特性,提出一种多重检验加权融合的短文本相似度计算方法 MCWFS。使用基于改进编辑距离、考虑词频、基于Word2vec与LSTM的3种方法分别计算相似度,对满足多重检验标准的文本进行加权因子线性融合,以避免因一种相似度值过大或过小导致加权相似度值异常的问题。在此基础上,通过加权融合计算短文本相似度,使得计算结果更加准确合理。实验结果表明,相比层层检验和无检验融合方法,MCWFS方法的平均准确率分别提高16.01%和7.39%,且其F1值可达70.21%。 展开更多
关键词 短文本相似度 多重检验加权融合 编辑距离 语义信息 词频
下载PDF
基于增强特征金字塔网络的场景文本检测算法 被引量:11
4
作者 邵海琳 季怡 +1 位作者 刘纯平 徐云龙 《计算机科学》 CSCD 北大核心 2022年第2期248-255,共8页
场景文本检测有助于机器理解图像内容,在智能交通、场景理解和智能导航等领域应用广泛。现有的场景文本检测算法未充分利用高层语义信息和空间信息,限制了模型对复杂背景像素的分类能力和对不同尺度的文本实例的检测和定位能力。为解决... 场景文本检测有助于机器理解图像内容,在智能交通、场景理解和智能导航等领域应用广泛。现有的场景文本检测算法未充分利用高层语义信息和空间信息,限制了模型对复杂背景像素的分类能力和对不同尺度的文本实例的检测和定位能力。为解决上述问题,提出了一种基于增强特征金字塔网络的场景文本检测算法。该算法包括比率不变特征增强(Ratio Invariant Feature Enhanced,RIFE)模块和重建空间分辨率(Rebuild Spatial Resolution,RSR)模块。RIFE模块作为残差分支,增强了网络的高层语义信息传递,提高了分类能力,降低了误报率和漏捡率。RSR模块重建多层特征分辨率,利用丰富的空间信息改进边界位置。实验结果表明,所提算法提升了在多方向文本数据集ICDAR2015、弯曲文本数据集Totaltext以及长文本数据集MSRA-TD500上的检测能力。 展开更多
关键词 场景文本检测 特征金字塔网络 语义信息 空间信息 边界位置
下载PDF
基于词向量的微博事件追踪方法 被引量:11
5
作者 张佳明 席耀一 +2 位作者 王波 唐浩浩 李天彩 《计算机工程与应用》 CSCD 北大核心 2016年第17期73-78,117,共7页
微博文本长度短,且网络新词层出不穷,使得传统方法在微博事件追踪中效果不够理想。针对该问题,提出一种基于词向量的微博事件追踪方法。词向量不仅可以计算词语之间的语义相似度,而且能够提高微博间语义相似度计算的准确率。该方法首先... 微博文本长度短,且网络新词层出不穷,使得传统方法在微博事件追踪中效果不够理想。针对该问题,提出一种基于词向量的微博事件追踪方法。词向量不仅可以计算词语之间的语义相似度,而且能够提高微博间语义相似度计算的准确率。该方法首先使用Skip-gram模型在大规模数据集上训练得到词向量;然后通过提取关键词建立初始事件和微博表示模型;最后利用词向量计算微博和初始事件之间的语义相似度,并依据设定阈值进行判决,完成事件追踪。实验结果表明,相比传统方法,该方法能够充分利用词向量引入的语义信息,有效提高微博事件追踪的性能。 展开更多
关键词 微博 事件追踪 短文本 Skip-gram模型 词向量 语义信息
下载PDF
一种结合上下文语义的短文本聚类算法 被引量:11
6
作者 张群 王红军 王伦文 《计算机科学》 CSCD 北大核心 2016年第S2期443-446,450,共5页
短文本因具有特征信息不足且高维稀疏等特点,使得传统文本聚类算法应用于短文本聚类任务时性能有限。针对上述情况,提出一种结合上下文语义的短文本聚类算法。首先借鉴社会网络分析领域的中心性和权威性思想设计了一种结合上下文语义的... 短文本因具有特征信息不足且高维稀疏等特点,使得传统文本聚类算法应用于短文本聚类任务时性能有限。针对上述情况,提出一种结合上下文语义的短文本聚类算法。首先借鉴社会网络分析领域的中心性和权威性思想设计了一种结合上下文语义的特征词权重计算方法,在此基础上构建词条-文本矩阵;然后对该矩阵进行奇异值分解,进一步将原始特征词空间映射到低维的潜在语义空间;最后通过改进的K-means聚类算法在低维潜在语义空间完成短文本聚类。实验结果表明,与传统的基于词频及逆向文档频权重的文本聚类算法相比,该算法能有效改善短文本特征不足及高维稀疏性,提高了短文的本聚类效果。 展开更多
关键词 短文本聚类 上下文语义 奇异值分解 K均值算法
下载PDF
基于潜在语义索引的中文文本聚类的研究 被引量:4
7
作者 马国俊 贠卫国 《现代电子技术》 2005年第10期58-59,共2页
讨论了中文文本聚类的现状以及存在的问题,介绍了向量空间模型,详细阐述了潜在语义索引理论以及采用该模型进行中文文本聚类的主要步骤,最后采用两种模型进行了实验对比,实验表明采用潜在语义索引模型可以取得更好的聚类效果。
关键词 文本聚类 潜在语义索引 向量空间模型 信息检索
下载PDF
基于语义推理的文本信息关联关系分析技术 被引量:7
8
作者 陈天莹 苏智慧 《电讯技术》 北大核心 2014年第1期68-73,共6页
重点论述了文本信息中的知识发现及潜在关联分析技术。采用本体建模技术、信息抽取技术以及知识库上的语义推理技术等来完成并实现文本信息的关联关系发现和分析,最后给出了语义关联分析技术在文本信息处理系统中的应用,并简要描述了系... 重点论述了文本信息中的知识发现及潜在关联分析技术。采用本体建模技术、信息抽取技术以及知识库上的语义推理技术等来完成并实现文本信息的关联关系发现和分析,最后给出了语义关联分析技术在文本信息处理系统中的应用,并简要描述了系统的处理流程。在信息处理领域的大数据环境下,该技术有利于信息分析人员快速获取关联线索,辅助完成信息挖掘,为指挥决策提供更全面的信息支持。 展开更多
关键词 大数据 文本信息 数据挖掘 语义技术 信息抽取 关联分析
下载PDF
一种基于主谓宾结构的文本检索算法 被引量:7
9
作者 黄承慧 印鉴 侯昉 《计算机科学》 CSCD 北大核心 2010年第9期173-176,共4页
在文本检索领域,当前广泛应用的方法或者是考察检索词项与被检索文本的词频信息,或者是考察检索词项与被检索文本的语义相似性。这些方法忽略了检索词项与被检索文本的结构信息,检索结果有一定的局限性。通过分析检索词项与被检索文本... 在文本检索领域,当前广泛应用的方法或者是考察检索词项与被检索文本的词频信息,或者是考察检索词项与被检索文本的语义相似性。这些方法忽略了检索词项与被检索文本的结构信息,检索结果有一定的局限性。通过分析检索词项与被检索文本句子结构的主谓宾信息,进而考察主谓宾结构中词汇的语义相似性,最终实现对文本的语义检索。实验表明,该方法能够有效提高检索的查准率。 展开更多
关键词 文本信息检索 语义相似度 语法结构信息 检索算法
下载PDF
结合汉明距离及语义的文本相似度量方法研究 被引量:7
10
作者 胡维华 鲍乾 李柯 《杭州电子科技大学学报(自然科学版)》 2016年第3期36-41,共6页
利用VSM模型的TF-IDF算法对文本进行相似度量是文本信息处理领域的常用做法,但是该方法涉及到高维稀疏矩阵的处理,计算效率不高,不利于处理大规模文本,同时该方法忽略词项语义信息对文本的影响.另有一种基于语义的相似度算法可克服前一... 利用VSM模型的TF-IDF算法对文本进行相似度量是文本信息处理领域的常用做法,但是该方法涉及到高维稀疏矩阵的处理,计算效率不高,不利于处理大规模文本,同时该方法忽略词项语义信息对文本的影响.另有一种基于语义的相似度算法可克服前一种方法的语义缺点,但需要知识库的支持,其建立过程的繁杂使此类算法理论多过实践.为此提出一种新的文本相似度计算方法,方法综合TF-IDF算法以及HOWNET的语义信息,并利用汉明距离计算文本相似度,避开对高维稀疏矩阵的直接处理.实验结果表明,与常用方法相比较,处理速度更快、性能更好,适用于大规模文本处理. 展开更多
关键词 文本相似度 向量空间模型 词频—逆文本频率 语义 汉明距离
下载PDF
面向语义信息分析的多层次技术演化轨迹识别方法研究 被引量:6
11
作者 马铭 王超 +2 位作者 许海云 龚兵营 周勇 《图书情报工作》 CSSCI 北大核心 2022年第4期103-117,共15页
[目的/意义]面向语义信息以层次渐进的方式识别技术演化轨迹,有助于加强对技术细节的理解并提升轨迹识别的准确性。[方法/过程]首先,提取专利和科技论文的SAO结构,依据语义信息确定研究主题,并利用S曲线分析技术生命周期。其次,借助机... [目的/意义]面向语义信息以层次渐进的方式识别技术演化轨迹,有助于加强对技术细节的理解并提升轨迹识别的准确性。[方法/过程]首先,提取专利和科技论文的SAO结构,依据语义信息确定研究主题,并利用S曲线分析技术生命周期。其次,借助机器学习算法与社会网络分析指标,分不同周期,通过多层次提取,筛选技术演化轨迹。最后,以造血干细胞领域为实证对象,发现该领域中与遗传病因技术主题相关的专利和科技论文的研究重点存在显著差异,该主题尚未形成统一的演化路径:,且有关免疫系统疾病与糖尿病方面的研究是未来潜在的演化趋势。[结果/结论]所提方法通过客观的数值计算结果,逐步实现复杂技术演化路後的提取与凝练,在揭示技术主要发展历程的同时,能够客观预测技术演化趋势。 展开更多
关键词 技术演化 演化轨迹 文本分析 语义信息 社会网络分析
原文传递
基于互信息的维吾尔文自适应组词算法 被引量:6
12
作者 吐尔地.托合提 艾克白尔.帕塔尔 艾斯卡尔.艾木都拉 《计算机应用研究》 CSCD 北大核心 2013年第2期429-431,435,共4页
传统的分词方法将一个维吾尔文语义词(多词关联模式)拆分成与词意义不符的若干个片段,因此在维吾尔语文本分析及文本处理过程中导致许多问题,严重影响文本处理效率。提出了一种维吾尔文组词的全新概念,用互信息作为相邻单词间关联程度... 传统的分词方法将一个维吾尔文语义词(多词关联模式)拆分成与词意义不符的若干个片段,因此在维吾尔语文本分析及文本处理过程中导致许多问题,严重影响文本处理效率。提出了一种维吾尔文组词的全新概念,用互信息作为相邻单词间关联程度的度量,实现了基于分段式策略和增量式策略的两种自适应组词算法,并与传统的分词方法得到的词汇表进行对比分析。实验结果表明,组词算法能够非常有效地提取文本中的语义词,两种算法在大规模文本集上的组词准确率分别达到了84.31%和88.24%。 展开更多
关键词 维吾尔文 传统分词 语义词 互信息 组词
下载PDF
基于多知识图谱的中文文本语义图构建研究 被引量:4
13
作者 赵一鸣 吴林容 任笑笑 《情报科学》 CSSCI 北大核心 2021年第4期23-29,共7页
【目的/意义】基于知识图谱构建文本语义图,可以解决传统文本表示方法中语义缺失的问题。【方法/过程】首先基于百科知识图谱CN-DBpedia构建以文本中的命名实体为节点、实体之间的语义关系为边的语义图,然后引入概念图谱CN-Probase,实... 【目的/意义】基于知识图谱构建文本语义图,可以解决传统文本表示方法中语义缺失的问题。【方法/过程】首先基于百科知识图谱CN-DBpedia构建以文本中的命名实体为节点、实体之间的语义关系为边的语义图,然后引入概念图谱CN-Probase,实现实体和概念之间的映射,进而生成融入概念知识图谱的增强型中文文本语义图,最后以新闻文本的模式发现任务为例对本文提出的方法进行了验证。【结果/结论】提出了一种新型的基于多知识图谱构建中文文本语义图的方法。【创新/局限】实现了实体层面和概念层面两个层次的中文文本语义化表示,可应用于文本分类、文本分析等自然语言处理任务,局限在于只使用了新闻文本进行实验验证。 展开更多
关键词 中文文本语义图 文本表示 文本分析 知识图谱 语义信息
原文传递
基于多层语义融合的结构化深度文本聚类模型 被引量:3
14
作者 马胜位 黄瑞章 +1 位作者 任丽娜 林川 《计算机应用》 CSCD 北大核心 2023年第8期2364-2369,共6页
近年来,由于图神经网络(GNN)的结构信息在机器学习中的优势,人们开始将GNN结合进深度文本聚类中。当前结合GNN的深度文本聚类算法在文本语义信息融合时忽略了解码器在语义补足上的重要作用,这导致在数据生成部分出现语义信息的缺失。针... 近年来,由于图神经网络(GNN)的结构信息在机器学习中的优势,人们开始将GNN结合进深度文本聚类中。当前结合GNN的深度文本聚类算法在文本语义信息融合时忽略了解码器在语义补足上的重要作用,这导致在数据生成部分出现语义信息的缺失。针对以上问题,提出了一种基于多层语义融合的结构化深度文本聚类模型(SDCMS)。该模型利用GNN将结构信息集成到解码器中,通过逐层语义补充增强了文本数据的表示,并通过三重自监督机制获得更好的网络参数。在Citeseer、Acm、Reutuers、Dblp、Abstract这5个真实数据集上进行实验的结果表明,与目前最优的注意力驱动的图形聚类网络(AGCN)模型相比,SDCMS在准确率、归一化互信息(NMI)和平均兰德指数(ARI)上分别最多提升了5.853%、9.922%和8.142%。 展开更多
关键词 深度文本聚类 逐层语义增强 文本语义信息 图神经网络 自监督学习
下载PDF
基于有序神经元LSTM的短文本相似性检测 被引量:5
15
作者 吴迎岗 《计算机应用与软件》 北大核心 2021年第12期314-319,340,共7页
针对自然语言处理中短文本相似度问题,提出一种基于有序神经元长短期记忆神经网络(Ordered Neurons-Long Short Term Memory,ON-LSTM)的短文本相似度匹配方法。将神经元经过特定排序使层级结构融入到LSTM中,自动学习到层级结构信息,更... 针对自然语言处理中短文本相似度问题,提出一种基于有序神经元长短期记忆神经网络(Ordered Neurons-Long Short Term Memory,ON-LSTM)的短文本相似度匹配方法。将神经元经过特定排序使层级结构融入到LSTM中,自动学习到层级结构信息,更好地表示文本深层次语义信息,并通过Independent Component(IC)层加快收敛速度,结合整体语义信息表示来计算语义相似度。在数据集上进行多组实验表明,该模型取得81.05%的准确率,有效提升短文本相似的准确率,且收敛速度更快,在一定程度上提高文本语义分析能力。 展开更多
关键词 ON-LSTM 文本相似 深度学习 词义信息
下载PDF
基于知识增强的文本语义匹配模型研究 被引量:1
16
作者 张贞港 余传明 《情报学报》 CSSCI CSCD 北大核心 2024年第4期416-429,共14页
文本语义匹配模型在信息检索、文本挖掘等领域已经获得了广泛应用。为解决现有模型主要从文本自身角度判断文本之间的语义关系而忽略对外部知识有效利用的问题,本文提出一种新的基于知识增强的文本语义匹配模型,以知识图谱实体作为外部... 文本语义匹配模型在信息检索、文本挖掘等领域已经获得了广泛应用。为解决现有模型主要从文本自身角度判断文本之间的语义关系而忽略对外部知识有效利用的问题,本文提出一种新的基于知识增强的文本语义匹配模型,以知识图谱实体作为外部知识,有效建模文本的外部知识信息,并自适应地过滤外部知识中存在的噪声。针对自然语言推理和释义识别两个文本语义匹配任务,与基线方法相比,本文模型在大多数指标上取得了最优效果。研究结果表明,本文模型有助于揭示知识图谱在文本语义匹配任务中的作用,为将知识图谱应用到智能信息服务领域提供了参考。 展开更多
关键词 文本语义匹配 信息检索 知识图谱 知识增强
下载PDF
一种利用词典扩展数据库模式信息的Text2SQL方法
17
作者 于晓昕 何东 +2 位作者 叶子铭 陈黎 于中华 《四川大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第1期78-88,共11页
现有Text2SQL方法严重依赖表名和列名在自然语言查询中的显式提及,在同物异名的实际应用场景中准确率急剧下降.此外,这些方法仅仅依赖数据库模式捕捉数据库建模的领域知识,而数据库模式作为结构化的元数据,其表达领域知识的能力是非常... 现有Text2SQL方法严重依赖表名和列名在自然语言查询中的显式提及,在同物异名的实际应用场景中准确率急剧下降.此外,这些方法仅仅依赖数据库模式捕捉数据库建模的领域知识,而数据库模式作为结构化的元数据,其表达领域知识的能力是非常有限的,即使有经验的程序员也很难仅从数据库模式完全领会该数据库建模的领域知识,因此程序员必须依赖详细的数据库设计文档才能构造SQL语句以正确地表达特定的查询.为此,本文提出一种利用词典扩展数据库模式信息的Text2SQL方法,该方法从数据库表名和列名解析出其中的单词或短语,查询词典获取这些单词或短语的语义解释,将这些解释看成是相应表名或列名的扩展内容,与表名、列名及其他数据库模式信息(主键、外键等)相结合,作为模型的输入,从而使模型能够更全面地学习数据库建模的应用领域知识.在Spider-syn和Spider数据集上进行的实验说明了所提出方法的有效性,即使自然语言查询中使用的表名和列名与数据库模式中对应的表名和列名完全不同,本文方法也能够得到较好的SQL翻译结果,明显优于最新提出的抗同义词替换攻击的方法. 展开更多
关键词 数据库模式 语义扩展 解释信息 text2SQL
下载PDF
基于不平衡短文本的农业问句分类方法研究
18
作者 成继福 郭晓娟 周俊明 《河南科技学院学报(自然科学版)》 2024年第6期38-48,共11页
目的解决中国农技推广信息平台、中国农业信息网等问答社区中农业问句数据快速自动分类问题.方法针对采集的农业数据集中文本长度较短、样本类别不均衡性等问题,提出了一种文本语义信息扩展的方法.根据农业问句文本的特征,该方法采用Wor... 目的解决中国农技推广信息平台、中国农业信息网等问答社区中农业问句数据快速自动分类问题.方法针对采集的农业数据集中文本长度较短、样本类别不均衡性等问题,提出了一种文本语义信息扩展的方法.根据农业问句文本的特征,该方法采用Word2Vec模型,把问句中的关键词用TextRank算法进行抽取,在Word2Vec模型中查找关键词的近义词,并对关键词进行替换,生成新的同义问句.并用深度学习模型Bi-LSTM、Bi-GRU与增加注意力机制的Bi-LSTM-Att、Bi-GRU-Att和TextRCNN 5种模型对此方法进行验证.结果对比实验结果表明,该方法在5种模型上的Precision、Recall和F1 score均有提升,尤其在Bi-LSTM-Att模型上,Acc和平均F1值分别提升了0.8和2.5个百分点.结论实验结果表明该方法可有效地解决短文本和类别分布不平衡性问题,提高了不平衡短文本分类效果. 展开更多
关键词 短文本分类 不平衡样本 语义信息扩展 农业问句
下载PDF
文本语义哈希技术研究进展
19
作者 孙宇清 黄钿 +2 位作者 李呈韬 郑威 汤庸 《华南师范大学学报(自然科学版)》 CAS 北大核心 2024年第3期93-105,共13页
文本语义哈希是在满足语义相似性约束下将文本转化为低维二值数据的神经编码技术,支持基于汉明距离的高效检索,以解决有限计算资源约束下海量文本的相似性计算问题。文本语义哈希技术存在诸多挑战,包括如何在低维二值编码中融入类别信... 文本语义哈希是在满足语义相似性约束下将文本转化为低维二值数据的神经编码技术,支持基于汉明距离的高效检索,以解决有限计算资源约束下海量文本的相似性计算问题。文本语义哈希技术存在诸多挑战,包括如何在低维二值编码中融入类别信息、如何丰富编码的语义信息以提升模型鲁棒性、如何解决离散输出的模型梯度估计等关键问题。文章首先综述文本语义哈希任务的重要研究发展,详细讨论了无监督文本语义哈希模型和融合类别信息的有监督文本语义哈希模型的技术细节,分析基于近邻文本、隐式主题等信息的语义增强技术以及模型优化等关键技术;然后,综述文本语义哈希任务相关数据集和评估指标,对比了各类文本语义哈希技术的特点和性能;最后,讨论了文本语义哈希技术的未来发展方向。 展开更多
关键词 文本语义哈希 信息检索 协同编码
下载PDF
混合神经网络和条件随机场相结合的文本情感分析 被引量:4
20
作者 翟学明 魏巍 《智能系统学报》 CSCD 北大核心 2021年第2期202-209,共8页
针对当前文本情感分析中神经网络模型训练时间长,上下文信息学习不足的问题,该文提出了一种结合混合神经网络和条件随机场(conditional random fields,CRF)的模型。该模型将神经网络作为语言模型,结合了卷积神经网络(convolutional neur... 针对当前文本情感分析中神经网络模型训练时间长,上下文信息学习不足的问题,该文提出了一种结合混合神经网络和条件随机场(conditional random fields,CRF)的模型。该模型将神经网络作为语言模型,结合了卷积神经网络(convolutional neural networks,CNN)与双向门控循环单元(bidirectional gated recurrent unit,Bi-GRU)两种神经网络获得的语义信息和结构特征,采用条件随机场模型作为分类器,计算情感概率分布,进而能够准确地判断情感类别。该文的模型在NLPCC 2014数据集上进行了测试,准确率为91.74%,与其他分类模型相比,可以获得更好的准确性和F值。 展开更多
关键词 卷积神经网络 门控循环单元 条件随机场 文本情感分析 语言模型 语义特征 上下文信息 分类器
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部