期刊文献+
共找到25篇文章
< 1 2 >
每页显示 20 50 100
面向新闻领域的中文文本分类研究综述 被引量:24
1
作者 薛春香 张玉芳 《图书情报工作》 CSSCI 北大核心 2013年第14期134-139,共6页
在对文本分类及中文新闻分类概述的基础上,归纳出网络新闻文本特征及当前新闻文本分类特点,并总结新闻文本分类在新闻网站分类导航、话题识别与跟踪、个性化推荐三方面的应用。其后,总结中文新闻分类存在的问题,诸如缺乏通用语料和评价... 在对文本分类及中文新闻分类概述的基础上,归纳出网络新闻文本特征及当前新闻文本分类特点,并总结新闻文本分类在新闻网站分类导航、话题识别与跟踪、个性化推荐三方面的应用。其后,总结中文新闻分类存在的问题,诸如缺乏通用语料和评价方法、分类体系粗略、分类维度单一等,并提出相应措施。最后,针对当前信息环境,提出新闻分类不仅将朝着多层次、多维度、跨语言方向发展,还将与多媒体信息、大数据、社会化媒体相结合。 展开更多
关键词 新闻分类 文本分类 机器学习 中文信息处理
原文传递
基于组合-卷积神经网络的中文新闻文本分类 被引量:23
2
作者 张昱 刘开峰 +2 位作者 张全新 王艳歌 高凯龙 《电子学报》 EI CAS CSCD 北大核心 2021年第6期1059-1067,共9页
目前的新闻分类研究以英文居多,而且常用的传统机器学习方法在长文本处理方面,存在局部文本块特征提取不完善的问题.为了解决中文新闻分类缺乏专门术语集的问题,采用构造数据索引的方法,制作了适合中文新闻分类的词汇表,并结合word2vec... 目前的新闻分类研究以英文居多,而且常用的传统机器学习方法在长文本处理方面,存在局部文本块特征提取不完善的问题.为了解决中文新闻分类缺乏专门术语集的问题,采用构造数据索引的方法,制作了适合中文新闻分类的词汇表,并结合word2vec预训练词向量进行文本特征构建.为了解决特征提取不完善的问题,通过改进经典卷积神经网络模型结构,研究不同的卷积和池化操作对分类结果的影响.为提高新闻文本分类的精确率,本文提出并实现了一种组合-卷积神经网络模型,设计了有效的模型正则化和优化方法.实验结果表明,组合-卷积神经网络模型对中文新闻文本分类的精确率达到93.69%,相比最优的传统机器学习方法和经典卷积神经网络模型精确率分别提升6.34%和1.19%,并在召回率和F值两项指标上均优于对比模型. 展开更多
关键词 自然语言处理 词向量 组合-卷积神经网络 中文新闻 文本分类
下载PDF
融合FastText模型和注意力机制的网络新闻文本分类模型 被引量:8
3
作者 王婉 张向先 +1 位作者 卢恒 张莉曼 《现代情报》 CSSCI 2022年第3期40-47,共8页
[目的/意义]构建融合Fast Text模型和注意力机制的网络新闻文本分类模型,为网络新闻平台运营提供了智能化的知识组织思路。[方法/过程]基于Word2vec模型与Fast Text模型相结合的词向量模型Ngram2vec进行网络新闻文本的语义表达,并运用... [目的/意义]构建融合Fast Text模型和注意力机制的网络新闻文本分类模型,为网络新闻平台运营提供了智能化的知识组织思路。[方法/过程]基于Word2vec模型与Fast Text模型相结合的词向量模型Ngram2vec进行网络新闻文本的语义表达,并运用融合注意力机制的Bi LSTM;tte模型实现新闻文本分类。[结果/结论]实验结果显示,融合了Fast Text模型与注意力机制的网络新闻文本分类模型使F1值从90.62%提升到92.03%,说明本文提出的文本分类模型能够提升网络新闻文本分类的精确率,对网络新闻平台提升知识组织效率、优化服务水平具有重要参考价值。 展开更多
关键词 网络新闻 文本分类 注意力机制 双向长短期记忆神经网络模型
下载PDF
基于改进的加权补集朴素贝叶斯物流新闻分类 被引量:7
4
作者 许英姿 任俊玲 《计算机工程与设计》 北大核心 2022年第1期179-185,共7页
针对物流新闻类别分布不均衡,分类器容易倾向大类别而忽略小类别的问题,提出基于加权补集的朴素贝叶斯分类模型。构建物流新闻语料库,结合卡方检验进行特征选择,基于局部、全局和类内、类间的思想,分析并改进传统特征加权算法,设计适用... 针对物流新闻类别分布不均衡,分类器容易倾向大类别而忽略小类别的问题,提出基于加权补集的朴素贝叶斯分类模型。构建物流新闻语料库,结合卡方检验进行特征选择,基于局部、全局和类内、类间的思想,分析并改进传统特征加权算法,设计适用于类别分布不均衡物流新闻的加权补集朴素贝叶斯模型。实验结果表明,相较传统分类方法,加权补集朴素贝叶斯模型能有效解决物流新闻文本不均衡情况下的分类问题,快速准确地对物流新闻进行分类。 展开更多
关键词 朴素贝叶斯 不均衡样本 补集 物流新闻 文本分类 特征加权
下载PDF
CINO-TextGCN:融合CINO与TextGCN的藏文文本分类模型研究
5
作者 李果 杨进 陈晨 《高原科学研究》 CSCD 2024年第1期121-129,共9页
为提高藏文新闻文本分类准确性,文章提出一种融合少数民族语言预训练模型(Chinese Minority Pr-etrained Language Model,CINO)和图卷积神经网络模型(Text Graph Convolutional Networks,TextGCN)的方法,即CINO-TextGCN模型。为有效评... 为提高藏文新闻文本分类准确性,文章提出一种融合少数民族语言预训练模型(Chinese Minority Pr-etrained Language Model,CINO)和图卷积神经网络模型(Text Graph Convolutional Networks,TextGCN)的方法,即CINO-TextGCN模型。为有效评测该模型对藏文文本的分类性能,自建了较大规模和较高质量的藏文新闻文本公开数据集TNEWS(https://github.com/LG2016/CINO-TextGCN),通过实验发现,CINO-Text-GCN在公开数据集TNCC上的准确率为74.20%,在TNEWS上为83.96%。因此,该融合模型能够较好地捕捉到藏文文本语义,提升藏文文本分类性能。 展开更多
关键词 藏文 图卷积神经网络 融合模型 新闻文本 文本分类
下载PDF
基于因子分析朴素贝叶斯方法的新闻文本分类
6
作者 冷婷 叶仁玉 李沅静 《安庆师范大学学报(自然科学版)》 2024年第1期47-51,共5页
新闻文本分类是对网络新闻进行管理的有效途径。朴素贝叶斯方法为新闻文本分类的常用方法,在文本特征维度较高时,该方法的条件独立性假设难以成立,会导致分类效果欠佳。本文提出了因子分析朴素贝叶斯分类模型,并对复旦大学文本语料库中... 新闻文本分类是对网络新闻进行管理的有效途径。朴素贝叶斯方法为新闻文本分类的常用方法,在文本特征维度较高时,该方法的条件独立性假设难以成立,会导致分类效果欠佳。本文提出了因子分析朴素贝叶斯分类模型,并对复旦大学文本语料库中的新闻文本进行分类,同时将结果与朴素贝叶斯、多项Logistic回归模型和决策树方法进行比较。实验结果显示,因子分析朴素贝叶斯模型的分类准确率达84%,效果最优。 展开更多
关键词 朴素贝叶斯 因子分析 新闻文本分类 机器学习
下载PDF
基于知识增强和提示学习的小样本新闻主题分类方法
7
作者 余新言 曾诚 +2 位作者 王乾 何鹏 丁晓玉 《计算机应用》 CSCD 北大核心 2024年第6期1767-1774,共8页
基于预训练微调的分类方法通常需要大量带标注的数据,导致无法应用于小样本分类任务。因此,针对中文小样本新闻主题分类任务,提出一种基于知识增强和提示学习的分类方法KPL(Knowledge enhancement and Prompt Learning)。首先,利用预训... 基于预训练微调的分类方法通常需要大量带标注的数据,导致无法应用于小样本分类任务。因此,针对中文小样本新闻主题分类任务,提出一种基于知识增强和提示学习的分类方法KPL(Knowledge enhancement and Prompt Learning)。首先,利用预训练模型在训练集上学习最优的提示模板;其次,将提示模板与输入文本结合,使分类任务转化为完形填空任务;同时利用外部知识扩充标签词空间,丰富标签词的语义信息;最后,对预测的标签词与原始的标签进行映射。通过在THUCNews、SHNews和Toutiao这3个新闻数据集上进行随机采样,形成小样本训练集和验证集进行实验。实验结果表明,所提方法在上述数据集上的1-shot、5-shot、10-shot和20-shot任务上整体表现有所提升,尤其在1-shot任务上提升效果突出,与基线小样本分类方法相比,准确率分别提高了7.59、2.11和3.10个百分点以上,验证了KPL在小样本新闻主题分类任务上的有效性。 展开更多
关键词 新闻主题分类 提示学习 知识增强 小样本学习 文本分类
下载PDF
基于BERT和RNN的新闻文本分类对比 被引量:6
8
作者 林德萍 汪红娟 《北京印刷学院学报》 2021年第11期156-162,共7页
准确且高效地获取对我们有用的信息,解决数据信息过多而带来的数据冗余的问题成为人们越来越关注的问题。近年来国内外研究学者针对不同的自然语言处理任务提出了各种不同的框架,不同的框架具有不同的优缺点。自然语言处理领域中经典的... 准确且高效地获取对我们有用的信息,解决数据信息过多而带来的数据冗余的问题成为人们越来越关注的问题。近年来国内外研究学者针对不同的自然语言处理任务提出了各种不同的框架,不同的框架具有不同的优缺点。自然语言处理领域中经典的问题之一就是文本分类,其中新闻文本分类是我们日常生活中容易引起大家关注的重要任务。该实验基于Transformer框架下的BERT模型对新闻文本数据集进行分类,通过与RNN的长短期记忆网络对同一新闻文本数据集进行了对比,评价指标采用的是模型分类通用的准确率和损失值。实验结果表明BERT模型的分类准确率明显高于长短期记忆网络。 展开更多
关键词 新闻文本分类 LSTM BERT
下载PDF
基于BiGRU与胶囊网络的中文新闻标题文本分类
9
作者 黄玉兰 刘瑞安 +2 位作者 胡昕 任超 徐宇辉 《科技创新与应用》 2024年第2期54-58,共5页
为弥补传统胶囊网络在进行文本分类时无法识别文本序列中各单词的重要程度及其之间的依赖关系,该文提出一种融合BiGRU和多头注意力机制的胶囊文本分类模型——BMCapsNet模型。该模型首先使用BiGRU和多头注意力机制对文本进行全局特征获... 为弥补传统胶囊网络在进行文本分类时无法识别文本序列中各单词的重要程度及其之间的依赖关系,该文提出一种融合BiGRU和多头注意力机制的胶囊文本分类模型——BMCapsNet模型。该模型首先使用BiGRU和多头注意力机制对文本进行全局特征获取,然后利用胶囊网络提取更深层次的语义信息并通过胶囊预测进行文本分类。将其应用于中文新闻标题文本分类任务,在THUCNews新闻标题数据集和今日头条新闻标题数据集上证明模型的有效性。 展开更多
关键词 BiGRU BMCapsNet 多头注意力机制 中文新闻标题 文本分类
下载PDF
基于BERT-BiLSTM-CNN模型的新闻文本分类研究 被引量:2
10
作者 徐建飞 吴跃成 《软件工程》 2023年第6期11-15,共5页
针对双向长短期记忆网络(BiLSTM)没有考虑到局部关键信息对文本分类的影响,以及卷积神经网络(TextCNN)无法捕获文本的长远距离的特征信息等问题,文章提出了一种基于BERT-BiLSTM-CNN混合神经网络模型的新闻文本分类的方法。为了进一步增... 针对双向长短期记忆网络(BiLSTM)没有考虑到局部关键信息对文本分类的影响,以及卷积神经网络(TextCNN)无法捕获文本的长远距离的特征信息等问题,文章提出了一种基于BERT-BiLSTM-CNN混合神经网络模型的新闻文本分类的方法。为了进一步增强文本表示和提高新闻文本分类的效果,首先使用BERT预训练模型对文本进行词嵌入映射,其次利用BiLSTM-CNN模型进一步提取文本上下文和局部关键特征,最后对新闻文本进行分类;并在THUCNews数据上进行对比实验,实验结果表明,BERT-BiLSTM-CNN模型的文本分类效果优于Transformer、TextRNN、TextCNN等深度学习模型。 展开更多
关键词 BERT BiLSTM-CNN 深度学习 新闻文本分类
下载PDF
机器学习下的新冠疫情新闻文本分类 被引量:1
11
作者 李海艳 王文东 江丛君 《延安大学学报(自然科学版)》 2023年第1期79-82,共4页
针对新冠疫情新闻繁杂及信息类别不明等问题,采取新冠疫情新闻语料作为数据集,分别利用TF-IDF与Word2vec提取特征值,与支持向量机、朴素贝叶斯等基于机器学习的模型结合对文本进行分类,并与TextCNN及BiLSTM 2种深度学习模型的分类实验... 针对新冠疫情新闻繁杂及信息类别不明等问题,采取新冠疫情新闻语料作为数据集,分别利用TF-IDF与Word2vec提取特征值,与支持向量机、朴素贝叶斯等基于机器学习的模型结合对文本进行分类,并与TextCNN及BiLSTM 2种深度学习模型的分类实验结果进行对比分析。实验结果表明:同等条件下,基于新冠疫情主题新闻数据集,SVM+TF-IDF模型在几种分类器中效果最好,精确度达到84%,F1值达到83%。 展开更多
关键词 新闻文本分类 机器学习 TF-IDF 支持向量机
下载PDF
基于BERT+BiLSTM+Attention的对抗训练新闻文本分类模型 被引量:1
12
作者 汪辉 于瓅 《西安文理学院学报(自然科学版)》 2023年第3期49-53,共5页
新闻文本分类是长文本分类的典型问题,因此提取词与词之间的关系特征就尤为重要.提出了基于双向Transformer编码表示的预训练模型(Bidirectional Encoder Representations from Transformers,BERT)和双向长短时记忆网络(Bi-directional ... 新闻文本分类是长文本分类的典型问题,因此提取词与词之间的关系特征就尤为重要.提出了基于双向Transformer编码表示的预训练模型(Bidirectional Encoder Representations from Transformers,BERT)和双向长短时记忆网络(Bi-directional Long Short-Term Memory,BiLSTM)以及注意力机制的对抗训练分类模型(BBA-AT).将预处理新闻文本数据经过BERT进行训练得到词嵌入编码,在训练后的词向量级别上进行扰动达到数据增广的效果,以此来进行对抗训练,之后通过双向长短时记忆网络对数据集进行编码提取双向语义表征.本文提出的BBA-AT模型F 1值在TNEWS数据集上比BERT模型提升了1.34%. 展开更多
关键词 BiLSTM 新闻文本分类 对抗训练 BERT
下载PDF
基于卷积神经网络的中文财经新闻分类方法 被引量:5
13
作者 谢志峰 吴佳萍 马利庄 《山东大学学报(工学版)》 CAS 北大核心 2018年第3期34-39,66,共7页
针对目前财经领域内新闻数据杂乱无章、缺乏自动高效管理等问题,提出一种基于卷积神经网络的中文财经新闻分类方法。收集大规模财经新闻语料,通过无监督学习方法训练获得一个广义通用的财经类词向量模型,将词向量引入到卷积神经网络模... 针对目前财经领域内新闻数据杂乱无章、缺乏自动高效管理等问题,提出一种基于卷积神经网络的中文财经新闻分类方法。收集大规模财经新闻语料,通过无监督学习方法训练获得一个广义通用的财经类词向量模型,将词向量引入到卷积神经网络模型训练中实现有效分类。与传统方法相比,基于卷积神经网络的中文财经新闻分类方法网络模型结构简单,针对小样本集也能表现优异的性能,不仅能有效解决中文财经新闻分类问题,还可充分证明卷积神经网络在处理文本分类问题中的有效性。 展开更多
关键词 财经新闻 卷积神经网络 文本分类 词向量 自然语言处理 深度学习
原文传递
基于微博用户模型的个性化新闻推荐 被引量:4
14
作者 古万荣 董守斌 +2 位作者 曾之肇 何锦潮 刘崇 《中文信息学报》 CSCD 北大核心 2016年第1期93-100,共8页
新闻推荐是互联网推荐系统的研究热点之一,传统的新闻推荐方法是在新闻网站内,通过记录用户浏览的新闻来实现推荐应用。然而,许多新闻网站并不强制要求用户必须注册才能浏览新闻。微博作为目前最主流的自媒体形式,它由用户自己发起或传... 新闻推荐是互联网推荐系统的研究热点之一,传统的新闻推荐方法是在新闻网站内,通过记录用户浏览的新闻来实现推荐应用。然而,许多新闻网站并不强制要求用户必须注册才能浏览新闻。微博作为目前最主流的自媒体形式,它由用户自己发起或传递,进而实现草根媒体的职能。对新闻进行高效组织并使用微博进行新闻推荐,这是之前研究欠缺的。该文通过提出基于微博分析的新闻推荐,提出了基于新闻和微博本身特点的解决方法,从而实现微博和新闻的关联。实验表明,该文设计的各模块具备较高的效率和实用效果。 展开更多
关键词 新闻推荐 文本分类 微博分析
下载PDF
融合长短时序与文本分类的新闻推荐模型
15
作者 王曙燕 巩婧怡 《西安邮电大学学报》 2023年第3期82-87,共6页
为了更好地向用户准确推荐兴趣新闻,构建一种融合长短时序与文本分类的新闻推荐模型。根据用户兴趣随时间变化的特点,分别获取用户长短时序偏好。将用户长序时间聚类为时间簇,融合Bert模型和文档主题生成模型进行文本自动分类捕捉用户... 为了更好地向用户准确推荐兴趣新闻,构建一种融合长短时序与文本分类的新闻推荐模型。根据用户兴趣随时间变化的特点,分别获取用户长短时序偏好。将用户长序时间聚类为时间簇,融合Bert模型和文档主题生成模型进行文本自动分类捕捉用户兴趣分布,提取各时间簇兴趣分布获得长时序偏好。对用户短时序中的单个时间点兴趣进行词频分析,获得用户短时序偏好。最后融合长短时序偏好,使用余弦相似度算法获得近似偏好用户并推荐新闻。实验结果表明,所提模型相比基于增量协同过滤和潜在语义分析的混合推荐算法与基于用户行为的新闻推荐算法在精准率、召回率和和F值等方面均有提高,在一定程度上提升了推荐效果。 展开更多
关键词 新闻推荐 长短时序 文本分类 Bert模型 余弦相似度
下载PDF
汉英新闻领域词典构建及文本分类
16
作者 张彦彦 《信息工程大学学报》 2023年第6期669-674,共6页
针对新闻文本内容领域交叉、语义特征稀疏等问题,提出了结合概念层次网络词语知识库的领域词典附加特征向量的细粒度新闻文本分类方法,满足新闻文本多层级领域文本分类的需求。实验结果表明,附加领域词典特征向量的多层文本分类器在父... 针对新闻文本内容领域交叉、语义特征稀疏等问题,提出了结合概念层次网络词语知识库的领域词典附加特征向量的细粒度新闻文本分类方法,满足新闻文本多层级领域文本分类的需求。实验结果表明,附加领域词典特征向量的多层文本分类器在父领域及子领域的文本分类实现上均具有较好的性能。从总体分类实现的结果来看,第1层文本分类的效果要好于第2层文本分类的效果,第2层分类效果受到上层分类的影响,领域分类效果较好的父领域在进行子领域分类过程中表现出更好的分类实现性能。 展开更多
关键词 新闻文本 概念层次网络 文本分类 领域词典
下载PDF
结合BERT词嵌入和双向循环卷积神经网络的新闻文本分类研究 被引量:2
17
作者 任鹏 李文杰 +2 位作者 舒宇杰 孙航 赵旖旎 《信息记录材料》 2022年第6期20-23,共4页
针对数字信息时代网络舆情爆发的复杂性及不可控性,提出一种融合BERT、TEXTRCNN、BILSTM-CRF的新闻文本分类模型,致力于提高新闻文本分类的准确率,通过采用BERT词嵌入技术高效获得句子语义特征,利用TEXTRCNN双向递归的结构以及BILSTM-CR... 针对数字信息时代网络舆情爆发的复杂性及不可控性,提出一种融合BERT、TEXTRCNN、BILSTM-CRF的新闻文本分类模型,致力于提高新闻文本分类的准确率,通过采用BERT词嵌入技术高效获得句子语义特征,利用TEXTRCNN双向递归的结构以及BILSTM-CRF模型的运用来解决序列标注问题,综合考虑上下文捕捉、词嵌入、文本特征等因素,提高对新闻识别的准确性。实验证明,使用该融合模型对新闻文本分类的准确率达到0.9551,且具有较好的泛化能力,能够更好地帮助有关部门及时处理突发舆情和失控事件。 展开更多
关键词 BERT 中文新闻 文本分类 textRCNN BILSTM-CRF
下载PDF
基于BERT和深度主动学习的农业新闻文本分类方法 被引量:1
18
作者 石运来 崔运鹏 杜志钢 《农业图书情报学报》 2022年第8期19-29,共11页
[目的/意义]当前农业新闻分类研究中的模型训练以被动学习方式居多,普遍存在数据无法即时标注及标注成本过高的问题,对农业新闻分析工作也造成了一定阻碍。为解决该问题,运用主动学习或者深度主动学习技术从未标注数据中选择更有价值和... [目的/意义]当前农业新闻分类研究中的模型训练以被动学习方式居多,普遍存在数据无法即时标注及标注成本过高的问题,对农业新闻分析工作也造成了一定阻碍。为解决该问题,运用主动学习或者深度主动学习技术从未标注数据中选择更有价值和代表性的数据进行人工标注并构建标注数据集,提升农业新闻挖掘工作效率和效果。[方法/过程]将文本分类常用的机器学习模型结合主动学习方法分析提升效果,以及使用BERT模型结合3种采样策略进行深度主动学习训练,在共19847条样本的新闻爬虫语料上以筛选出农业相关新闻为目标,通过每轮增加30个样本标注的迭代实验进行测试。[结果/结论]实验结果表明:主动学习方法的应用对各个模型的训练过程均有明显提升。其中BERT模型配合判别性主动学习采样函数,具有最优的新闻文本分类效果和最低的标注数据需求。 展开更多
关键词 深度学习 农业新闻 文本分类 BERT模型 主动学习
下载PDF
基于BLSTM-Attention神经网络模型的化工事故分类 被引量:2
19
作者 葛艳 郑利杰 +1 位作者 杜军威 陈卓 《计算机系统应用》 2020年第10期205-210,共6页
化工事故新闻数据包含新闻内容,标题以及新闻来源等方面信息,新闻内容的文本对上下文具有较强的依赖性.为了更准确地提取文本特征并提高化工事故分类的准确性,该文提出了一种基于Attention机制的双向LSTM(BLSTM-Attention)神经网络模型... 化工事故新闻数据包含新闻内容,标题以及新闻来源等方面信息,新闻内容的文本对上下文具有较强的依赖性.为了更准确地提取文本特征并提高化工事故分类的准确性,该文提出了一种基于Attention机制的双向LSTM(BLSTM-Attention)神经网络模型对化工新闻文本进行特征提取并实现文本分类.BLSTM-Attention神经网络模型能够结合文本上下文语义信息,通过正向和反向的角度来提取事故新闻的文本特征;考虑到事故新闻中不同词对文本的贡献不大相同,加入Attention机制对不同词和句子分配不同权重.最后,将该文提出的分类方法与Naive-Bayes、CNN、RNN、BLSTM分类方法在相同的化工事故新闻数据集上进行实验对比.实验结果表明:该文提出的神经网络模型BLSTM-Attention神在化工数据集上的效果更优于其他分类方法模型. 展开更多
关键词 化工事故新闻 特征提取 BLSTM-Attention 文本分类
下载PDF
基于辅助任务的BERT中文新闻文本分类研究
20
作者 崔建青 仇测皓 《软件工程》 2022年第6期4-8,共5页
新闻文本分类是自然语言处理领域中一项重要任务,本文使用新闻标题进行文本分类。随着BERT预训练模型的崛起,BERT模型在多项NLP(Natural Language Processing)任务中都取得了较好的效果,并应用在新闻分类任务中。为了提高新闻分类这一... 新闻文本分类是自然语言处理领域中一项重要任务,本文使用新闻标题进行文本分类。随着BERT预训练模型的崛起,BERT模型在多项NLP(Natural Language Processing)任务中都取得了较好的效果,并应用在新闻分类任务中。为了提高新闻分类这一主要任务的效果,本文引入辅助任务判断两个新闻是否是同类新闻,对BERT预训练模型在辅助任务和主要任务上进行微调。在THUCNews数据集上进行实验,实验结果表明,引入辅助任务的BERT新闻分类模型在效果上优于原BERT模型。 展开更多
关键词 新闻文本分类 BERT 辅助任务
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部