-
题名基于改进卷积神经网络的短文本分类模型
被引量:20
- 1
-
-
作者
高云龙
吴川
朱明
-
机构
中国科学院长春光学精密机械与物理研究所
中国科学院航空光学成像与测量重点实验室
-
出处
《吉林大学学报(理学版)》
CAS
北大核心
2020年第4期923-930,共8页
-
基金
国家自然科学基金(批准号:61401425)
吉林省科技发展计划项目(批准号:20200571505JH).
-
文摘
基于卷积神经网络,提出一种基于改进卷积神经网络的短文本分类模型.首先,采用不同编码方式将短文本映射到不同空间下的分布式表示,提取不同粒度的数字特征作为短文本分类模型的多通道输入,并根据标准知识库提取概念特征作为先验知识,提高短文本的语义表征能力;其次,在全连接层增加自编码学习策略,在近似恒等的基础上进一步组合数字特征,模拟数据内部的关联性;最后,利用相对熵原理为模型增加稀疏性限制,降低模型复杂度的同时提高模型的泛化能力.通过对开源数据集进行短文本分类实验,验证了模型的有效性.
-
关键词
卷积神经网络
短文本
概念分布式表示
稀疏
自编码
-
Keywords
convolutional neural network
short text
concept distributed representation
sparsity
self-coding
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-