-
题名基于多任务深度神经网络的企业纳税行为甄别研究
被引量:2
- 1
-
-
作者
李国锋
李祚娟
王哲吉
-
机构
山东财经大学统计与数学学院
-
出处
《统计研究》
CSSCI
北大核心
2022年第7期137-149,共13页
-
基金
国家社会科学基金一般项目“多源数据融合下企业纳税行为甄别智能学习方法研究”(19BTJ023)。
-
文摘
随着数字经济时代的到来,丰富的数据资源有利于全面精准地刻画企业纳税情况,但数据来源广、类别不平衡以及噪音多等问题,也给企业纳税行为的甄别工作带来挑战。本文融合企业报表以及证监会、海关和税务等部门的多来源涉税数据,基于K-S检验和随机森林算法,构建了企业纳税行为甄别指标体系;将不同行业企业纳税行为甄别工作视为不同任务,提出基于多任务深度神经网络的企业纳税行为甄别模型,充分利用了不同行业任务间的相关性和差异性信息;针对样本数据集不平衡问题,引入焦点损失函数进一步改进了甄别模型。研究发现,相对于传统Logistic、支持向量机和神经网络等单任务模型,本文多任务模型的企业纳税行为甄别能力、泛化能力和稳健性更强。当模型预测某企业纳税不遵从的概率超出阈值时,即可判定该企业为重点稽查对象,以辅助税务部门提升稽查效率。本研究为政府智慧税务治理工作提供了新的思路。
-
关键词
多源数据
多任务深度神经网络
企业纳税行为甄别
-
Keywords
multi-Source Data
multi-task learning in deep neural networks
Corporate Tax Paying Behavior Identification
-
分类号
C81
[社会学—统计学]
F812
-
-
题名多任务学习
被引量:33
- 2
-
-
作者
张钰
刘建伟
左信
-
机构
中国石油大学(北京)自动化系
-
出处
《计算机学报》
EI
CSCD
北大核心
2020年第7期1340-1378,共39页
-
基金
国家重点研发计划项目(2016YFC0303703-03)
中国石油大学(北京)年度前瞻导向及培育项目(2462018QZDX02)资助.
-
文摘
随着图像处理,语音识别等人工智能技术的发展,很多学习方法尤其是采用深度学习框架的方法取得了优异的性能,在精度和速度方面有了很大的提升,但随之带来的问题也很明显,这些学习方法如果要获得稳定的学习效果,往往需要使用数量庞大的标注数据进行充分训练,否则就会出现欠拟合的情况而导致学习性能的下降.因此,随着任务复杂程度和数据规模的增加,对人工标注数据的数量和质量也提出了更高的要求,造成了标注成本和难度的增大.同时,单一任务的独立学习往往忽略了来自其它任务的经验信息,致使训练冗余重复和学习资源的浪费,也限制了其性能的提升.为了缓解这些问题,属于迁移学习范畴的多任务学习方法逐渐引起了研究者的重视.与单任务学习只使用单个任务的样本信息不同,多任务学习假设不同任务数据分布之间存在一定的相似性,在此基础上通过共同训练和优化建立任务之间的联系.这种训练模式充分促进任务之间的信息交换并达到了相互学习的目的,尤其是在各自任务样本容量有限的条件下,各个任务可以从其它任务获得一定的启发,借助于学习过程中的信息迁移能间接利用其它任务的数据,从而缓解了对大量标注数据的依赖,也达到了提升各自任务学习性能的目的.在此背景之下,本文首先介绍了相关任务的概念,并按照功能的不同对相关任务的类型进行划分,之后对它们的特点进行了逐一描述.然后,本文按照数据的处理模式和任务关系的建模过程不同将当前的主流算法划分为两大类:结构化多任务学习算法和深度多任务学习算法.其中,结构化多任务学习算法采用线性模型,可以直接针对数据进行结构假设并且使用原有标注特征表述任务关系,同时,又可根据学习对象的不同将其细分为基于任务层面和基于特征层面两种不同结构,每种�
-
关键词
多任务学习
信息迁移
任务相似性
贝叶斯生成式模型多任务学习
判别式多任务学习
深度多任务学习
-
Keywords
multi-task learning
information transfer
similarity of tasks
Bayesian generative model of multi-task learning
discriminant approach of multi-task learning
deep multi-task learning via deep neural network
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-