-
题名多层结构化语义知识增强的跨领域命名实体识别
被引量:1
- 1
-
-
作者
张文韩
刘小明
杨关
刘杰
-
机构
中原工学院计算机学院
河南省网络舆情监测与智能分析重点实验室(中原工学院)
北方工业大学信息学院
国家语委中国语言智能研究中心(首都师范大学)
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2023年第12期2864-2876,共13页
-
基金
国家重点研发计划项目(2020AAA0109700)
国家自然科学基金项目(62076167)
河南省高等学校重点科研项目(23A520022)。
-
文摘
跨域命名实体识别旨在缓解目标领域标注数据不足的问题.现有方法通常利用特征表示或者模型参数的共享来实现实体识别能力的跨领域迁移,但对文本序列中结构化知识的充分利用仍有所欠缺.基于此,提出了基于多层结构化语义知识增强的跨领域命名实体识别(multi-level structured semantic knowledge enhanced cross-domain named entity recognition,MSKE-CDNER)模型,即通过在多个层级实现对源领域和目标领域文本各自蕴含的结构化表示的对齐来促进实体识别能力跨领域迁移.首先,MSKE-CDNER利用结构特征表示层从不同领域中获取文本的结构化语义知识表示;然后,将获得的结构化语义知识表示通过潜层对齐模块在对应的层级进行结构化对齐,获取结构化的跨领域不变知识,从而提高模型对文本结构化知识的利用;此外,将域不变知识与特定域知识融合,进一步增强模型的泛化能力;最后,分别在5个英文数据集和特定的跨域命名实体识别数据集上进行实验.结果显示,对比当前跨域模型,MSKE-CDNER的平均性能提高了0.43%和1.47%,表明利用特征表示中的结构化知识可以有效提高目标领域的实体识别能力.
-
关键词
跨域命名实体识别
跨领域迁移
结构化对齐
结构化知识
域不变知识
-
Keywords
cross-domain named entity recognition
cross-domain transfer
structured alignment
structured knowledge
domain invariant knowledge
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名基于跨领域迁移的AM-AdpGRU金融文本分类
被引量:3
- 2
-
-
作者
吴峰
谢聪
姬少培
-
机构
南宁师范大学师园学院
广西农业职业技术大学
中国电子科技集团公司第三十研究所
-
出处
《应用科学学报》
CAS
CSCD
北大核心
2022年第5期828-837,共10页
-
基金
四川省重大科技项目(No.2017GZDZX0002)
2020年度广西高校中青年教师科研基础能力提升项目(2020KY54019)资助。
-
文摘
针对当前基于深度学习的金融文本分类模型严重依赖于标记数据的问题,提出了一种基于跨领域迁移的AM-AdpGRU金融文本分类模型,通过学习相关领域数据的分类准则将其迁移到目标领域数据。AM-AdpGRU模型首先利用深度网络自适应来克服源领域和目标域之间数据分布差异导致的迁移损失,使得即使数据分布发生变化时模型也无需重构;然后利用注意力机制建立了目标域对源领域的特征选择机制,使得模型对源领域的注意力可以集中在与目标域相似性更高的部分。在公开的跨域情感评论Amazon数据集和SemEval-2017的Microblog金融数据集上进行了实验,将AM-AdpGRU模型与其他方法进行比较,结果表明AM-AdpGRU模型的分类平均准确性相对于其他模型有了显着提升。
-
关键词
金融文本分类
跨领域迁移
深度网络适应
源领域
目标域
特征选择机制
-
Keywords
nancial text classification
cross-domain migration
deep network adaptation
source domain
target domain
feature selection mechanism
-
分类号
TP301
[自动化与计算机技术—计算机系统结构]
-
-
题名基于BERT预训练模型的即时通讯情感分析方法
- 3
-
-
作者
吴迪
-
机构
黎明职业大学信息与电子工程学院
-
出处
《闽江学院学报》
2021年第5期42-49,共8页
-
基金
黎明职业大学规划项目(KHL19014)。
-
文摘
为实现对即时通讯软件使用过程中话题分组信息的情感分析,采用基于BERT的预训练语言模型的微调方法,支持中文语义下的情感分析。在此基础上,提出一种跨领域模型迁移方法以进一步提高模型的准确率,实验结果表明,采用该方法相对于BERT基础方法平均准确率提升2.1%,对比RNN模型的各项指标也具有优势。该方法有效解决了即时通讯分组文本的情感分类问题。
-
关键词
即时通讯
Transformer模型
BERT
预训练模型
跨领域迁移
情感分析
-
Keywords
instant messaging
Transformer model
BERT
pre-trained model
cross-domain migration
emotion analysis
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-