-
题名基于擦除和生成式模型的情感可解释性分析
- 1
-
-
作者
陈世男
葛东来
沈力行
徐东钦
贡正仙
-
机构
苏州大学计算机科学与技术学院
-
出处
《中文信息学报》
CSCD
北大核心
2024年第7期158-164,共7页
-
基金
国家自然科学基金(61976148)。
-
文摘
情感可解释性分析是近年来比较新颖的研究方向,其目标是在预测文本的情感极性的同时给出决定情感极性的证据片段。该文在仅有情感分类任务数据集的基础上,提出了基于擦除的情感可解释性片段抽取方法,通过被擦除单词对情感极性逻辑判断的波动影响来决定证据的抽取。随后,利用擦除的方法使用模型对公开情感分析数据集中的部分数据进行片段抽取并人工过滤得到有监督数据,再使用T5序列生成式模型进行有监督训练,从而进一步提升证据抽取的性能。最终在“百度2022语言与智能技术竞赛:情感可解释评测”中获得第三名的成绩。
-
关键词
情感可解释性
基于擦除
序列生成式模型
-
Keywords
sentiment interpretability
erasure-based
sequence generative model
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名生成模型在蛋白质序列设计中的应用
被引量:1
- 2
-
-
作者
伍青林
任玉彬
翟小威
陈东
刘凯
-
机构
浙江大学能源工程学院
清华大学化学系
-
出处
《应用化学》
CAS
CSCD
北大核心
2022年第1期3-17,共15页
-
基金
国家自然科学基金(No.21878258)
浙江省自然科学基金(No.Y20B060027)和资助。
-
文摘
蛋白质是一切生命体的物质基础,是生命活动的主要承担者,参与各种生理功能的调节。设计具有特定功能的蛋白质在蛋白质工程、生物医药、材料科学等领域具有重要意义。蛋白质序列设计的目标是设计能够折叠成期望结构并具有相应功能的氨基酸序列,是所有理性蛋白质工程的核心问题,具有极其重要的研究和应用潜力。随着蛋白质序列数据的指数型增长和深度学习技术的快速发展,生成模型越来越多地被应用于蛋白质序列设计。本文简要介绍了蛋白质序列设计的重要意义和主要方法,概述了应用于蛋白质序列设计的主要生成模型,介绍了近年来生成模型在蛋白质序列表示、生成和优化方面的最新研究和应用现状,并对未来的发展方向进行讨论与展望。
-
关键词
蛋白质序列设计
生成模型
变分自动编码器
生成对抗网络
表示学习
强化学习
-
Keywords
Protein sequence design
generative model
Variational autoencoder
generative adversarial network
Representation learning
Reinforcement learning
-
分类号
O629.7
[理学—有机化学]
-