期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

债券领域的多粒度词向量训练及评估方法研究

Study on Multi-granularity Embeddings of Training and Evaluation in the Bond Field

下载PDF

导出

摘要债券市场充斥着海量且复杂的信息,而构建能够表达债券市场复杂语义的数字词典(预训练词向量),是充分利用这些信息并实现金融科技赋能业务的关键。目前,不仅缺乏债券领域专用的预训练词向量,而且词向量的评估也是一大挑战。上述研究提出了一种联合字组件、字和词信息的的债券领域多粒度词向量训练框架(BondJWE)。此外,上述研究为了实现对该词向量的科学评估,针对已有数据特点设计了下游文本分类任务。以上研究弥补了债券领域的专用预训练词向量研究的空白,且其实验结果表明BondJWE的性能优于其它基线模型,说明以上研究所提供的多粒度词向量有着更好的语义表达能力和鲁棒性。 The bond market is flooded with massive and complex information,while the key to fully utilizing this information and implementing the aim that fintech enables businesses is to construct a digital dictionary(namely,pretrained word embeddings),which can describe complex semantics in the bond market.So far,there has been a lack of pre-trained bond-specific embeddings,and their evaluation has also been a big challenge.On the basis of joint information of components,characters and words,this study proposed a multi-granularity word embeddings training framework for the bond field,named BondJWE.Moreover,to evaluate these embeddings scientifically,this study designed a downstream task,text classification,according to intrinsic features of data.This study makes up for the blank of research on pre-trained bond-specific embeddings.And results show that the performance of BondJWE is better than that of other baseline models,which indicates that these multi-granularity word embeddings can better express semantics and are more robust.

作者华娇娇唐华云王延昭商丽丽 HUA Jiao-jiao;TANG Hua-yun;WANG Yan-zhao;SHANG Li-li(Postdoctoral Research Workstation,China Central Depository&Clearing Co.,Ltd.,Beijing 100033 China;Blockchain Lab,Chinabond Financial and Information Technology Co.,Ltd,Beijing 100004,China)

机构地区中央国债登记结算有限责任公司博士后科研工作站中债金科信息技术有限公司区块链实验室

出处《计算机仿真》 2024年第3期260-266,共7页 Computer Simulation

基金绿色发展大数据决策北京市重点实验室(dm202103) 博士后科学基金资助项目(2022M723692)。

关键词词向量文本分类债券 Word embeddings Text classification Bond

分类号 TP391.9 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献4

1才智杰,孙茂松,才让卓玛.藏文词向量相似度和相关性评测集构建[J].中文信息学报,2019,0(7):81-87. 被引量：5
2杜慧,徐学可,伍大勇,刘悦,余智华,程学旗.基于情感词向量的微博情感分类[J].中文信息学报,2017,31(3):170-176. 被引量：21
3帕丽旦.木合塔尔,吾守尔.斯拉木,买买提阿依甫.基于混合模型的维吾尔文词性标注方法[J].计算机仿真,2019,36(1):268-273. 被引量：6
4买买提阿依甫,吾守尔·斯拉木,帕丽旦·木合塔尔,杨文忠.基于LDA与深度神经网络的维吾尔文情感分类[J].计算机仿真,2019,36(10):194-201. 被引量：6

二级参考文献14

1朱嫣岚,闵锦,周雅倩,黄萱菁,吴立德.基于HowNet的词汇语义倾向计算[J].中文信息学报,2006,20(1):14-20. 被引量：326
2洪铭材,张阔,唐杰,李涓子.基于条件随机场(CRFs)的中文词性标注方法[J].计算机科学,2006,33(10):148-151. 被引量：56
3唐慧丰,谭松波,程学旗.基于监督学习的中文情感分类技术比较研究[J].中文信息学报,2007,21(6):88-94. 被引量：136
4徐琳宏,林鸿飞,潘宇,任惠,陈建美.情感词汇本体的构造[J].情报学报,2008,27(2):180-185. 被引量：381
5赵妍妍,秦兵,刘挺.文本情感分析[J].软件学报,2010,21(8):1834-1848. 被引量：539
6桑海岩,古丽拉.阿东别克,牛宁宁.基于最大熵的哈萨克语词性标注模型[J].计算机工程与应用,2013,49(11):126-129. 被引量：4
7王海波,祖漪清,力提甫.托乎提.基于功能词缀串的维吾尔语词性标注方法[J].中文信息学报,2013,27(5):179-183. 被引量：8
8梁军,柴玉梅,原慧斌,昝红英,刘铭.基于深度学习的微博情感分析[J].中文信息学报,2014,28(5):155-161. 被引量：110
9杨阳,刘龙飞,魏现辉,林鸿飞.基于词向量的情感新词发现方法[J].山东大学学报（理学版）,2014,49(11):51-58. 被引量：26
10才智杰,才让卓玛.藏文字符的向量模型及构件特征分析[J].中文信息学报,2016,30(2):202-206. 被引量：6

共引文献34

1刘欣雨.基于弹幕的突发信息安全类事件舆情分析——以“滴滴平台下架”事件为例[J].情报工程,2022,8(4):85-109. 被引量：1
2冯建英,吴丹丹,王博,王智,穆维松.中文在线评论文本分析对生鲜农产品电商影响研究综述[J].农业机械学报,2021,52(S01):504-512. 被引量：7
3才智杰,才让卓玛,孙茂松.一种多基元联合训练的藏文词向量表示方法[J].中文信息学报,2020(5):44-49. 被引量：3
4李建平.手法治疗骶髂关节错缝52例[J].按摩与导引,2000,16(3):52-53.
5罗帆,王厚峰.结合RNN和CNN层次化网络的中文文本情感分类[J].北京大学学报（自然科学版）,2018,54(3):459-465. 被引量：21
6刘洺辛,陈晶,王麒媛.基于改进特征选择方法的文本情感分类研究[J].电信科学,2018,34(10):85-95. 被引量：2
7周虎,于跃,贾媛媛,赵文龙.基于深度LSTM神经网络的在线消费评论情感分类研究[J].中华医学图书情报杂志,2018,27(5):23-29. 被引量：1
8陈耀东,彭蝶飞.一种面向旅游评论的情感特征识别方法[J].计算机技术与发展,2018,28(11):107-110. 被引量：1
9张邵洁.智能语音查询系统助力企业经营决策[J].石油商技,2018,36(6):50-57.
10沈杰,瞿遂春,任福继,邱爱兵,徐杨.基于SGAN的中文问答生成研究[J].计算机应用与软件,2019,36(2):194-199. 被引量：5

1田海强,汪济洲,徐海珍,孔维哲.基于字词融合与对抗训练的医疗对话实体识别[J].黑龙江工业学院学报（综合版）,2024,24(2):77-84.
2盛承光.基于深度学习的金属表面缺陷识别方法[J].电脑与信息技术,2024,32(2):4-5.
3张忠坤,林泓宇,谭智元,邢明杰,武延军.图形化PDDL语言编译系统的设计与应用[J].计算机工程与设计,2024,45(2):626-632.
4尹华,卢懿亮,季跃蕾,吴梓浩,彭亚男.抽象语义表示解析方法研究综述[J].中文信息学报,2024,38(3):1-23.
5李赫洋.智能存算融合系统研究进展与发展趋势[J].舰船电子工程,2023,43(12):24-32.
6张前龙,周永章,虞鹏鹏,王汉雨,韩枫,贺炬翔.多层次矿床本体的构建及在知识图谱中的应用[J].矿物岩石地球化学通报,2024,43(1):211-217. 被引量：1
7胡少亮,徐小文,安恒斌,徐然,范荣红.应用特征驱动的并行数值代数解法器JPSOL[J].计算物理,2024,41(1):110-121. 被引量：1
8孙婧,王晓霞.基于云边协同子类蒸馏的卷积神经网络模型压缩方法[J].计算机科学,2024,51(5):313-320.
9向冲,张赛.基于大数据分析的人工神经网络分布式训练方法[J].微型电脑应用,2024,40(4):182-185.

计算机仿真

2024年第3期

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...

;

使用帮助返回顶部