期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

金融学文本大数据挖掘方法与研究进展被引量：38

Text Mining in Financial Big Data and Its Research Progress

原文传递

导出

摘要在金融学领域的传统实证研究中,所用数据多局限于财务报表和股票市场数据等结构化数据。而在大数据时代,计算机技术的进步使得数据类型不断丰富,研究者开始将非结构化的文本大数据引入到金融学领域的研究中,其主要包括上市公司披露文本、财经媒体报道、社交网络文本、网络搜索指数以及P2P网络借贷文本等,并对文本的可读性、语气语调、相似性以及语义特征展开研究。本文首先介绍了金融学领域文本大数据挖掘步骤和方法,描述了语料获取、预处理过程、文档表示以及文档的特征抽取;然后根据不同的文本信息来源,梳理了金融学文本大数据的研究进展;最后对未来金融学文本大数据的研究方法和研究内容进行了展望。 Traditional empirical studies in the field of finance usually rely on structured data such as financial statements and stock market trading data.In the era of big data,data types have enriched with the improvement of computer technology and researchers have begun to introduce textual big data into the field of finance,mainly including the disclosure documents of listed companies,financial media reports,social network texts,internet search index,P2P online lending texts,and have examined the readability,tone,similarity and semantic characteristics of the text.This paper first introduces the steps and methods of textual big data mining in the field of finance,describing the corpus acquisition,preprocessing,document representation and the extraction process of document features.In addition,according to different sources of textual information,this paper introduces the research progress in financial textual big data.Finally,this paper provides a comprehensive research prospect on the research methods and topics of financial textual big data.

作者姚加权张锟澎罗平 YAO Jiaquan;ZHANG Kunpeng;LUO Ping(Jinan University, Guangzhou, China;Chinese Academy of Sciences, Beijing, China;University of Chinese Academy of Sciences,Beijing,China)

机构地区暨南大学管理学院中国科学院智能信息处理重点实验室中国科学院计算所中国科学院大学

出处《经济学动态》 CSSCI 北大核心 2020年第4期143-158,共16页 Economic Perspectives

基金国家自然科学基金项目(71502152,U1811461) 国家社科基金重大项目(18ZDA092) 国家重点研发计划课题(2017YFB1002104)的资助。

关键词文本大数据文本分析机器学习深度学习数据挖掘 Textual Big Data Textual Analysis Machine Learning Deep Learning Data Mining

分类号 TP3 [自动化与计算机技术—计算机科学与技术]

引文网络
相关文献

参考文献16

1曾建光.网络安全风险感知与互联网金融的资产定价[J].经济研究,2015,50(7):131-145. 被引量：87
2俞庆进,张兵.投资者有限关注与股票收益——以百度指数作为关注度的一项实证研究[J].金融研究,2012(8):152-165. 被引量：303
3任宏达,王琨.社会关系与企业信息披露质量——基于中国上市公司年报的文本分析[J].南开管理评论,2018,21(5):128-138. 被引量：41
4张学勇,吴雨玲,刘洪愧.基于网络大数据挖掘的实证资产定价研究进展[J].经济学动态,2018(6):129-140. 被引量：19
5孙书娜,孙谦.投资者关注和股市表现——基于雪球关注度的研究[J].管理科学学报,2018,21(6):60-71. 被引量：47
6汪昌云,武佳薇.媒体语气、投资者情绪与IPO定价[J].金融研究,2015(9):174-189. 被引量：159
7王靖一,黄益平.金融科技媒体情绪的刻画与对网贷市场的影响[J].经济学（季刊）,2018,17(3):1623-1650. 被引量：60
8彭红枫,林川.言之有物:网络借贷中语言有用吗?——来自人人贷借款描述的经验证据[J].金融研究,2018(11):133-152. 被引量：14
9游家兴,吴静.沉默的螺旋：媒体情绪与资产误定价[J].经济研究,2012,47(7):141-152. 被引量：324
10唐国豪,姜富伟,张定胜.金融市场文本情绪研究进展[J].经济学动态,2016(11):137-147. 被引量：32

二级参考文献210

1石军伟,胡立君,付海艳.企业社会资本的功效结构:基于中国上市公司的实证研究[J].中国工业经济,2007(2):84-93. 被引量：123
2宋双杰,曹晖,杨坤.投资者关注与IPO异象——来自网络搜索量的经验证据[J].经济研究,2011,46(S1):145-155. 被引量：153
3曾庆生.高管及其亲属买卖公司股票时“浑水摸鱼”了?——基于信息透明度对内部人交易信息含量的影响研究[J].财经研究,2014,40(12):15-26. 被引量：55
4王美今,孙建军.中国股市收益、收益波动与投资者情绪[J].经济研究,2004,39(10):75-83. 被引量：427
5白重恩,刘俏,陆洲,宋敏,张俊喜.中国上市公司治理结构的实证研究[J].经济研究,2005,40(2):81-91. 被引量：1327
6陈晓,王琨.关联交易、公司治理与国有股改革——来自我国资本市场的实证证据[J].经济研究,2005,40(4):77-86. 被引量：345
7攀登,施东晖.知情交易概率的测度模型及其影响因素分析[J].管理世界,2006,22(6):18-26. 被引量：24
8伍燕然,韩立岩.不完全理性、投资者情绪与封闭式基金之谜[J].经济研究,2007,42(3):117-129. 被引量：210
9沈洪涛.公司特征与公司社会责任信息披露——来自我国上市公司的经验证据[J].会计研究,2007(3):9-16. 被引量：484
10方军雄.我国上市公司信息披露透明度与证券分析师预测[J].金融研究,2007(06A):136-148. 被引量：292

共引文献1431

1吴淑萍,姚壮.网络社会互动与金融市场参与——来自某互联网证券交易平台的证据[J].管理评论,2022,34(12):3-15. 被引量：1
2迟国泰,董冰洁.基于借款描述的违约判别研究[J].管理评论,2022,34(11):261-271. 被引量：3
3吴花平,马铭,曾建光,范群林.媒体情绪与企业内部控制质量——基于文本内容分析的经验证据[J].中国会计评论,2023,21(1):105-132.
4陈宁,方军雄.经济政策不确定性与证券分析师盈余预测对会计信息的利用[J].中国会计评论,2022,20(1):45-74.
5唐少清,詹细明,李俊林,罗妍.管理层语调与创业板上市公司业绩关系研究[J].中国软科学,2020(S01):32-40. 被引量：18
6戴泽伟,杨兵.宏观经济政策不确定性对证券分析师预测效果影响研究[J].中国软科学,2020(1):171-183. 被引量：12
7王云,张筱.金融安全、金融风险与金融危机的界定与辨析[J].时代金融,2021(13):91-94. 被引量：1
8袁蓓,夏昊.智力资本信息披露促进了企业价值提升吗?——基于机构投资者异质性视角[J].云南财经大学学报,2020(12):75-88. 被引量：1
9牛华勇,窦一轩,夏晓雪.国内外财经文本分析研究综述[J].语料库语言学,2022,9(2):81-95.
10黄红英.三重底线视角下环境会计信息披露对企业绩效的影响研究——以高端制造业上市公司为例[J].现代营销（上）,2023(10):31-33.

同被引文献742

1姚婷,宋良荣.金融科技对商业银行风险的影响及异质性研究[J].云南财经大学学报,2020(12):53-63. 被引量：24
2黄静如,刘永模.媒体关注对企业债务融资成本的影响研究——基于会计稳健性的中介效应检验[J].投资研究,2020(2):113-133. 被引量：30
3周聪,张宗新.信息挖掘还是噪声交易:债券特质风险如何影响信用利差?[J].统计研究,2021,38(6):86-101. 被引量：11
4余东升,李小平,李慧.“一带一路”倡议能否降低城市环境污染?——来自准自然实验的证据[J].统计研究,2021,38(6):44-56. 被引量：29
5李琴,裴平.银行系金融科技发展与商业银行经营效率——基于文本挖掘的实证检验[J].山西财经大学学报,2021,43(11):42-56. 被引量：29
6吴良勇.服务创新下的农村食品加工企业服务转型[J].食品工业,2020,0(1):238-241. 被引量：3
7刘雨可,周申培,石英,杜家宝.面向配网一次设备缺陷文本命名实体识别研究[J].武汉理工大学学报,2022,44(10):93-101. 被引量：2
8徐细雄,龙志能,李万利.儒家文化与企业慈善捐赠[J].外国经济与管理,2020,0(2):124-136. 被引量：62
9刘云菁,张紫怡,张敏.财务与会计领域的文本分析研究:回顾与展望[J].会计与经济研究,2021(1):3-22. 被引量：12
10郑万腾,赵红岩,范宏.数字金融发展对区域创新的激励效应研究[J].科研管理,2021(4):138-146. 被引量：62

引证文献38

1牛华勇,窦一轩,夏晓雪.国内外财经文本分析研究综述[J].语料库语言学,2022,9(2):81-95.
2李琴,裴平.银行系金融科技发展与商业银行经营效率——基于文本挖掘的实证检验[J].山西财经大学学报,2021,43(11):42-56. 被引量：29
3周静怡,刘伟.纪委参与治理与内控缺陷认定标准“雷同”——基于内部控制评价报告的文本分析[J].山西财经大学学报,2021,43(1):73-84. 被引量：4
4赵丽,路一帆.数字金融促进技术创新研究综述与展望[J].开发性金融研究,2023(4):62-73.
5钱浩祺.环境大数据应用的最新进展与趋势[J].环境经济研究,2020,5(4):152-180. 被引量：11
6王丹丹.出版机构拓展直播电商渠道的思路分析[J].出版发行研究,2021(1):30-35. 被引量：2
7姚加权,冯绪,王赞钧,纪荣嵘,张维.语调、情绪及市场影响:基于金融情绪词典[J].管理科学学报,2021,24(5):26-46. 被引量：80
8赵宸宇,王文春,李雪松.数字化转型如何影响企业全要素生产率[J].财贸经济,2021,42(7):114-129. 被引量：1063
9许雪晨,田侃.一种基于金融文本情感分析的股票指数预测新方法[J].数量经济技术经济研究,2021,38(12):124-145. 被引量：16
10胡丹.金融学文本大数据挖掘方法分析[J].互联网周刊,2022(9):12-14. 被引量：1

二级引证文献1322

1谢康,胡杨颂,刘意,罗婷予.数据要素驱动企业高质量数字化转型——索菲亚智能制造纵向案例研究[J].管理评论,2023,35(2):328-339. 被引量：23
2宁致远,唐松,吴非.安于一隅还是守正创新——保险机构调研与企业数字化转型[J].中国会计评论,2023,21(1):133-154.
3吴花平,马铭,曾建光,范群林.媒体情绪与企业内部控制质量——基于文本内容分析的经验证据[J].中国会计评论,2023,21(1):105-132.
4辛晓慧,欧国立,朱若愚.企业数字化转型、制度环境与股权融资成本[J].制度经济学研究,2023(4):117-143. 被引量：1
5牛华勇,窦一轩,夏晓雪.国内外财经文本分析研究综述[J].语料库语言学,2022,9(2):81-95.
6闻岳春,黄庆成.数字化转型与股价信息效率:效应与机制[J].新金融,2023(7):52-59.
7牟凡.对数字化转型影响生产与消费的辩证思考[J].现代营销(上),2023(8):114-116.
8高延歌.企业数字化转型与年报可读性:治理效应抑或噪音效应?[J].投资研究,2024,43(2):121-144.
9夏喆,张永健.数字化转型如何影响企业资源配置效率——基于成本粘性视角[J].投资研究,2023,42(5):93-108. 被引量：5
10乔鹏程,张岩松.区块链、企业数字化转型与融资约束[J].投资研究,2023,42(2):56-74. 被引量：4

1陈天池.初中信息技术游戏化教学的应用探究[J].教育信息化论坛,2019,3(10):193-193. 被引量：2
2刘磊,林树,李芸婧.市场态势、股权质押与业绩预告披露策略[J].南京社会科学,2019,0(12):34-40. 被引量：2
3朱孟婷.中国煤炭采选业投资组合收益率预测研究——基于CAPM与Fama-French三因素模型[J].荆楚理工学院学报,2019,34(5):41-47. 被引量：1
473岁电商模特的“杭漂”生活[J].现代妇女,2020,0(5):52-53.
5李伟,李卫东,邹鹤峰.中小板上市公司的财务报告与业绩预告差异的实证分析--从墨菲定律现象的视角[J].科技创新与生产力,2020,0(4):13-17.
6董洁芳,屈学书,邓椿.基于网络文本分析的旅游目的地形象差异研究——以运城市为例[J].未来与发展,2020,0(3):106-112. 被引量：3
7杨秀璋,夏换,于小民,杨琪,汪瑜斌.基于多视图融合的论文自动分类方法研究[J].现代电子技术,2020,43(8):120-124. 被引量：4
8李明琦.网页搜索排序模型研究[J].智能计算机与应用,2020,10(2):348-352.
9朱元璞,马倩,孙媛媛.基于网络文本的康养旅游体验研究[J].咸阳师范学院学报,2020,35(2):61-66. 被引量：1
10张骋.元新闻:互联网时代的主流新闻形态——一种元符号视角的分析[J].中外文化与文论,2018,0(3):26-34.

经济学动态

2020年第4期

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...

;

使用帮助返回顶部