摘要
文本是一种典型的非结构化数据,属于大数据范畴。文本数据挖掘可以发挥其独有的优势,从全体文本中挖掘潜在信息,数据处理的规模与速度都大为扩展;找到文本之间的内在联系,发现新的规律、结论,研究更加丰富和深入。本文基于文本数据挖掘方法,通过对最近3年保险营销动态新闻的采集与分析,考察保险行业营销的特征与变化及其与新冠肺炎疫情、保费业绩等的关联,从而为保险行业研究提供一种新思路、新方法。参照本文技术路线与具体步骤,特别是R语言工具包和函数的运用,基本可以复制进行类似的文本挖掘研究。
出处
《保险理论与实践》
2021年第9期141-152,共12页
Insurance Theory & Practice