期刊文献+
共找到20篇文章
< 1 >
每页显示 20 50 100
基于分位数Granger因果的网络情绪与股市收益关系研究 被引量:27
1
作者 许启发 伯仲璞 蒋翠侠 《管理科学》 CSSCI 北大核心 2017年第3期147-160,共14页
行为金融学理论认为,股票市场的价格变动除受宏观基本因素影响外,还在很大程度上受众多个体投资者或噪音交易者行为左右。中国股票市场拥有庞大的个人投资者群体,且股民群体与网民群体之间具有高度耦合性,使用网络情绪等信息能够探索中... 行为金融学理论认为,股票市场的价格变动除受宏观基本因素影响外,还在很大程度上受众多个体投资者或噪音交易者行为左右。中国股票市场拥有庞大的个人投资者群体,且股民群体与网民群体之间具有高度耦合性,使用网络情绪等信息能够探索中国股市收益变动基本规律。为揭示个体投资者行为对股市收益的影响,以个体投资者情绪为视角,以网络环境中个体投资者的情绪信息为切入点,检验投资者情绪与股市收益的关联关系,评估网络情绪信息价值。使用中文文本情感分析方法,从新浪微博文本中提取出网络情绪时间序列;分别运用均值Granger因果和分位数Granger因果检验方法,探讨网络情绪波动与股市收益之间是否存在因果关系;将股票市场发展阶段进行细致划分,研究不同市场阶段下网络情绪波动与股市收益之间的因果关系。对沪深300指数收益进行实证研究,结果表明,尽管在均值框架下网络情绪波动与股市收益之间因果关系并不明显,但基于分位数Granger因果分析却发现两者在极端分位点区间处存在广泛且显著的因果关系。数据显示,在40个因果关系检验中,分位数Granger因果检验的因果关系发现了23个显著的因果关系,发现率为57.5%,远高于均值Granger因果检验的7.5%。此外,股市收益受到网络情绪波动影响的程度和方式在不同市场阶段下有所不同。研究结果具有一定的理论意义和应用价值。在一些特定分位点区间网络情绪波动对股市收益存在显著因果关系影响,这为在特定条件下股市收益的可预测性提供了佐证。网络情绪能够预测股市收益的尾部(上尾或下尾)行为特征,可以为金融风险防范提供决策参考。研究结果为股票市场的定价、收益预测和波动率估计等相关研究提供了新的研究思路,也为网络情绪信息使用提供了新的方向。 展开更多
关键词 分位数回归 GRANGER因果检验 网络情绪 股市收益 微博数据
原文传递
面向微博的灾害类事件地址提取与空间定位方法——以地震事件为例 被引量:8
2
作者 李想 刘纪平 +1 位作者 罗安 王勇 《测绘与空间地理信息》 2018年第4期128-131,共4页
针对微博中数量庞大、更新及时的灾害类事件信息,首先利用前置后缀特征词与地址构成规则相结合的方法,高效地提取灾害类事件中地址信息,然后在分析多种网络地图服务商的地理编码API接口的基础上,基于同一事件的空间位置统计推理,实现灾... 针对微博中数量庞大、更新及时的灾害类事件信息,首先利用前置后缀特征词与地址构成规则相结合的方法,高效地提取灾害类事件中地址信息,然后在分析多种网络地图服务商的地理编码API接口的基础上,基于同一事件的空间位置统计推理,实现灾害类事件空间定位与地图化表达。最后以垂直搜索获取的2017年微博地震灾害事件为例,通过实验发现,本文提出的面向微博的灾害类事件地址提取与空间定位方法具有较高的地理编码准确度。 展开更多
关键词 地址提取 事件定位 微博数据
下载PDF
微博非结构化数据的情绪挖掘方法及在旅游预测中的应用 被引量:8
3
作者 梅梅 刘颖 +1 位作者 唐小利 张玢 《情报资料工作》 CSSCI 北大核心 2019年第1期64-72,共9页
针对中文微博数据非结构化特点,文章从相关维、状态维、主题维、情绪维四个维度提出了一套标准的微博情绪挖掘方法,通过情绪词典生成、倾向性分析、发布者影响力测度、情绪指标构建等关键环节,能够有效地从海量微博数据中提炼用户的观... 针对中文微博数据非结构化特点,文章从相关维、状态维、主题维、情绪维四个维度提出了一套标准的微博情绪挖掘方法,通过情绪词典生成、倾向性分析、发布者影响力测度、情绪指标构建等关键环节,能够有效地从海量微博数据中提炼用户的观点倾向性,形成量化的情绪指标。应用该方法体系对旅游市场进行实证分析,发现带有正向情绪的微博通过口碑效应对于下一期旅游客流量存在显著的积极影响,在传统时间序列模型中引入正向微博情绪指标能够显著提高预测精度;通过对负面微博数据进行分主题挖掘,能够分析不同主题下游客抱怨的原因,形成数据驱动的游园改进策略,提高旅游管理的精准性和效率。 展开更多
关键词 微博数据 情绪挖掘 旅游市场 预测
原文传递
微博用户的中国传统节日感知及区域差异研究 被引量:7
4
作者 周佳颖 王俊蓉 张景秋 《地球信息科学学报》 CSCD 北大核心 2019年第1期77-85,共9页
随着智能移动终端和社交网络应用的普及,越来越多的人愿意通过社交网络平台进行交流和表达自己的情感,因此产生了大量含有地理位置、文本内容等多种信息的用户生成数据,为大数据时代的城市研究及特定时空间内个体感知和行为活动研究提... 随着智能移动终端和社交网络应用的普及,越来越多的人愿意通过社交网络平台进行交流和表达自己的情感,因此产生了大量含有地理位置、文本内容等多种信息的用户生成数据,为大数据时代的城市研究及特定时空间内个体感知和行为活动研究提供新的数据源。本文基于2012-2014年约54万条微博用户数据,探测民众对包括春节、元宵节、清明节、端午节和中秋节在内的中国传统节日的情感表达和关注热点,以期发现在城市化与全球化影响下,人们对中国传统节日的认知变化和区域特征。通过Python 3.6进行词频分析及LDA主题模型分析可知:(1)春节是中国人主题感知最为强烈的节日,且多为对新年美好祝愿的表达,其次是中秋节,以回家团聚为主,另外情人节也成为一个显性的节日;(2)传统节日期间,出行方式以飞机和汽车为主,机场和高速成为与节日活动密切相关的场所;(3)共识性岁时习俗整体感知较好,但各地域特色节庆活动及饮食习俗在表现形式上有所差异,且差异在逐渐减小;(4)词频分析较好地反映了微博用户对中国传统节日的普遍感知及具有地方特色的区域差异,而LDA主题模型分析能够反映一定的传统节日主题聚类结果,但对不同节日的主题聚类效果并不十分明显。 展开更多
关键词 传统节日 区域差异 词频分析 主题分析 微博数据
原文传递
基于微博文本数据的灾害信息公众关注分析--以河南暴雨洪涝事件为例
5
作者 赵晓丽 苏筠 《自然灾害学报》 CSCD 北大核心 2024年第3期17-27,共11页
面对未来暴雨洪涝灾害风险挑战,加强关于风险沟通、公众参与的研究,提升风险管理有效性,将有助于减轻风险。社交媒体凭借其强大的信息传播能力,在灾害管理中日益重要。基于从新浪微博“河南暴雨”关键词爬取的微博信息98078条,通过文本... 面对未来暴雨洪涝灾害风险挑战,加强关于风险沟通、公众参与的研究,提升风险管理有效性,将有助于减轻风险。社交媒体凭借其强大的信息传播能力,在灾害管理中日益重要。基于从新浪微博“河南暴雨”关键词爬取的微博信息98078条,通过文本提取、统计和共现网络分析公众关注度的变化情况,探究公众对不同灾害信息关注的差异以及关注倾向。研究结果表明:河南暴雨洪涝灾害事件演化过程分为潜伏期、爆发期、持续期和淡化期4个阶段,公众关注度的大小在灾害初期受致灾因子强度的影响,致灾因子达到一定强度并造成严重灾情时,会引起公众广泛而持续的关注。暴雨洪涝自然灾害事件的微博文本主要呈现致灾因子、灾害影响和响应3个主题,本事件根据信息内容可细分为26个类别,公众对不同时期、不同类型的灾害信息的关注热度不同,潜伏期公众最为关注山洪等致灾因子的预警信息,但关注度较低。在爆发期、持续期和淡化期,内涝成为公众最为关注的致灾因子,人员伤亡和交通受阻为公众最为关注的灾害影响,灾民网上求救、捐款捐物和现场救援为公众最为关注的响应行为。本次事件出现人员伤亡、交通受阻、经济损失、能源通讯、生产生活和次生灾害6个凝聚子群,其中人员伤亡、灾民网上求助、现场救援和捐款捐物作为本次暴雨洪涝灾害的核心事件,构成了最核心的“人员伤亡”主题的凝聚子群。研究成果为政府发布灾害信息提供参考和改进建议。 展开更多
关键词 河南 暴雨洪涝 微博数据 公众关注 共现网络分析
下载PDF
微博数据与地理信息数据结合的洪涝淹没概率估计方法
6
作者 崔志美 黄维 +1 位作者 黄志都 邬蓉蓉 《水力发电》 CAS 2024年第9期22-29,43,共9页
近年来极端天气使持续性强降雨频发,导致洪水灾害变得更加频繁和不规律,严重影响到人民安全及经济建设,而评估洪涝的淹没概率能加强洪涝灾害的应急管理能力。传统的遥感数据受限于重返周期及气象条件,水文模型则受限于数据输入与参数设... 近年来极端天气使持续性强降雨频发,导致洪水灾害变得更加频繁和不规律,严重影响到人民安全及经济建设,而评估洪涝的淹没概率能加强洪涝灾害的应急管理能力。传统的遥感数据受限于重返周期及气象条件,水文模型则受限于数据输入与参数设置。在上述数据与模型方法的局限性下,利用社交媒体——微博数据具有时效性强且海量的特点,以2021年“7·20”河南暴雨事件为例,提出了一种通过融合数字高程模型及其衍生数据、降雨数据、水系数据与灾中微博文本数据来估算灾中洪水淹没概率分布的方法。利用反距离衰减函数,根据水深点生成实时更新的淹没概率图,然后采用高斯函数对地理信息数据进行权重分配,得到综合叠加后的最终空间连续淹没概率图。结果显示,在雷达影像验证中,获得92.75%的准确率;在官媒、微博图片信息的验证中,获得93.33%的准确率。 展开更多
关键词 洪涝淹没 概率估计 微博数据 反距离 高斯
下载PDF
基于微博数据的西安市空间意象研究
7
作者 唐园园 连华 王菲 《重庆建筑》 2024年第3期30-33,共4页
在城市空间规划数字化转型趋势下,结合大数据对“城市意象”研究方法进行不断创新。为进一步优化西安空间结构,综合评估各街道发展潜力,强化“西安经验”,该文以西安市一年微博签到数据为例,在相关学者对城市意象因子分类的基础上,将意... 在城市空间规划数字化转型趋势下,结合大数据对“城市意象”研究方法进行不断创新。为进一步优化西安空间结构,综合评估各街道发展潜力,强化“西安经验”,该文以西安市一年微博签到数据为例,在相关学者对城市意象因子分类的基础上,将意象因子分为城市环境、文化活动与自然山水三大类。进行词频统计及空间聚类分析,挖掘城市各街道特色意象因子。同时从文化、生态、经济三方面选取8个空间意象影响因子,使用地理探测器对空间意象驱动因子作进一步分析,并结合各街道发展现状,提出相关优化策略。 展开更多
关键词 城市意象 微博数据 空间分析 地理探测器 西安
下载PDF
基于微博数据的京津冀地区非遗文化公众感知特征研究 被引量:1
8
作者 黄文龙 张景秋 《北京联合大学学报》 CAS 2023年第3期49-56,共8页
利用2014年和2019年的微博数据,通过词频分析、情感分析和语义网络分析,探析京津冀地区公众对于非物质文化遗产的感知特征,结果表明:1)公众对非遗文化感知在2014—2019年呈现增强趋势,感知的深度和广度不断扩展,呈现由北京和天津双中心... 利用2014年和2019年的微博数据,通过词频分析、情感分析和语义网络分析,探析京津冀地区公众对于非物质文化遗产的感知特征,结果表明:1)公众对非遗文化感知在2014—2019年呈现增强趋势,感知的深度和广度不断扩展,呈现由北京和天津双中心向京津冀全域扩散、由剧场这类单一类型场所向多种文化场所扩散的趋势,非遗文化类别从传统戏剧和曲艺为主向传统舞蹈、传统技艺、民俗、传统美术等多种非遗文化类别扩展;2)公众情感的正负趋向分析可以为非遗文化活动的精细化管理提供以人为本的视角,公众情感态度总体是积极正向的,正负情绪趋向主要受非遗项目认知、周边配套设施便利程度、现场体验等方面的影响;3)丰富多样的非遗项目既丰富了非遗文化活动,也在一定程度上促进了京津冀各地之间,特别是北京与津冀之间的交流与空间联系,与地理学上的距离衰减规律不一致,体现了文化联系视角下的京津冀区域关联的差异特点,而非遗文化活动与文保单位或文化遗产地的关联,表明对物质和非物质文化遗产的整体性保护意识在增强。 展开更多
关键词 非物质文化遗产 公众感知 微博数据 京津冀协同发展 空间联系
下载PDF
基于微博数据的桂林旅游流时空变化分析 被引量:4
9
作者 白刚 沈雨樨 高璐 《西南大学学报(自然科学版)》 CAS CSCD 北大核心 2021年第9期71-80,共10页
利用爬虫技术获取微博旅游数据,对2016-2019年到访桂林市漓江风景区、阳朔风景区的国内旅游流时空变化进行分析.结果表明:(1)漓江及阳朔旅游流的时间分布不均,两地游客时间集中指数显示旅游季节性明显;2016-2019这4年漓江各客源省份游... 利用爬虫技术获取微博旅游数据,对2016-2019年到访桂林市漓江风景区、阳朔风景区的国内旅游流时空变化进行分析.结果表明:(1)漓江及阳朔旅游流的时间分布不均,两地游客时间集中指数显示旅游季节性明显;2016-2019这4年漓江各客源省份游客时间集中指数明显高于阳朔,漓江游客量季节变化程度远高于阳朔.(2)漓江和阳朔客源组成显著不同,数据分析显示两地游客重叠度极低;漓江旅游流变异系数变化较大,客源地游客量波动较大,稳定性较差.阳朔旅游流变异系数基本保持稳定,年度间旅游流空间差异变化不大,客源地游客量保持相对稳定.(3)两地旅游流都具有显著的空间自相关性,但聚集和异常区域略有不同;漓江客流高-高和低-低聚集区均不稳定,数量和区域变化较为明显,没有显著的趋势变化;阳朔客流高-高聚集区呈现微弱的扩张趋势,低-低聚集区呈现较明显的扩张趋势.在空间分布上,两地的旅游客流最大值分布在两广地区,北京是第二大客源地,其次为上海;总体上看,中部地区(湖北、河南)以及华东地区(浙江、江苏、山东)旅游客流量大于除两广和北京、上海的其他省市.(4)漓江游客量呈现缓慢的增长趋势,波动较小,游客量增长率最高的省份为青海、内蒙古、贵州及海南;阳朔游客量波动比较剧烈,总体呈现平稳略微下降趋势,增长率最高的省份为青海.(5)两地旅游流和客源地距离存在显著负相关,旅游客流量随着距离增加而显著减少.漓江及阳朔旅游流与人均可支配收入之间没有显著的相关性,原因在于来桂林旅游平均消费在城镇居民可支配收入中占比较小.(6)不考虑节事活动引发的暂时性旅游流爆发,桂林漓江及阳朔旅游流变化与温度变化曲线基本吻合,符合旅游气候适宜度分析结果,随着温度增加旅游人数上升;而节事活动的引入可以明显提升客流量. 展开更多
关键词 微博数据 旅游流 时空变化 桂林 漓江 阳朔
下载PDF
微博数据在生态环境监测中的潜力研究——以成渝城市群为例 被引量:3
10
作者 陈子娴 周廷刚 +1 位作者 李洪忠 潘一铭 《地理与地理信息科学》 CSCD 北大核心 2021年第4期64-71,共8页
生态环境与人类生活息息相关,关注公众对生态环境的态度是生态环境监测的重要组成部分。日益丰富的社交媒体数据为获取大范围的公众反馈信息提供了快捷渠道。该文以成渝城市群为研究区,基于微博这一典型社交媒体数据,应用情感分析法并... 生态环境与人类生活息息相关,关注公众对生态环境的态度是生态环境监测的重要组成部分。日益丰富的社交媒体数据为获取大范围的公众反馈信息提供了快捷渠道。该文以成渝城市群为研究区,基于微博这一典型社交媒体数据,应用情感分析法并与遥感生态指数(RSEI)分析结果进行对比,从不同尺度探讨微博数据在生态环境监测中的潜力。结果表明:微博数据能够准确反映2010-2018年成渝城市群生态环境的演变,与RSEI的变化趋势一致,且对于区域内各城市,基于微博数据的生态情感指标与RSEI的灰色关联度较高;此外,微博数据能够反映局部区域的生态环境问题,如垃圾污染、绿化破坏和乱焚烧现象等,是对城市尺度生态环境监测的有效补充。微博数据在生态状况趋势评价、生态环境问题阐述和环境问题区域定位等方面具有应用潜力,可契合环境问题管理、完善生态环境监测体系和评价体制等多项应用需求,同时可作为遥感的辅助手段,为生态环境领域提供借鉴。 展开更多
关键词 微博数据 生态环境监测 潜力 RSEI 成渝城市群
下载PDF
微博时空大数据疫情发展过程可视化与分析技术研究 被引量:2
11
作者 谈帅 罗尊骅 《现代测绘》 2020年第3期1-4,共4页
2019年末,湖北地区暴发新型冠状病毒疫情,对人民生活和国内经济造成较大的负面影响。疫情期间社交媒体尤为活跃,大量用户通过它关注疫情的发展趋势、参与疫情相关话题的讨论,这也产生了大量带有时间、空间属性的时空大数据。针对新浪微... 2019年末,湖北地区暴发新型冠状病毒疫情,对人民生活和国内经济造成较大的负面影响。疫情期间社交媒体尤为活跃,大量用户通过它关注疫情的发展趋势、参与疫情相关话题的讨论,这也产生了大量带有时间、空间属性的时空大数据。针对新浪微博,采用自动化方法创建了疫情时空数据库;实现了基于WebGL与GIS技术微博数据的动态可视化表达;完成了基于微博话题的分析。最终构建了一套快速、可复用的疫情相关微博数据采集-处理-可视化-分析的技术流程。利用该技术流程,以疫情话题数量暴发前期为时间区间,实现了疫情微博数据动态可视化,分析了话题热度的变化过程。 展开更多
关键词 新型冠状病毒疫情 微博数据 时空数据 动态可视化
下载PDF
基于微博数据的中国人群气温感知时空分异特征及影响因素分析
12
作者 翁慧娴 马廷 《地球信息科学学报》 CSCD 北大核心 2022年第10期2058-2070,共13页
极端气温事件发生频率的增加对人群的健康带来了很大的影响,深入理解人群对气温变化的感知特征有助于提高应对极端气温事件的预警、适应和管理水平。针对传统调查数据在样本量和覆盖度等方面的不足,本文使用基于微博的社交媒体数据来研... 极端气温事件发生频率的增加对人群的健康带来了很大的影响,深入理解人群对气温变化的感知特征有助于提高应对极端气温事件的预警、适应和管理水平。针对传统调查数据在样本量和覆盖度等方面的不足,本文使用基于微博的社交媒体数据来研究人群对气温感知的定量特征。研究通过建立气温关注度、敏感性和耐受性等指标,调查了中国2017年31个城市的人群对气温感知的空间格局变化与局部变异性,分析了不同季节和不同群体对气温感知的差异性与影响因素。分析结果表明:人群对气温的感知表现出显著的纬度梯度规律性,纬度每下降1°,人群平均的热耐受性增强0.42 ℃,冷耐受性降低0.31℃,冷敏感性增强0.51;人群对气温的感知在不同季节、不同群体之间也表现出显著的差异性,反季的异常气温更易引起人群对于气温变化的关注,青少年与女性群体对冷更为敏感;气温感知特征的区域差异性与气候分区紧密相关,温带地区的人群比热带显示出更强的热耐受性,而热带地区的人群具有更显著的气温敏感性。本文研究结果可以为理解大尺度上人群对气温变化感知的基本特征和分异规律提供新的规律发现与证据支持。 展开更多
关键词 气温变化 人群感知 微博数据 时空分异 耐受性 敏感性 群体 影响因素
原文传递
基于微博数据分析的公共服务质量研究——以上海市住房保障为例 被引量:1
13
作者 魏程瑞 王郁 《东北大学学报(社会科学版)》 CSSCI 北大核心 2021年第5期63-72,共10页
基于公共服务质量的属性与特质,引入微博数据的分析方法,开发出了住房保障服务质量的概念性整体分析框架。研究发现,住房保障服务质量中存在的问题具有明显的“核心—边缘”结构。价值维度公平性、过程维度责任性是影响住房保障服务质... 基于公共服务质量的属性与特质,引入微博数据的分析方法,开发出了住房保障服务质量的概念性整体分析框架。研究发现,住房保障服务质量中存在的问题具有明显的“核心—边缘”结构。价值维度公平性、过程维度责任性是影响住房保障服务质量的关键要素。安置房和经适房服务中“价值—过程”维度的质量问题更为显著,而在廉租房和公租房服务中“功能—结果”维度要素发挥了较为关键的作用。不同空间区域中的质量问题同样具有一定的差异性。因此,以空间差异和房型差异为切入点,精准施策、精准保障,应成为政府下一步住房保障工作的焦点。 展开更多
关键词 住房保障服务质量 公共服务质量 微博数据 情感分析
下载PDF
基于用户权威度与热度分配聚类的微博热点发现 被引量:1
14
作者 曹春萍 黄伟 《计算机工程与设计》 北大核心 2020年第3期664-669,共6页
针对微博热点算法未合理进行微博文本和微博用户相结合的问题,提出基于用户权威度与热度分配聚类的微博热点挖掘算法。对微博文本进行分词,得到特征词并使用改进TF-IDF为特征词分配权重,通过权重大小进行降序排序,对微博文本进行聚类分... 针对微博热点算法未合理进行微博文本和微博用户相结合的问题,提出基于用户权威度与热度分配聚类的微博热点挖掘算法。对微博文本进行分词,得到特征词并使用改进TF-IDF为特征词分配权重,通过权重大小进行降序排序,对微博文本进行聚类分析得到主题类簇,使用ULRank算法计算用户权威度,综合特征词权重、用户权威度和引用关系为特征词分配热度,得到特征词的热度排序结果,获取特征词对应聚类类簇的大概主题即热点话题。实验结果表明,该方法的吞吐量、运行效率、准确率及F值表现较好,能够较全面地反映当前的热点话题。 展开更多
关键词 微博数据 特征权重 文本聚类 用户权威度 热度分配
下载PDF
基于微博数据的城市形象评价方法
15
作者 柯雨淋 杨中华 +2 位作者 沈雨涵 叶健宏 周凇航 《信息与电脑》 2022年第1期182-185,共4页
现有城市形象评价方法大都依赖于评价者主观提出的指标体系,针对此现象,提出一套以微博数据为基础的城市形象评价方法,在一定程度上提升评价过程的客观性与可重复性。首先对获取到的城市数据预处理后,运用K-Means聚类算法得到城市形象... 现有城市形象评价方法大都依赖于评价者主观提出的指标体系,针对此现象,提出一套以微博数据为基础的城市形象评价方法,在一定程度上提升评价过程的客观性与可重复性。首先对获取到的城市数据预处理后,运用K-Means聚类算法得到城市形象的评价类别;其次采用LDA主题模型对有效类别总结主题、提取二级指标操作,利用情感分析技术计算目标城市情感得分即为城市形象评分;最后以武汉市和苏州市为例,利用该方法评价了城市形象。 展开更多
关键词 城市形象 情感分析 微博数据 K-MEANS聚类 LDA主题模型
下载PDF
基于层次聚类法的微博新闻用户聚类研究 被引量:1
16
作者 刘惠 《现代计算机》 2021年第21期90-94,共5页
随着微博平台的广泛流行,越来越多的新闻媒体通过微博发布新闻资讯。对微博新闻用户进行聚类研究,可以帮助新闻媒体结合自身特点,针对性发挥自身媒体作用,提供更好的内容推送。首先构建基于层次聚类法的微博新闻用户聚类模型,运用数据... 随着微博平台的广泛流行,越来越多的新闻媒体通过微博发布新闻资讯。对微博新闻用户进行聚类研究,可以帮助新闻媒体结合自身特点,针对性发挥自身媒体作用,提供更好的内容推送。首先构建基于层次聚类法的微博新闻用户聚类模型,运用数据采集软件获取用户数据,再采用SPSS软件对其进行聚类分析和聚类结果的描述统计。根据聚类结果结合相关特征值的现实含义,将微博新闻用户分为三大类,并针对各类媒体特征提出指导建议。 展开更多
关键词 层次聚类分析 SPSS 用户聚类 微博数据挖掘
下载PDF
基于微博数据的应用研究综述 被引量:18
17
作者 刘晓娟 尤斌 张爱芸 《情报杂志》 CSSCI 北大核心 2013年第9期39-45,共7页
微博数据已经成为学术界重要的数据来源,近年来国内外学者开始利用大量开放的微博数据进行社会科学、企业营销、医疗卫生、政府建设等多方面的研究。从数据来源及获取方式、数据选择及其处理办法和研究结果的应用三个方面对国内外研究... 微博数据已经成为学术界重要的数据来源,近年来国内外学者开始利用大量开放的微博数据进行社会科学、企业营销、医疗卫生、政府建设等多方面的研究。从数据来源及获取方式、数据选择及其处理办法和研究结果的应用三个方面对国内外研究情况进行了总结,并阐述了目前研究存在的局限性。 展开更多
关键词 微博 大数据 TWITTER 新浪微博 可视化数据集
下载PDF
基于Python的微博用户关系挖掘研究 被引量:15
18
作者 林晓丽 胡可可 胡青 《情报杂志》 CSSCI 北大核心 2014年第6期144-148,共5页
以新浪微博平台为研究对象,利用Python语言和Web自动化工具通过平台提供的应用接口实现自动认证和微博数据的自动抓取,将其转换成需要的数据格式之后,运用深度优先搜索算法进行分析,获得用户的关系并可视化。此外,采用改进的K-means算... 以新浪微博平台为研究对象,利用Python语言和Web自动化工具通过平台提供的应用接口实现自动认证和微博数据的自动抓取,将其转换成需要的数据格式之后,运用深度优先搜索算法进行分析,获得用户的关系并可视化。此外,采用改进的K-means算法进行主题聚类,实验结果表明,改进后的算法更加准确有效。最后,根据用户信息生成兴趣相关性矩阵,采用改进后的K-means算法分析微博用户关注兴趣的相似性。 展开更多
关键词 新浪微博 用户关系 数据挖掘 聚类分析
下载PDF
气候与情绪的关系:基于微博大数据研究
19
作者 李小文 张军 《临床心身疾病杂志》 CAS 2024年第1期105-111,共7页
目的本文旨在系统探究气候变化与人类情绪之间的相关性。方法将气候数据与情绪数据纳入逻辑回归模型,并探讨二者的相互作用。具体而言,本研究通过创新运用新浪微博数据,选取了中国五个代表性城市为研究对象,收集并分析了这些城市中与气... 目的本文旨在系统探究气候变化与人类情绪之间的相关性。方法将气候数据与情绪数据纳入逻辑回归模型,并探讨二者的相互作用。具体而言,本研究通过创新运用新浪微博数据,选取了中国五个代表性城市为研究对象,收集并分析了这些城市中与气候相关的微博文本。通过应用自然语言处理和机器学习技术,对文本数据进行了情感计算,以抽取情绪数据。结果研究发现气候变化与人类情绪之间存在复杂的非线性关系。一系列气候要素如温度、湿度、日照、风速和降水等共同定义了一个影响人类情绪的气候舒适区间。不同气候类型对情绪的影响存在差异(P<0.05或0.01),日照和湿度对情绪的影响最为显著,其次是气温和降水,而风速的影响相对较小。结论气候与情绪之间的关系较为复杂,本研究丰富了气候与情绪相关领域的理论研究,同时也为提升公众的心理健康水平提供了理论支持。 展开更多
关键词 情绪 气候 微博大数据 自然语言处理 机器学习 情感计算 逻辑回归
下载PDF
气候因子的情绪效应
20
作者 李小文 胡文婷 何元庆 《医学与哲学》 北大核心 2023年第17期56-60,共5页
研究耦合了逐日气候数据和情绪数据,使用关键词分析技术和多项式逻辑回归模型考察气候与情绪之间的关联。情绪数据创新性地使用微博大数据替代传统的问卷数据,以全国五个典型城市为样本,爬取这五座城市在新浪微博上关于气候内容的文本,... 研究耦合了逐日气候数据和情绪数据,使用关键词分析技术和多项式逻辑回归模型考察气候与情绪之间的关联。情绪数据创新性地使用微博大数据替代传统的问卷数据,以全国五个典型城市为样本,爬取这五座城市在新浪微博上关于气候内容的文本,通过自然语言处理和机器学习得到情绪数据。研究发现:气候与情绪之间存在着复杂的曲线关系;不同气候因子对情绪的影响力是有差异的,综合考虑关键词TF-IDF权重、显著性指标和偏回归系数权重等,得出气候因子的影响力中日照和湿度对情绪的影响力最大,气温和降水其次,风速最小。 展开更多
关键词 微博大数据 气候因子 情绪识别 情绪效应
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部