游客微博主题情感分析方法比较研究被引量：12

Comparison of Tourist Thematic Sentiment Analysis Methods Based on Weibo Data

下载PDF

导出

摘要针对饮食、娱乐、购物、景观、交通和住宿6个旅游主题,基于机器学习方法,开展游客微博主题情感分析方法比较研究。以人工标注的53140条赴日游客微博为数据基础,应用两种机器学习模型开展建模实验,并分析不同特征对建模效果的影响。实验结果显示,两种模型的建模效果良好,适用于游客微博主题情感分析,其中最大熵模型效果略优于支持向量机。研究还表明,在词特征的基础上引入表情符号和主题词进行特征扩展,可以提高模型的建模效果。 Six tourism themes, diet, entertainment, shopping, view, transportation, and accommodation, are selected for thematic sentiment analysis. 53140 Weibo items published by Chinese tourists in Japan are collected and manually labeled as the case study dataset. Maximum Entropy model and Support Vector Machine are adopted. The training results are both fairly good, where the resulting Maximum Entropy model prevails slightly. It can be concluded that machine learning models are reasonably feasible in tourist thematic sentiment analysis. Moreover, the experiment also shows that the models can be improved by introducing emoticon icons and thematic words as supplements to traditional word features.

作者刘思叶田原冯雨宁庄育龙 LIU Siye;TIAN Yuan;FENG Yuning;ZHUANG Yulong(Institute of Remote Sensing and Geographical Information System,Peking University,Beijing 100871)

机构地区北京大学遥感与地理信息系统研究所

出处《北京大学学报（自然科学版）》 EI CAS CSCD 北大核心 2018年第4期687-692,共6页 Acta Scientiarum Naturalium Universitatis Pekinensis

基金国家重点研发计划(2018YFB0505500 2018YFB0505504) 测绘遥感信息工程国家重点实验室开放研究基金((16)重02)资助

关键词主题情感分析游客微博最大熵模型支持向量机 thematic sentiment analysis Weibo of tourists Maximum Entropy Support Vector Machine （SVM）

分类号 F590 [经济管理—旅游管理]

引文网络
相关文献

参考文献9

1周胜臣,瞿文婷,石英子,施询之,孙韵辰.中文微博情感分析研究综述[J].计算机应用与软件,2013,30(3):161-164. 被引量：80
2周立柱,贺宇凯,王建勇.情感分析研究综述[J].计算机应用,2008,28(11):2725-2728. 被引量：73
3涂海丽,唐晓波.基于在线评论的游客情感分析模型构建[J].现代情报,2016,36(4):70-77. 被引量：43
4中国旅游研究院著..中国出境旅游发展年度报告 2016版[M].北京:旅游教育出版社,2016:179.
5张思豆,李君轶.基于微博大数据的游客情感与空气质量关系研究——以西安市为例[J].陕西师范大学学报（自然科学版）,2016,44(4):102-107. 被引量：7
6曹宇,王名扬,贺惠新.情感词典扩充的微博文本多元情感分类研究[J].情报杂志,2016,35(10):185-189. 被引量：11
7张珊,于留宝,胡长军.基于表情图片与情感词的中文微博情感分析[J].计算机科学,2012,39(S3):146-148. 被引量：55
8刘宝芹,牛耘,张景.基于统计数据的微博表情符分析及其在情绪分析中的应用[J].计算机工程与科学,2016,38(3):577-584. 被引量：4
9石晶,李万龙.基于LDA模型的主题词抽取方法[J].计算机工程,2010,36(19):81-83. 被引量：47

二级参考文献114

1朱嫣岚,闵锦,周雅倩,黄萱菁,吴立德.基于HowNet的词汇语义倾向计算[J].中文信息学报,2006,20(1):14-20. 被引量：326
2谢彦君.旅游体验的两极情感模型:快乐—痛苦[J].财经问题研究,2006(5):88-92. 被引量：68
3唐师瑶.Q时代的交际想象——QQ表情符号的构形规律及功能初探[J].现代语文（下旬．语言研究）,2006(8):82-83. 被引量：13
4Blei D M, Ng A Y, Jordan M I. Latent Dirichlet Allocation[J]. Journal of Machine Learning Research, 2003, 3: 993-1022. 被引量：1
5Caol J, Li Jintao, Zhang Yongdong, et al. LDA-based Retrieval Framework for Semantic News Video Retrieval[C]//Proc. of Conf. on Semantic Computing. Irvine, California, USA: IEEE Press, 2007. 被引量：1
6Steyvers M, Griffiths T. Probabilistic Topic Models[M]//Landauer T, McNamara D, Dennis S, et al. Latent Semantic Analysis: A Road to Meaning. [S. l.]: MIT Press, 2006. 被引量：1
7Griffiths T, Steyvers M. Finding Scientific Topics[J]. Proceedings of the National Academy of Sciences, 2004, 101 (Suppl. 1 ): 5228-5235. 被引量：1
8Nevada L V. Fast Collapsed Gibbs Sampling for Latent Dirichlet Allocation[C]//Proceedings of the 14th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. New York, USA: ACM Press, 2008: 569-577. 被引量：1
9Li Hang, Yamanishi K. Topic Analysis Using a Finite Mixture Model[J]. Information Processing & Management, 2003, 39(4): 521-541. 被引量：1
10Liu Ying, Ciliax B J, Borges K, et al. Comparison of Two Schemes for Automatic Keyword Extraction from MEDLINE for Functional Gene Clustering[C]//Proc. of IEEE Computational Systems Bioinformatics Conference. Stanford, Califomia, USA: IEEE Press, 2004: 394-404. 被引量：1

共引文献297

1路雪珂.基于文本挖掘方法的微博谣言传播情绪框架研究[J].新闻传播,2020(23):9-10. 被引量：1
2李芮涵,王立明,王昌燕.民俗文化类景区投射形象与感知形象对比分析——以喀什古城景区为例[J].特区经济,2023(9):156-160.
3王曰芬,吴鹏,丁晟春,陈芬.社会舆情分析研究与进展综述[J].情报学进展,2016(1):132-185. 被引量：1
4郭庆,贾郭军.基于tree LSTM的旅游评论情感分析方法研究[J].计算机应用研究,2020,37(S02):63-65. 被引量：6
5吴文海,孙磊,王国志,张霆.基于近义词分配的铁路接触网绝缘子识别与分类[J].电瓷避雷器,2020(1):156-160. 被引量：5
6侯少龙,赵政文.面向微博平台的产品市场分析模型研究[J].微型电脑应用,2011(4):4-6. 被引量：5
7李纲,程明结,寇广增.基于情感倾向识别的汽车评论挖掘系统构建[J].情报学报,2011,30(2):204-211. 被引量：14
8丁菊玲,勒中坚,王根生,周萍.一种面向网络舆情危机预警的观点柔性挖掘模型[J].情报杂志,2009,28(10):152-154. 被引量：40
9王翠波.基于文本情感挖掘的企业技术竞争情报采集模型研究[J].图书情报工作,2010,54(14):75-78. 被引量：10
10赵妍妍,秦兵,刘挺.文本情感分析[J].软件学报,2010,21(8):1834-1848. 被引量：537

同被引文献170

1郑冬冬,赵朋朋,崔志明.Deep Web爬虫研究与设计[J].清华大学学报（自然科学版）,2005,45(S1):1896-1902. 被引量：28
2方美玉,郑小林,陈德人,华艺,施艳.商品评论聚焦爬虫算法设计与实现[J].吉林大学学报（工学版）,2012,42(S1):377-381. 被引量：10
3杨振山,龙瀛,Nicolas DOUAY.大数据对人文—经济地理学研究的促进与局限[J].地理科学进展,2015,34(4):410-417. 被引量：78
4谢彦君.旅游体验的两极情感模型:快乐—痛苦[J].财经问题研究,2006(5):88-92. 被引量：68
5孟涛,王继民,闫宏飞.网页变化与增量搜集技术[J].软件学报,2006,17(5):1051-1067. 被引量：22
6杨建设,李建国.我国民族传统节日体育文化的地理分布特征及其影响因素[J].上海体育学院学报,2007,31(1):44-48. 被引量：14
7邱均平,丁敬达,周春雷.1999—2008年我国图书馆学研究的实证分析(上)[J].中国图书馆学报,2009,35(5):72-79. 被引量：78
8薛扣英,原盛,张心严.基于WFC和MI的主题句提取方法[J].计算机工程,2009,35(20):184-186. 被引量：5
9杨振山,蔡建明.空间统计学进展及其在经济地理研究中的应用[J].地理科学进展,2010,29(6):757-768. 被引量：46
10刘铭,王晓龙,刘远超.基于词汇链的关键短语抽取方法的研究[J].计算机学报,2010,33(7):1246-1255. 被引量：14

引证文献12

1周佳颖,王俊蓉,张景秋.微博用户的中国传统节日感知及区域差异研究[J].地球信息科学学报,2019,21(1):77-85. 被引量：7
2包瑞清.基于机器学习的风景园林智能化分析应用研究[J].风景园林,2019,26(5):29-34. 被引量：9
3朱晓霞,宋嘉欣,张晓缇.基于主题挖掘技术的文本情感分析综述[J].情报理论与实践,2019,42(11):156-163. 被引量：24
4丛丽,何继红.野生动物旅游景区游客情感特征研究——以长隆野生动物世界为例[J].旅游学刊,2020,35(2):53-64. 被引量：30
5刘臣,方结,郝宇辰.融合情感符号的自注意力BLSTM情感分析[J].软件导刊,2020,19(3):39-43. 被引量：3
6李君轶,任涛,陆路正.游客情感计算的文本大数据挖掘方法比较研究[J].浙江大学学报（理学版）,2020,47(4):507-520. 被引量：10
7邓凯凯,陆向艳,阮开栋,许欣,刘峻.基于语境分类与遗传算法的微博情感分析方法[J].软件导刊,2021,20(1):178-184. 被引量：1
8杨戈,杨麓涛.基于爬虫和TFIDF-NB算法的微博情感分析[J].电子技术应用,2021,47(4):59-62. 被引量：6
9常建霞,李君轶.新冠肺炎疫情和公众焦虑情绪的时空分异研究——基于微博数据的分析[J].人文地理,2021,36(3):47-57. 被引量：15
10周伊萌,彭惠军,章艺.基于网络文本情感分析的民宿顾客体验研究——以浙江省白金级民宿为例[J].衡阳师范学院学报,2021,42(6):28-34. 被引量：1

二级引证文献103

1张振刚,罗泰晔.基于在线评论数据挖掘和Kano模型的产品需求分析[J].管理评论,2022,34(11):109-117. 被引量：11
2张庆芳,徐红罡.野生动物观赏旅游者的敬畏感体验:基于斯里兰卡大象旅游的实证研究[J].中国生态旅游,2021,11(5):705-719. 被引量：1
3曾金,张耀峰,黄新杰,黄廷海.面向用户评论的主题挖掘研究——以美团为例[J].情报科学,2022,40(11):78-84. 被引量：7
4郜童童,刘文泽,孟斌,黄松,陈思宇.基于主题模型的文化资源密集区感知研究——以北京门头沟为例[J].北京联合大学学报,2019,33(2):45-55. 被引量：1
5吴康敏,王洋,叶玉瑶,张虹鸥.广州市零售业态空间分异影响因素识别与驱动力研究[J].地球信息科学学报,2020,22(6):1228-1239. 被引量：24
6谭旭,庄穆妮,毛太田,张倩.基于LDA-ARMA混合模型的大规模网络舆情情感演化分析[J].情报杂志,2020,39(10):121-129. 被引量：23
7范滢,季星宏.基于医疗健康类APP的用户满意度研究[J].软件,2020,41(10):38-41. 被引量：2
8李兰友,陆金桂,张建德.SUV车型外观评论文本情感分析[J].汽车工程学报,2021,11(2):93-101. 被引量：2
9张秀丽,李开渝,韩立新.消费崛起与关系嵌入:社交媒体用户春节文化感知新向度[J].当代传播,2021(2):60-63. 被引量：3
10莫纪灿,张青萍.基于网络文本分析的苏州古典园林活化策略研究——以网师园为例[J].资源开发与市场,2021,37(5):629-635. 被引量：12

1徐飞,宋英华.海量食品安全事件下的命名实体识别研究[J].科研管理,2018,39(7):131-138. 被引量：4
2郭杰,张琴,张东方,文检,孙成忠,谢彩香.金荞麦的潜在分布区及生态特征[J].植物保护学报,2018,45(3):489-495. 被引量：10
3江晓萍,徐基良,李建强,徐迎寿,李忠.基于MaxEnt生态位模型分析江西省人与野猪冲突的空间分布[J].森林与环境学报,2018,38(3):334-340. 被引量：15
4行鸿彦,张兰,郭敏.一种新型的雨滴微观特征提取方法[J].计算机应用研究,2018,35(6):1883-1886. 被引量：2
5袁全勇,李春,杨阳.风速时间序列混沌判定方法比较研究[J].热能动力工程,2018,33(7):135-144. 被引量：1
6陈颖,马琳.海水中总氮的测定方法比较研究[J].环境监控与预警,2018,10(4):32-36. 被引量：8
7林元启,陈熙,林绍微.大学生微信表情符号使用中的意义建构研究[J].东南传播,2018(5):87-90. 被引量：1
8陈娟,朱福喜.结合半监督与主动学习的时间序列PU问题分类[J].计算机工程与应用,2018,54(11):116-121.
9谭迎春,杨华侨,邵平悦,王静,白洁.四川省胡颓子属植物资源多样性分析及良种选育[J].四川大学学报（自然科学版）,2018,55(4):889-896. 被引量：2
10刘晨玥,李兵,吴卫星.基于罪名相关成分标注的刑事裁判文书概要信息提取[J].山东科技大学学报（自然科学版）,2018,37(4):92-101. 被引量：3

北京大学学报（自然科学版）

2018年第4期

浏览历史

内容加载中请稍等...

游客微博主题情感分析方法比较研究被引量：12

参考文献9

二级参考文献114

共引文献297

同被引文献170

引证文献12

二级引证文献103

相关作者

相关机构

相关主题

浏览历史

游客微博主题情感分析方法比较研究 被引量：12

参考文献9

二级参考文献114

共引文献297

同被引文献170

引证文献12

二级引证文献103

相关作者

相关机构

相关主题

浏览历史

游客微博主题情感分析方法比较研究被引量：12