基于多维小波聚类的空间文本数据情感分布分析被引量：1

Analyzing Sentiment Distribution with Spatial-textual Data of Multi-dimensional Clustering

导出

摘要【目的】构建基于多维小波聚类的空间文本数据情感分析模型,实现文本情感和空间位置的综合分析。【方法】将Yelp数据集进行整合以构建空间文本数据库,使用基于词典的情感分析方法构建特征向量。提出使用多维小波聚类的混合算法和文本–空间算法两种模型并进行分析。【结果】实验结果验证了使用db2和bior2.2小波基函数的多维小波聚类算法比DBSCAN和K-means算法在空间文本数据挖掘中能识别出更精确的聚类集合,且在十万级至千万级数据聚类中速度最佳。【局限】情感分析部分使用一元语言模型,缺乏对语句层面意义的分析。【结论】本文所提文本–空间算法模型能有效挖掘多维空间文本数据的情感倾向分布;混合算法模型为空间文本数据推荐系统提供了同时计算空间接近性和情感相似性的有效方案。 [Objective] This paper builds a spatial-textual sentiment analyzing model based on multi-dimensional WaveCluster, aiming to analyze text sentiment and spatial position effectively.[Methods] First, we integrated several datasets from Yelp to build spatial-textual database. Then, we used lexicon-based sentiment analysis to generate feature vector. Third, we proposed a new method using Hybrid model, Textual-Spatial model, as well as multi-dimensional clustering model to analyze the data.[Results] We found that multi-dimensional clustering based on db2 or bior2.2 wavelet can recognize clusters more accurately than DBSCAN and K-means on spatial-textual feature mining. It also achieved the highest speed for data at 100 thousand to 10 million levels.[Limitations] We used unigram model for sentiment analysis, which cannot analyze sentences.[Conclusions] The proposed Textual-Spatial model could find out sentiment tendency distribution from spatial-textual data effectively. The Hybrid model provides a new approach for spatial-textual recommend system to calculate sentiment similarity and spatial proximity simultaneously.

作者李柯佐々木勇和 Li Ke;Sasaki Yuya(School of Information Management, Nanjing University, Nanjing 210046, China;Graduate School of Information Science and Technology, Osaka University, Osaka 565-0871, Japan)

机构地区南京大学信息管理学院大阪大学大学院情报科学研究科

出处《数据分析与知识发现》 CSSCI CSCD 北大核心 2019年第7期14-22,共9页 Data Analysis and Knowledge Discovery

关键词空间文本数据情感分布分析小波变换聚类 Spatial-Textual Data Sentiment Distribution Analysis Wavelet Transform Clustering

分类号 G35 [文化科学—情报学]

引文网络
相关文献

参考文献3

1胡卉芪..空间文本数据的量质融合与推送[D].清华大学,2016:
2刘思彤..空间文本数据的查询处理技术研究[D].清华大学,2015:
3周立柱,贺宇凯,王建勇.情感分析研究综述[J].计算机应用,2008,28(11):2725-2728. 被引量：73

二级参考文献28

1LIU B, HU M, CHENG J. Opinion observer: Analyzing and comparing opinions on the Web[ C]// Proceedings of the 14th International Conference on World Wide Web: WWW 2005. New York: ACM Press, 2005:342 - 351. 被引量：1
2PANG B, LEE L. A sentimental education: Sentiment analysis using subjectivity summarization based on minimum cuts[ C]// Proceedings of the 42nd Annual Meeting of the Association for Computational Linguistics. Morristown, N J, USA: Association for Computational Linguistics, 2004:271 -278. 被引量：1
3YU H, HATZIVASSILOGLOU V. Towards answering opinion questions: Separating facts from opinions and identifying the polarity of opinion sentences[ C]// Proceedings of the 2003 Conference on Empirical Methods in Natural Language Processing. Morristown, N J, USA: Association for Computational Linguistics. 2003:129 - 136. 被引量：1
4WILSON T, HOFFMANN P, SOMASUNDARAN S, et al. Opinion-Finder: A system for subjectivity analysis[ C]// Proceedings of the 2005 Human Language Technology Conference and Conference on Empirical Methods in Natural Language Processing. Morristown. NJ, USA: Association for Computational Linguistics. 2005: 34-35. 被引量：1
5DAVE K, LAWRENCE S, DPENNOCK M. Mining the peanut gallery: Opinion extraction and semantic classification of product reviews[ C]// Proceedings of the 12th International Conference on World Wide Web. New York: ACM Press, 2003:519-528. 被引量：1
6NASUKAWA T, YI J. Sentiment analysis: Capturing favorability using natural language processing[C]//Proceedings of the 2nd International Conference on Knowledge Capture. New York: ACM Press, 2003:70-77. 被引量：1
7HU M, LIU B. Mining opinion features in customer reviews[ C]// Proceedings of the 19th National Conference on Artificial Intelligence: AAAI 2004. Menlo Park, California: AAAI Press, 2004: 755 - 760. 被引量：1
8HU M, LIU B. Mining and summarizing customer reviews[ C]// Proceedings of the 10th ACM SIGKDD International Conference on Knowledge Discovery And Data Mining. New York: ACM Press, 2004:168 - 177. 被引量：1
9JINDAL N, LIU B. Identifying comparative sentences in text documents[ C]// Proceedings of the 29th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval. New York: ACM Press, 2006:244-251. 被引量：1
10MATSUMOTO S. TAKAMURA H, OKUMURA M. Sentiment classification using word sub-sequences and dependency sub-trees [ C]// Proceedings of the 9th Pacific-Asia Conference on Knowledge Discovery and Data Mining, LNCS 3518. Berlin: Springer- Verlag, 2005:301-311. 被引量：1

共引文献72

1路雪珂.基于文本挖掘方法的微博谣言传播情绪框架研究[J].新闻传播,2020(23):9-10. 被引量：1
2侯少龙,赵政文.面向微博平台的产品市场分析模型研究[J].微型电脑应用,2011(4):4-6. 被引量：5
3李纲,程明结,寇广增.基于情感倾向识别的汽车评论挖掘系统构建[J].情报学报,2011,30(2):204-211. 被引量：14
4丁菊玲,勒中坚,王根生,周萍.一种面向网络舆情危机预警的观点柔性挖掘模型[J].情报杂志,2009,28(10):152-154. 被引量：40
5王翠波.基于文本情感挖掘的企业技术竞争情报采集模型研究[J].图书情报工作,2010,54(14):75-78. 被引量：10
6赵妍妍,秦兵,刘挺.文本情感分析[J].软件学报,2010,21(8):1834-1848. 被引量：546
7刘建波,杨峰.面向舆情分析的短文本频繁模式聚类算法[J].北京电子科技学院学报,2010,18(4):6-11. 被引量：7
8路冬媛,李秋丹.一种融合读者心情要素的新闻推送方法[J].中文信息学报,2011,25(3):79-85.
9厉小军,戴霖,施寒潇,黄琦.文本倾向性分析综述[J].浙江大学学报（工学版）,2011,45(7):1167-1174. 被引量：18
10刘建波.面向情感分析的短文本意义串发现及分析算法[J].武汉理工大学学报（信息与管理工程版）,2011,33(5):742-745.

同被引文献24

1鄂立彬,黄永稳.国际贸易新方式:跨境电子商务的最新研究[J].东北财经大学学报,2014,15(2):22-31. 被引量：417
2来有为,王开前.中国跨境电子商务发展形态、障碍性因素及其下一步[J].改革,2014(5):68-74. 被引量：320
3王必达,张忠杰.中国刘易斯拐点及阶段研究——基于31个省际面板数据[J].经济学家,2014(7):16-26. 被引量：16
4金虹,林晓伟.我国跨境电子商务的发展模式与策略建议[J].宏观经济研究,2015(9):40-49. 被引量：175
5吴敏.“互联网+”视域下跨境电商生态圈构建思路探析[J].商业经济研究,2015(34):75-76. 被引量：55
6朱妮娜,吴莉.“一带一路”战略背景下我国跨境电商发展潜力及趋势分析[J].改革与战略,2015,31(12):134-137. 被引量：76
7赵旭明,杨晓涵.跨境电子商务发展对我国对外贸易模式转型影响分析[J].商业经济研究,2016(8):75-77. 被引量：47
8张薇.平台战略视角下我国跨境电商生态圈布局规划[J].商业经济研究,2016(18):87-88. 被引量：18
9田沁,巩玥,亢孟军,孟社宁,杜清运.国内主流在线地理编码服务质量评价[J].武汉大学学报（信息科学版）,2016,41(10):1351-1358. 被引量：23
10张夏恒,郭海玲.跨境电商与跨境物流协同:机理与路径[J].中国流通经济,2016,30(11):83-92. 被引量：108

引证文献1

1王志盼,张清凌,宋小青,胡仁林.基于位置大数据的中国跨境电商时空格局变化及其影响机制[J].经济地理,2022,42(1):44-52. 被引量：14

二级引证文献14

1农锦华,赵子龙.西部陆海新通道背景下提升广西跨境电子商务试验区功能及发展路径研究[J].中国产经,2022(9):123-125.
2黄哲,杜斐烨.跨境电商对“双循环”新发展格局的影响——以外贸增长为中介变量的实证[J].商业经济研究,2022(17):164-167. 被引量：7
3孟涛,王春娟,范鹏辉.数字经济视域下跨境电商高质量发展对策研究[J].国际贸易,2022(10):60-67. 被引量：43
4郭扬.后疫情时代中国跨境电商发展的驱动机制研究[J].价格月刊,2023(2):87-94. 被引量：7
5牛建国,夏飞龙.AIGC促进跨境电商高质量发展的机制研究[J].企业经济,2023,42(10):85-94. 被引量：10
6丁志伟,罗婉琳,马芳芳.中国县域政府官员直播带货水平的空间差异及其影响因素[J].经济地理,2023,43(12):69-79. 被引量：8
7张望,冯晨涛,周志丹.智能化背景下C2B跨境电商发展对策研究[J].中国商论,2024(5):9-12.
8李保民,翟浩然.生态位视角下我国省域跨境电商产业竞争力评价分析[J].天津商业大学学报,2024,44(3):3-9.
9聂爽爽,王瑞荣,王维红.中国纺织业跨境电商集聚及其对区域经济增长的影响分析[J].北京服装学院学报（自然科学版）,2024,44(3):120-126.
10朱伟明,章钟瑶.基于数据驱动的跨境电商运营机制创新研究——以F品牌为例[J].丝绸,2024,61(10):15-26.

1杨霁,曾现均,王晋宇,李娇,姚龙.基于激光检测及大数据分析的电力设备损伤研究[J].激光杂志,2018,39(12):78-82. 被引量：6
2李生刚.安全管理与可持续发展在危化品生产企业中的探究[J].中国战略新兴产业（理论版）,2019,0(24):0196-0196.
3杨文静.大数据环境下基于狼群优化的聚类算法分析与研究[J].现代电子技术,2019,42(17):106-108. 被引量：2
4杨双双.急性脑血管病患者在医院感染的相关因素及发病部位及病原菌分布分析[J].临床研究,2019,0(9):26-27.
5邓椀升.简析建筑工程管理过程的造价控制[J].四川水泥,2019,0(7):198-198.
6马生惠.浅谈加快构建空间规划体系的基本思路[J].居业,2019(9):46-47.
7吴坚,纪双龙.乡村振兴领域的文献计量分析研究[J].江苏农业科学,2019,47(15):85-85. 被引量：4
8郭晓珍,陈楠.重点产业知识产权运营基金的发展现状及建议[J].厦门理工学院学报,2019,27(4):14-20.
9杨大明.我国青少年足球和中小学校园足球研究文献计量学分析[J].文体用品与科技,2019,0(18):50-53.
10胡朝凯.“一带一路”倡议下中国电影东南亚传播现状与策略分析[J].传播力研究,2019,3(21):61-61. 被引量：4

数据分析与知识发现

2019年第7期

浏览历史

内容加载中请稍等...

基于多维小波聚类的空间文本数据情感分布分析被引量：1

参考文献3

二级参考文献28

共引文献72

同被引文献24

引证文献1

二级引证文献14

相关作者

相关机构

相关主题

浏览历史

基于多维小波聚类的空间文本数据情感分布分析 被引量：1

参考文献3

二级参考文献28

共引文献72

同被引文献24

引证文献1

二级引证文献14

相关作者

相关机构

相关主题

浏览历史

基于多维小波聚类的空间文本数据情感分布分析被引量：1