期刊文献+
共找到1,092篇文章
< 1 2 55 >
每页显示 20 50 100
融合主题与情感特征的突发事件微博舆情演化分析 被引量:110
1
作者 安璐 吴林 《图书情报工作》 CSSCI 北大核心 2017年第15期120-129,共10页
[目的/意义]微博是突发事件网络舆情传播的重要媒介。面向突发事件的微博主题和情感挖掘对掌握突发事件的网络舆情、识别与预测潜在问题及风险等方面具有重要的实践意义。尝试提出一种融合主题与情感特征的突发事件微博舆情演化分析方法... [目的/意义]微博是突发事件网络舆情传播的重要媒介。面向突发事件的微博主题和情感挖掘对掌握突发事件的网络舆情、识别与预测潜在问题及风险等方面具有重要的实践意义。尝试提出一种融合主题与情感特征的突发事件微博舆情演化分析方法。[方法/过程]以寨卡事件为例,通过划分微博舆情演化的生命周期,基于word2vec技术分别提取该事件生命周期各阶段的微博主题,采用基于词典的情感分析方法,引入情感词、表情符号等多情绪源,对不同主题下的评论情感做细粒度划分,并计算情感强度,最终实现微博主题与情感的协同分析。[结果/结论]所提出的微博舆情演化分析方法能够揭示面向特定事件的微博在突发事件生命周期各阶段的主题特征、情感类型与强度,剖析网络舆情主题与情感特征的协同演化规律。 展开更多
关键词 主题分析 情感分析 word2vec 微博 舆情 突发事件
原文传递
国家科技创新政策的主题分析与演化过程——基于文本挖掘的视角 被引量:82
2
作者 张宝建 李鹏利 +2 位作者 陈劲 郭琦 吴延瑞 《科学学与科学技术管理》 CSSCI CSCD 北大核心 2019年第11期15-31,共17页
政策文本内容深度挖掘有助于梳理政策演变轨迹并客观剖析政策与实践存在的脱节问题。基于学术界对科技创新政策整体性、系统性把握不足,采用文本挖掘技术对我国1996-2017年国家科技创新政策典型文本数据进行分析。通过Rwordseg技术提取... 政策文本内容深度挖掘有助于梳理政策演变轨迹并客观剖析政策与实践存在的脱节问题。基于学术界对科技创新政策整体性、系统性把握不足,采用文本挖掘技术对我国1996-2017年国家科技创新政策典型文本数据进行分析。通过Rwordseg技术提取关键词、构建关系矩阵。据此,采用K-means聚类将国家科技创新政策按内容和性质进行主题分析。其中,内容聚类结果包含八类政策主题,性质聚类结果包含三类政策主题。进一步地,采用多层多维交叉视角分析国家科技创新政策演化过程,结合科技创新实践报告,对政策文本的有效性进一步分析。研究发现不同内容、性质和效力政策在科技创新发展的各阶段表现出差异性和失配特征,据此凝练出政策演化规律,并提出了政策完善的针对性建议。研究结果能够对科技创新政策体系的理论完善形成有益补充,同时为国家科技创新实践提供现实指导。 展开更多
关键词 科技创新政策 主题分析 演化过程 文本挖掘
原文传递
基于网络文本分析的野生动物旅游体验研究——以成都大熊猫繁育研究基地为例 被引量:77
3
作者 丛丽 吴必虎 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2014年第6期1087-1094,共8页
选取成都大熊猫繁育研究基地为案例地,针对旅游者网络评论中文文本,借助ROST Content Mining 6和NVivo 8软件,使用内容分析和质性主题分析二者相结合的研究方法,分析中国旅游者在访问圈养环境中的大熊猫研究基地时的旅游体验。研究结果... 选取成都大熊猫繁育研究基地为案例地,针对旅游者网络评论中文文本,借助ROST Content Mining 6和NVivo 8软件,使用内容分析和质性主题分析二者相结合的研究方法,分析中国旅游者在访问圈养环境中的大熊猫研究基地时的旅游体验。研究结果表明:大熊猫旅游体验的核心主题是旅游者、目的地和大熊猫;旅游者动机主要为熊猫迷、教育和目的地品牌;旅游者的行为主要体现在3个环节"参观"、"拍照"和"接触";旅游者的满意度与熊猫接触的程度密切相关,影响因素包括大熊猫的行为状态、参观游览的时间季节、游客的秩序、价格等。 展开更多
关键词 内容分析 主题分析 野生动物旅游 大熊猫 旅游体验
下载PDF
我国图书情报领域大数据研究热点分析 被引量:62
4
作者 王春华 李维 文庭孝 《图书情报知识》 CSSCI 北大核心 2015年第4期82-89,共8页
近年来,大数据研究成为图书情报领域的研究热点。本文以CNKI数据库中收录的图书情报领域以"大数据"为主题的文献为数据来源,运用词频统计和共词分析方法,借助SPSS和UCINET软件进行聚类分析、战略坐标图分析和核心-边缘结构分... 近年来,大数据研究成为图书情报领域的研究热点。本文以CNKI数据库中收录的图书情报领域以"大数据"为主题的文献为数据来源,运用词频统计和共词分析方法,借助SPSS和UCINET软件进行聚类分析、战略坐标图分析和核心-边缘结构分析,分析结果表明目前国内图书情报领域大数据研究热点主要集中于八个研究主题,即智慧图书馆与物联网、数据挖掘与处理、大数据与企业竞争情报、大数据与高校图书馆、大数据与信息分析、大数据与知识服务、大数据与公共图书馆、大数据与数字图书馆,并对研究主题进行详细解析,为国内图书情报领域大数据的研究提供参考。 展开更多
关键词 图书馆学 情报学 大数据 研究热点 主题分析 SPSS
下载PDF
突发公共卫生事件微博舆情主题挖掘与演化分析 被引量:60
5
作者 曹树金 岳文玉 《信息资源管理学报》 CSSCI 2020年第6期28-37,共10页
探索突发公共卫生事件微博舆情传播周期中各阶段的热点主题,勾勒舆情事件主题演化的时序发展趋势,为舆情决策与分析提供科学依据。以近期发生的影响巨大的一起重大突发公共卫生事件为例,结合生命周期理论、TF-IDF特征词-权值模型以及潜... 探索突发公共卫生事件微博舆情传播周期中各阶段的热点主题,勾勒舆情事件主题演化的时序发展趋势,为舆情决策与分析提供科学依据。以近期发生的影响巨大的一起重大突发公共卫生事件为例,结合生命周期理论、TF-IDF特征词-权值模型以及潜在狄利克雷模型方法,将时间维度融入微博文本分析,进行包括时间序列的主题挖掘工作,挖掘隐含的主题信息和舆情演化规律,并提出相应的舆情管控策略。采用的舆情演化分析方法能够揭示突发公共卫生事件微博舆情传播周期中各阶段主题的讨论内容和时序发展趋势,研究对于优化微博平台民意收集作用和辅助相关管理部门在处理类似事件时,有效引导与控制网络舆情提供了一定的理论基础支撑和科学决策支持。 展开更多
关键词 突发公共卫生事件 网络舆情 主题分析 演化分析 舆情分析 微博文本挖掘
下载PDF
基于情感分析与主题分析的“后微博”时代突发事件政府信息公开研究——以新浪微博“天津爆炸”话题为例 被引量:48
6
作者 赵晓航 《图书情报工作》 CSSCI 北大核心 2016年第20期104-111,共8页
[目的 /意义]旨在通过对突发事件舆情研究,探索危机传播管理中的舆情研判方法,并进一步为政府信息公开提供实操方法的建议。[方法/过程]在理论研究层面,基于危机传播的基本要点,对信息发布效果和舆情实时反馈进行综合分析;在应用处理层... [目的 /意义]旨在通过对突发事件舆情研究,探索危机传播管理中的舆情研判方法,并进一步为政府信息公开提供实操方法的建议。[方法/过程]在理论研究层面,基于危机传播的基本要点,对信息发布效果和舆情实时反馈进行综合分析;在应用处理层面,以新浪微博中"天津爆炸"事件相关信息为例,爬取新浪微博全量数据,基于危机传播领域知识和信息发布文本构建领域词表,并结合危机传播阶段特征,对全量数据进行主题提取和情感分析。[结果/结论]"后微博"时代,微博用户量下降,但其仍旧是突发事件信息公开和舆情扩散的主要阵地。探求突发事件下政府如何利用微博平台,收集、研判、应对网络舆情,为做好信息发布工作提供科学的分析方法和应对手段。 展开更多
关键词 信息公开 网络舆情 情感分析 主题分析 危机传播
原文传递
循证医学学科知识可视化研究之一:循证医学研究主题图谱 被引量:44
7
作者 沈建通 姚乐野 +7 位作者 李幼平 Mike Clarke 甘奇 樊怡 李一飞 芶永超 钟大可 王莉 《中国循证医学杂志》 CSCD 2011年第6期613-621,共9页
目的采用可视化方法系统、全面、直观地揭示和比较中外循证医学领域近年来的主要研究主题、学科结构和发展趋势。方法以MEDLINE和CNKI数据库中循证医学相关文献的MeSH词和关键词为研究对象,用共词分析法、PFNET算法和可视化技术绘制国... 目的采用可视化方法系统、全面、直观地揭示和比较中外循证医学领域近年来的主要研究主题、学科结构和发展趋势。方法以MEDLINE和CNKI数据库中循证医学相关文献的MeSH词和关键词为研究对象,用共词分析法、PFNET算法和可视化技术绘制国内外循证医学主题图、研究领域关系图和循证医学战略坐标图。结果国内外循证医学都处于大发展期,国外有关"Humans"的研究占94.41%,而"Animals"仅占2.57%,其中75.2%是灵长类。6个高频国别主题词和发表论文最多的前108种期刊所在国都是发达国家。国内31个省、直辖市、自治区都有论文发表,但发文量居前的省份和机构大多都处发达地区。共词分析结果显示国外循证医学研究主要集中在7个领域,依次为erapy、Methods、Standards、Research、Education、Nursing、Organization & Administration;国内7个领域则依次为治疗、护理、中医药、研究、教育、管理、信息资源,且各领域间相互联系。我国独有的特色领域是中医药和信息资源,但在方法和标准方面则大大落后于国外。结论循证医学发展最好的国家、地区和机构大都集中在经济发达地区。优势地区和机构主要应承担证据生产和方法学研究,而最迫切需要学习和使用证据的欠发达地区和机构,当务之急是学习和普及循证医学理念和证据。国内循证医学文献量、高频词和词频阈值分别为国外的28.9%、66.7%和5%,不排除样本量少带来的偏倚,国内结果仅供参考。 展开更多
关键词 循证医学 信息可视化 共词分析 主题分析
原文传递
创新型国家战略背景下的原始性创新政策评价 被引量:42
8
作者 成全 董佳 陈雅兰 《科学学研究》 CSSCI CSCD 北大核心 2021年第12期2281-2293,共13页
原始性创新是科学技术发展与进步的源动力,是决定国家间科技乃至经济竞争成败的重要因素,我国一直把增强原始性创新能力作为新时代国家科技发展的重大战略。本文围绕创新型国家战略背景下(2006-2019年间)国家出台的原始性创新政策文件... 原始性创新是科学技术发展与进步的源动力,是决定国家间科技乃至经济竞争成败的重要因素,我国一直把增强原始性创新能力作为新时代国家科技发展的重大战略。本文围绕创新型国家战略背景下(2006-2019年间)国家出台的原始性创新政策文件为研究对象,通过建立PMC指数模型与主题模型,从政策整体质量效果、指标分布态势和主题演化规律三个维度对我国原始创新政策进行评价分析。结果发现,在创新型国家战略背景下国家发布的原始性创新政策类型丰富、内容全面,以鼓励引导型政策为主,重点围绕创新资源供给政策工具展开,但在政策的监督评估、政策覆盖面和实施力度、引导创新成果转化作用等方面仍存在需要完善的空间。针对创新型国家战略背景下国家原始性创新政策的现存问题,为我国后续更加科学有效地制定与实施原始性创新政策提出相关建议。 展开更多
关键词 原始性创新政策 政策评价 PMC指数模型 主题分析
原文传递
奥运会与国家形象:国外媒体对四个奥运举办城市的报道主题分析 被引量:36
9
作者 董小英 李其 +3 位作者 师曾志 余艳 陈文广 马张华 《中国软科学》 CSSCI 北大核心 2005年第2期1-9,共9页
2008年北京奥运会是塑造我国国家形象的良好契机。本文对国外媒体对四个奥运举办城市的3607篇报道进行了主题词统计和分析。调查发现:国外媒体在关注北京奥运会时,讨论最多的主题是政治,这与对其它三个举办城市的报道有显著差异。作者... 2008年北京奥运会是塑造我国国家形象的良好契机。本文对国外媒体对四个奥运举办城市的3607篇报道进行了主题词统计和分析。调查发现:国外媒体在关注北京奥运会时,讨论最多的主题是政治,这与对其它三个举办城市的报道有显著差异。作者提出了政府应协同媒体和企业利用奥运会整合国家形象传播,在对外信息发布中发挥积极主动作用等建议。 展开更多
关键词 国家形象 奥运会 媒体 主题分析 议程设置
下载PDF
“上帝与撒旦的冲突”——福克纳《献给爱米丽的玫瑰》主题分析 被引量:41
10
作者 魏玉杰 《国外文学》 CSSCI 北大核心 1998年第4期64-69,共6页
对于福克纳的《献给爱米丽的玫瑰》的意义,不同的研究者有不同的看法。最近看到刘新民先生在《名作欣赏》1997年第6期上发表的文章,对肖明翰先生在《名作欣赏》1996年第6期上发表的文章《为什么向爱米丽献上一朵玫瑰?——... 对于福克纳的《献给爱米丽的玫瑰》的意义,不同的研究者有不同的看法。最近看到刘新民先生在《名作欣赏》1997年第6期上发表的文章,对肖明翰先生在《名作欣赏》1996年第6期上发表的文章《为什么向爱米丽献上一朵玫瑰?——兼与钱满素先生商榷》提出了不同看法... 展开更多
关键词 《献给爱米丽的玫瑰》 福克纳 主题分析 南方人 南方妇女 犯罪感 女性人格 《我弥留之际》 南方女性 双重人格
原文传递
基于LDA模型的主题分析 被引量:34
11
作者 石晶 范猛 李万龙 《自动化学报》 EI CSCD 北大核心 2009年第12期1586-1592,共7页
在文本分割的基础上,确定片段主题,进而总结全文的中心主题,使文本的主题脉络呈现出来,主题以词串的形式表示.为了分析准确,利用LDA(Latent dirichlet allocation)为语料库及文本建模,以Clarity度量块间相似性,并通过局部最小值识别片... 在文本分割的基础上,确定片段主题,进而总结全文的中心主题,使文本的主题脉络呈现出来,主题以词串的形式表示.为了分析准确,利用LDA(Latent dirichlet allocation)为语料库及文本建模,以Clarity度量块间相似性,并通过局部最小值识别片段边界.依据词汇的香农信息提取片段主题词,采取背景词汇聚类及主题词联想的方式将主题词扩充到待分析文本之外,尝试挖掘隐藏于字词表面之下的文本内涵.实验表明,文本分析的结果明显好于其他方法,可以为下一步文本推理的工作提供有价值的预处理. 展开更多
关键词 主题分析 LDA模型 文本分割 GIBBS抽样
下载PDF
我国图书馆读者满意度研究论文的文献计量学分析 被引量:27
12
作者 贾玉英 《现代情报》 北大核心 2007年第2期43-46,共4页
本文以《中国期刊全文数据库》和《中国科技期刊数据库》(全文版)为文献来源,运用文献计量学方法并结合文献内容,对我国图书馆读者满意度研究论文进行了数量分布、期刊分布、作者分布及主题分布的统计分析,从而探讨了我国图书馆读者满... 本文以《中国期刊全文数据库》和《中国科技期刊数据库》(全文版)为文献来源,运用文献计量学方法并结合文献内容,对我国图书馆读者满意度研究论文进行了数量分布、期刊分布、作者分布及主题分布的统计分析,从而探讨了我国图书馆读者满意度研究的现状和存在的问题,并提出相关建议,以期能对本领域今后的研究提供一些参考与启示。 展开更多
关键词 图书馆 读者满意度 文献计量学 主题分析
下载PDF
基于文献计量的国内高校图书馆知识服务研究现状评析 被引量:26
13
作者 丁志健 王焕景 《图书馆工作与研究》 CSSCI 北大核心 2015年第6期53-58,共6页
本文以CNKI为相关文献数据源,采用文献计量学方法从文献增长规律、文献来源、文献作者等方面定量分析国内高校图书馆知识服务研究现状;通过计算词频g指数确定该研究领域高频关键词,采用共词分析和可视化分析方法揭示该领域的研究主题和... 本文以CNKI为相关文献数据源,采用文献计量学方法从文献增长规律、文献来源、文献作者等方面定量分析国内高校图书馆知识服务研究现状;通过计算词频g指数确定该研究领域高频关键词,采用共词分析和可视化分析方法揭示该领域的研究主题和热点,发现当前我国学者关于高校图书馆知识服务的研究兴趣偏向于服务模式创新、学科馆员素质提高、学科化及个性化服务实现等方面。近年来高校图书馆知识服务实践的社会化趋势十分明显。 展开更多
关键词 高校图书馆 知识服务 文献计量 共词分析 主题分析
下载PDF
科技论文关键词标引方法的误导必须纠正 被引量:26
14
作者 杨小玲 高鲁山 《编辑学报》 CSSCI 北大核心 2002年第1期25-26,共2页
讨论期刊界对关键词标引方法的某些误导、关键词的概念和含义、关键词与叙词的不同之处。提出 :为了适应学科和专业的发展 ,计算机和网络技术的应用 ,减轻标引人员的负担 ,论文关键词的标引应摒弃“叙词标引规则” 。
关键词 科技论文 关键词标引 叙词 自由标引法 主题分析 抽词
下载PDF
近十年国内知识图谱研究脉络及主题分析 被引量:26
15
作者 李明鑫 王松 《图书情报知识》 CSSCI 北大核心 2016年第4期93-101,共9页
知识图谱已成为各领域广泛使用的一种对知识结构与发展进行关系展示的方法图形。国内知识图谱研究至今已逾十年,本文对这段时间的研究主题进行分类总结,从中发现规律,以期为日后的发展提出建议与展望。本文采用内容分析法,以国内知识图... 知识图谱已成为各领域广泛使用的一种对知识结构与发展进行关系展示的方法图形。国内知识图谱研究至今已逾十年,本文对这段时间的研究主题进行分类总结,从中发现规律,以期为日后的发展提出建议与展望。本文采用内容分析法,以国内知识图谱相关主题文献为对象,经过充分的筛选与整理,将239篇文献分为"方法、工具、综述和学科运用"四个类别,对2005—2015十余年来国内知识图谱研究进行系统的梳理、综述和深度剖析。在此基础上,创新性地将2005年至2011年这一阶段称作知识图谱1.0,将2011年以后的研究发展阶段称作知识图谱2.0,并对其进行详细的阐述说明。最后得出结论认为,知识图谱将在未来长期处于多学科领域融合的2.0时代,并持续向其他领域渗透。 展开更多
关键词 情报学 知识图谱 可视化 研究综述 主题分析
下载PDF
2000-2004年我国竞争情报论文的统计分析 被引量:23
16
作者 李丹 《情报科学》 CSSCI 北大核心 2006年第1期140-143,共4页
本文采用文献计量方法对2000-2004年5年来的竞争情报研究论文从论文年代分布、期刊分布及论文主题分析进行了统计与分析,并由此阐述了我国竞争情报研究的发展趋势,提出了研究过程中的一些问题,为竞争情报的进一步研究和发展提供借鉴。
关键词 竞争情报 论文分析 主题分析
下载PDF
基于关键词重要性和近邻传播聚类的主题分析研究 被引量:24
17
作者 李海林 万校基 林春培 《情报学报》 CSSCI CSCD 北大核心 2018年第5期533-542,共10页
鉴于传统科学计量方法存在共现分析缺少考虑关键词重要性和主题分析手段不能自适应地抽取核心主题等问题,本文提出一种基于关键词重要性和近邻传播聚类的主题分析方法。该方法依据大多数作者的潜在行为会按照与研究内容相关性的强弱顺... 鉴于传统科学计量方法存在共现分析缺少考虑关键词重要性和主题分析手段不能自适应地抽取核心主题等问题,本文提出一种基于关键词重要性和近邻传播聚类的主题分析方法。该方法依据大多数作者的潜在行为会按照与研究内容相关性的强弱顺序提供论文关键词,计算关键词在每个文献中的重要程度,构建主要关键词之间的相似性矩阵,结合能够反馈最优簇成员代表性结果的近邻传播聚类实现核心主题的提取与分析。本研究对图书情报类某刊物2012-2016年期间的文献关键词进行数据挖掘,使用新方法实现了基于重要性度量的主要关键词聚类,分析和研究了主要关键词和核心主题的演化趋势。提出的方法不仅能够考虑关键词重要性和自动识别核心主题,还可以为文献主题分析提供新的数据挖掘方法,也能有效提高期刊和学科等相关领域的主题识别效果。 展开更多
关键词 主题分析 关键词重要性 近邻传播聚类 核心主题
下载PDF
一种基于多数据源主题对比的科学研究前沿识别方法 被引量:24
18
作者 白如江 冷伏海 廖君华 《情报理论与实践》 CSSCI 北大核心 2017年第8期43-48,36,共7页
[目的/意义]提升科技文献语义理解,提高科学研究前沿识别的前瞻性和细化识别主题粒度。[方法/过程]利用蕴含更多前瞻价值信息的科技规划、基金项目数据,运用语义挖掘技术实现文本内容的深度语义理解。通过对科技规划文本和基金项目数据... [目的/意义]提升科技文献语义理解,提高科学研究前沿识别的前瞻性和细化识别主题粒度。[方法/过程]利用蕴含更多前瞻价值信息的科技规划、基金项目数据,运用语义挖掘技术实现文本内容的深度语义理解。通过对科技规划文本和基金项目数据文本两种不同数据源中蕴含的科学研究前沿主题相似度对比分析,采用新兴度和热点度两个指标,识别出新兴研究前沿主题和热点研究主题两类科学研究前沿主题,进而揭示出前沿领域竞争态势。[结果/结论]利用文章提出的方法对碳纳米管研究领域研究前沿进行识别,对识别结果分别采用专家咨询和论文数据证据方法进行验证,结果证明方法是有效、可行的。 展开更多
关键词 科学研究前沿 识别方法 主题分析 多数据源
原文传递
“齐物”三义——《庄子·齐物论》主题分析 被引量:22
19
作者 陈少明 《中国哲学史》 CSSCI 2001年第4期40-46,共7页
在前人对《齐物论》作齐“物论”、与“齐物”论两种理解 的基础上,作者提出齐物我的另一重含义。合起来构成齐“物论”、齐万物与齐物我三义:齐物论是对各种思想学说,进行一种哲学批判,其重点不在是非的标准,而是对争是非本身的... 在前人对《齐物论》作齐“物论”、与“齐物”论两种理解 的基础上,作者提出齐物我的另一重含义。合起来构成齐“物论”、齐万物与齐物我三义:齐物论是对各种思想学说,进行一种哲学批判,其重点不在是非的标准,而是对争是非本身的正当性的质疑。齐万物则要求人的世界观的转变,放弃任何自我中心的态度,看待万有的自然性与自足性,把是非转化成有无问题,具有从认识论向本体论过度的意味。齐物我是前二者的深入,它所涉及的心物关系不是认识论而是生存论问题,本体论上化有为无,就是表现在生存论上的丧我与无为,它是导向另一种生活方式的信念基础。齐物三义是庄子哲学的基本纲领。 展开更多
关键词 《庄子·齐物论》 是非 生存论 本体论 有无 认识论 有为 主题分析 质疑 导向
下载PDF
一种基于支持向量机和主题模型的评论分析方法 被引量:23
20
作者 陈琪 张莉 +1 位作者 蒋竞 黄新越 《软件学报》 EI CSCD 北大核心 2019年第5期1547-1560,共14页
在移动应用软件中,用户评论是一种重要的用户反馈途径.用户可能提到一些移动应用使用中的问题,比如系统兼容性问题、应用崩溃等.随着移动应用软件的广泛流行,用户提供大量无结构化的反馈评论.为了从用户抱怨评论中提取有效信息,提出一... 在移动应用软件中,用户评论是一种重要的用户反馈途径.用户可能提到一些移动应用使用中的问题,比如系统兼容性问题、应用崩溃等.随着移动应用软件的广泛流行,用户提供大量无结构化的反馈评论.为了从用户抱怨评论中提取有效信息,提出一种基于支持向量机和主题模型的评论分析方法 RASL(reviewanalysis methodbased on SVM and LDA)以帮助开发人员更好、更快地了解用户反馈.首先对移动应用的中、差评提取特征,然后使用支持向量机对评论进行多标签分类.随后使用LDA主题模型(latentdirichletallocation)对各问题类型下的评论进行主题提取与代表句提取.从两个移动应用中爬取5 141条用户原始评论,并对这些评论分别用RASL方法和ASUM方法进行处理,得到两个新的文本.与经典方法ASUM相比,RASL方法的困惑度更低、可理解性更佳,包含更完整的原始评论信息,冗余信息也更少. 展开更多
关键词 用户评论 分类 主题分析
下载PDF
上一页 1 2 55 下一页 到第
使用帮助 返回顶部