期刊文献+
共找到178篇文章
< 1 2 9 >
每页显示 20 50 100
恐怖事件情境下微博信息与评论用户的画像及比较 被引量:13
1
作者 安璐 周亦文 《情报科学》 CSSCI 北大核心 2020年第4期9-16,共8页
【目的/意义】构建用户特征指标体系,对恐怖事件情境下微博信息与评论用户进行画像并比较有助于掌握参与恐怖事件讨论用户的特点,加强反恐舆论引导。【方法/过程】以"#巴塞罗那恐怖袭击#"话题下的所有微博及评论数据为例,使... 【目的/意义】构建用户特征指标体系,对恐怖事件情境下微博信息与评论用户进行画像并比较有助于掌握参与恐怖事件讨论用户的特点,加强反恐舆论引导。【方法/过程】以"#巴塞罗那恐怖袭击#"话题下的所有微博及评论数据为例,使用基于相关性的LDA主题模型提取微博主题,从用户特征和文本特征两个角度构建指标体系,并采用两步聚类刻画微博用户特征,分析发布微博用户和评论用户的异同。【结果/结论】以往活跃度、影响力较高的用户在该事件中不一定拥有较高的影响力;原始微博用户的平均等级略低于评论用户,但其在该事件中的影响力高于评论用户;原始微博用户类型多于评论微博用户类型。 展开更多
关键词 用户画像 微博 评论 生命周期 主题分析 聚类 恐怖事件
原文传递
形义错配结构及其主题化分析 被引量:8
2
作者 韩巍峰 梅德明 《外国语》 CSSCI 北大核心 2011年第3期21-30,共10页
本研究详细考察了汉语形义错配结构及相应主题化分析的可能性。在全面回顾了结构主义语法、生成语法以及当代认知语法对形义错配句的分析后,研究指出了现有各分析的不足。通过对方言相关例句的考察,研究发现出现在不同句法位置上的准定... 本研究详细考察了汉语形义错配结构及相应主题化分析的可能性。在全面回顾了结构主义语法、生成语法以及当代认知语法对形义错配句的分析后,研究指出了现有各分析的不足。通过对方言相关例句的考察,研究发现出现在不同句法位置上的准定语其所蕴含的语义关系不同。研究指出,形如"他的头发理的不错"和"他是去年生的孩子"的形义错配句本质上是一句主题结构,相应的"的"与"是"应被分析为标示主题结构与功能的主题标记。主题化的分析有助于消除形义错配结构的歧义性,并区分"错配"与"正配"的结构。 展开更多
关键词 形义错配结构 主题化 主题标记
原文传递
基于主题N元语法模型的科技报告主题分析 被引量:2
3
作者 安欣 徐硕 《农业图书情报》 2019年第6期21-30,共10页
作为科技情报的重要载体之一,科技报告可以反映科技发展的脉络,可以揭示科技前沿的动态,甚至可以洞察科技发展的趋势等。中国科技报告的开发利用研究目前主要集中在书本型科技报告或电子出版物的出版发行、数据库建设、服务方式和知识... 作为科技情报的重要载体之一,科技报告可以反映科技发展的脉络,可以揭示科技前沿的动态,甚至可以洞察科技发展的趋势等。中国科技报告的开发利用研究目前主要集中在书本型科技报告或电子出版物的出版发行、数据库建设、服务方式和知识产权等方面,在深度数据挖掘方面的研究工作相对较少。笔者尝试利用主题N元语法模型对科技报告进行领域深层主题分析,为了确定特定领域科技报告的主题数目,笔者借助动态规划的思想针对主题N元语法模型提出了困惑度的有效计算方法。最后,以肿瘤领域1344条科技报告为实验数据,揭示了以“分子机制/肿瘤细胞”和“系统生物学/关键方法”为代表的70个主题,验证了利用主题N元语法模型揭示科技报告领域深层主题的可行性和有效性。 展开更多
关键词 科技报告 主题N元语法模型 主题分析 困惑度 热力图
下载PDF
融合主题与情感特征的突发事件微博舆情演化分析 被引量:110
4
作者 安璐 吴林 《图书情报工作》 CSSCI 北大核心 2017年第15期120-129,共10页
[目的/意义]微博是突发事件网络舆情传播的重要媒介。面向突发事件的微博主题和情感挖掘对掌握突发事件的网络舆情、识别与预测潜在问题及风险等方面具有重要的实践意义。尝试提出一种融合主题与情感特征的突发事件微博舆情演化分析方法... [目的/意义]微博是突发事件网络舆情传播的重要媒介。面向突发事件的微博主题和情感挖掘对掌握突发事件的网络舆情、识别与预测潜在问题及风险等方面具有重要的实践意义。尝试提出一种融合主题与情感特征的突发事件微博舆情演化分析方法。[方法/过程]以寨卡事件为例,通过划分微博舆情演化的生命周期,基于word2vec技术分别提取该事件生命周期各阶段的微博主题,采用基于词典的情感分析方法,引入情感词、表情符号等多情绪源,对不同主题下的评论情感做细粒度划分,并计算情感强度,最终实现微博主题与情感的协同分析。[结果/结论]所提出的微博舆情演化分析方法能够揭示面向特定事件的微博在突发事件生命周期各阶段的主题特征、情感类型与强度,剖析网络舆情主题与情感特征的协同演化规律。 展开更多
关键词 主题分析 情感分析 word2vec 微博 舆情 突发事件
原文传递
20世纪中国钢琴音乐议题体系与“琵琶”议题发展脉络 被引量:1
5
作者 秦萌 《中国音乐》 北大核心 2023年第6期163-179,共17页
本文将视角放在符号学与议题分析理论下,详细论述其理论研究中各代学者所取得的重要成果、领域内的研究发展目标、不同理论视角的拓展、研究方法及学科未来走向等等。同时结合20世纪中西音乐文化交流的时代大背景,构建中国钢琴音乐作品... 本文将视角放在符号学与议题分析理论下,详细论述其理论研究中各代学者所取得的重要成果、领域内的研究发展目标、不同理论视角的拓展、研究方法及学科未来走向等等。同时结合20世纪中西音乐文化交流的时代大背景,构建中国钢琴音乐作品的初步议题体系(topical universe)基本原理,汇总中国钢琴音乐作品中的常见议题词汇目录。在此论述基础上,将以“琵琶议题”为例进行其下属各类“次级议题”的详细划分与构建,通过谱例分析总结出琵琶演奏技法与它们的钢琴“能指”之间的对应关系,解读不同“次级议题”在中国钢琴音乐作品中呈现出的多种组合形式及判定方法,同时分析“琵琶议题”在20世纪中的不同发展阶段与议题特征。 展开更多
关键词 符号学 议题分析理论 近现代钢琴作品 “琵琶”议题
原文传递
创新型国家战略背景下的原始性创新政策评价 被引量:42
6
作者 成全 董佳 陈雅兰 《科学学研究》 CSSCI CSCD 北大核心 2021年第12期2281-2293,共13页
原始性创新是科学技术发展与进步的源动力,是决定国家间科技乃至经济竞争成败的重要因素,我国一直把增强原始性创新能力作为新时代国家科技发展的重大战略。本文围绕创新型国家战略背景下(2006-2019年间)国家出台的原始性创新政策文件... 原始性创新是科学技术发展与进步的源动力,是决定国家间科技乃至经济竞争成败的重要因素,我国一直把增强原始性创新能力作为新时代国家科技发展的重大战略。本文围绕创新型国家战略背景下(2006-2019年间)国家出台的原始性创新政策文件为研究对象,通过建立PMC指数模型与主题模型,从政策整体质量效果、指标分布态势和主题演化规律三个维度对我国原始创新政策进行评价分析。结果发现,在创新型国家战略背景下国家发布的原始性创新政策类型丰富、内容全面,以鼓励引导型政策为主,重点围绕创新资源供给政策工具展开,但在政策的监督评估、政策覆盖面和实施力度、引导创新成果转化作用等方面仍存在需要完善的空间。针对创新型国家战略背景下国家原始性创新政策的现存问题,为我国后续更加科学有效地制定与实施原始性创新政策提出相关建议。 展开更多
关键词 原始性创新政策 政策评价 PMC指数模型 主题分析
原文传递
基于情感挖掘和话题分析的旅游舆情危机演化特征——以“丽江女游客被打”事件为例 被引量:38
7
作者 李勇 蒋冠文 +1 位作者 毛太田 蒋知义 《旅游学刊》 CSSCI 北大核心 2019年第9期101-113,共13页
现有旅游业危机管理体系缺乏对旅游舆情危机的关注。该研究聚焦旅游业的舆情危机,从情感传播的视角对旅游舆情危机的演化规律和行为特征进行深入剖析,尝试探寻旅游舆情危机传播演化的一般性规律。文章以"丽江女游客被打"事件... 现有旅游业危机管理体系缺乏对旅游舆情危机的关注。该研究聚焦旅游业的舆情危机,从情感传播的视角对旅游舆情危机的演化规律和行为特征进行深入剖析,尝试探寻旅游舆情危机传播演化的一般性规律。文章以"丽江女游客被打"事件为例,采用网页数据采集工具爬取互联网中新闻报道和用户评论的相关数据,通过提取危机关键词、识别舆情话题、计算情感强度,并结合危机生命周期的阶段性特征,对旅游舆情危机进行综合分析。研究结果显示:(1)公众心理存在"放大效应",对危机事件的评价更容易被舆论场中最突出的行为特征所掩盖,而忽视事件自身客观规律,导致以点概面的评价结果;(2)事件引发的舆情话题存在纵深发展和横向扩散两种演化方式,并衍生出新的话题,新的舆情话题伴随着负面情绪的波峰出现;(3)由公共安全引发的旅游舆情危机突发且易逝,事件生命周期长度具有显著的不确定性,与现实中案情调查进展、政府应对及信息公布和突发新闻等影响因素密切相关。 展开更多
关键词 旅游舆情危机 情感分析 话题分析 演化特征
下载PDF
基于LDA模型的主题分析 被引量:34
8
作者 石晶 范猛 李万龙 《自动化学报》 EI CSCD 北大核心 2009年第12期1586-1592,共7页
在文本分割的基础上,确定片段主题,进而总结全文的中心主题,使文本的主题脉络呈现出来,主题以词串的形式表示.为了分析准确,利用LDA(Latent dirichlet allocation)为语料库及文本建模,以Clarity度量块间相似性,并通过局部最小值识别片... 在文本分割的基础上,确定片段主题,进而总结全文的中心主题,使文本的主题脉络呈现出来,主题以词串的形式表示.为了分析准确,利用LDA(Latent dirichlet allocation)为语料库及文本建模,以Clarity度量块间相似性,并通过局部最小值识别片段边界.依据词汇的香农信息提取片段主题词,采取背景词汇聚类及主题词联想的方式将主题词扩充到待分析文本之外,尝试挖掘隐藏于字词表面之下的文本内涵.实验表明,文本分析的结果明显好于其他方法,可以为下一步文本推理的工作提供有价值的预处理. 展开更多
关键词 主题分析 LDA模型 文本分割 GIBBS抽样
下载PDF
一种基于支持向量机和主题模型的评论分析方法 被引量:23
9
作者 陈琪 张莉 +1 位作者 蒋竞 黄新越 《软件学报》 EI CSCD 北大核心 2019年第5期1547-1560,共14页
在移动应用软件中,用户评论是一种重要的用户反馈途径.用户可能提到一些移动应用使用中的问题,比如系统兼容性问题、应用崩溃等.随着移动应用软件的广泛流行,用户提供大量无结构化的反馈评论.为了从用户抱怨评论中提取有效信息,提出一... 在移动应用软件中,用户评论是一种重要的用户反馈途径.用户可能提到一些移动应用使用中的问题,比如系统兼容性问题、应用崩溃等.随着移动应用软件的广泛流行,用户提供大量无结构化的反馈评论.为了从用户抱怨评论中提取有效信息,提出一种基于支持向量机和主题模型的评论分析方法 RASL(reviewanalysis methodbased on SVM and LDA)以帮助开发人员更好、更快地了解用户反馈.首先对移动应用的中、差评提取特征,然后使用支持向量机对评论进行多标签分类.随后使用LDA主题模型(latentdirichletallocation)对各问题类型下的评论进行主题提取与代表句提取.从两个移动应用中爬取5 141条用户原始评论,并对这些评论分别用RASL方法和ASUM方法进行处理,得到两个新的文本.与经典方法ASUM相比,RASL方法的困惑度更低、可理解性更佳,包含更完整的原始评论信息,冗余信息也更少. 展开更多
关键词 用户评论 分类 主题分析
下载PDF
我国大数据政策主题分析及发展动向研判 被引量:19
10
作者 张涛 马海群 《情报理论与实践》 CSSCI 北大核心 2022年第3期72-80,共9页
[目的/意义]自国务院颁布《促进大数据发展行动纲要》以来,我国大数据产业经历了快速发展阶段,但新型冠状病毒肺炎疫情影响下国际形势发生新变化及数据正式成为新型生产要素后,给未来大数据产业发展带来了诸多不确定性,因此对我国现有... [目的/意义]自国务院颁布《促进大数据发展行动纲要》以来,我国大数据产业经历了快速发展阶段,但新型冠状病毒肺炎疫情影响下国际形势发生新变化及数据正式成为新型生产要素后,给未来大数据产业发展带来了诸多不确定性,因此对我国现有大数据政策的主题分析及未来发展动向研判具有重要的现实意义。[方法/过程]文章从团队自建语料库中选取367条大数据政策作为样本,通过构建以政策发布时间和层级为纵轴,以主题聚类、主题词共现强度、主题相似度为横轴的二维分析框架来对我国大数据政策进行综合分析。[结果/结论]分析结果表明,未来我国大数据政策可能出现六大发展动向:数据安全将成为大数据政策发展的核心问题;大数据与各领域深度融合将成为政策发展新方向;关键核心技术研发与攻关将是大数据政策持续关注点;数据智能将引领军民融合的深度发展;跨领域的大数据人才培养将是政府关注重点;构建联防联控与应急管理协同机制将以大数据为重要支点。 展开更多
关键词 大数据政策 主题分析 数据安全 政策研判
原文传递
一种基于文章主题和内容的自动摘要方法 被引量:12
11
作者 陈燕敏 王晓龙 +1 位作者 刘远超 楼喜中 《计算机工程与应用》 CSCD 北大核心 2004年第33期11-14,共4页
文章介绍了一种新的使用自然语言处理技术的自动系统。通过融合基于内容的方法和基于主题的方法,将主题与内容相结合,生成具有良好连贯性和流畅性的。该方法首先对主题词进行分析,动态地处理具有抽象标题和具体标题的文档;然后采用词汇... 文章介绍了一种新的使用自然语言处理技术的自动系统。通过融合基于内容的方法和基于主题的方法,将主题与内容相结合,生成具有良好连贯性和流畅性的。该方法首先对主题词进行分析,动态地处理具有抽象标题和具体标题的文档;然后采用词汇、语法、语义分析等自然语言处理技术,对文章的文本内容进行深入分析;再根据线性加权融合两种分析得到的结果,生成;最后采用指代消解技术使生成的更连贯流畅。与仅基于内容的自动文摘系统相比较,评测结果显示,该系统生成的质量有明显提高。 展开更多
关键词 自动文摘 自然语言处理 主题分析 内容分析 融合
下载PDF
中国智慧旅游研究综述 被引量:20
12
作者 郭晓东 李莺飞 《旅游论坛》 2015年第6期43-51,共9页
以中国CNKI学术总库中整理获得的271篇文献为研究对象,对智慧旅游相关研究进行了文献计量分析和主题内容分析。文献计量分析表明,智慧旅游研究文献的大量出现是在2012年之后,其研究机构具有明显的区域性,焦点研究问题则集中于基础理论,... 以中国CNKI学术总库中整理获得的271篇文献为研究对象,对智慧旅游相关研究进行了文献计量分析和主题内容分析。文献计量分析表明,智慧旅游研究文献的大量出现是在2012年之后,其研究机构具有明显的区域性,焦点研究问题则集中于基础理论,研究方法以定性分析为主;智慧旅游研究既未得到国内主流学术界的足够重视,也少有跨学科的研究。主题内容分析则发现,智慧旅游研究的主要内容包括智慧旅游的相关专题、智慧旅游与旅游公共服务体系、智慧旅游与智慧城市。在此基础上,文章就完善智慧旅游研究提出了若干建议。 展开更多
关键词 智慧旅游 文献计量分析 主题内容分析
下载PDF
产学研潜在合作对象识别方法研究 被引量:16
13
作者 许海云 隗玲 +2 位作者 庞弘燊 郭婷 方曙 《情报学报》 CSSCI 北大核心 2016年第5期521-529,共9页
目前对产学研合作对象的识别研究中多采用单一影响变量,因此分析的有效性难以保证,本文结合科研合作的规律进行研究,通过扩展多模数据分析,综合考虑产学研机构的技术关联分析、机构间竞争地位分析、合作网络中机构间核心边缘分析以及机... 目前对产学研合作对象的识别研究中多采用单一影响变量,因此分析的有效性难以保证,本文结合科研合作的规律进行研究,通过扩展多模数据分析,综合考虑产学研机构的技术关联分析、机构间竞争地位分析、合作网络中机构间核心边缘分析以及机构类型辅助识别领域产学研潜在合作对象。通过对基因工程疫苗领域的产学研潜在合作机构识别的实证分析考察方法的可行性。与以往研究相比,本研究更多地关注于实践过程中微观层面的合作行为,同时采用多模变量的综合分析,得出结论将具有更高参考价值。 展开更多
关键词 机构合作 合作网络 主题分析 3模网络 竞争力分析
下载PDF
网络健康社区中健康信息传播网络及主题特征研究 被引量:15
14
作者 范昊 张玉晨 吴川徽 《情报科学》 CSSCI 北大核心 2021年第1期4-12,34,共10页
【目的/意义】本文利用用户在健康信息问答过程中产生的真实数据,从网络结构和信息主题两个维度对网络健康社区中的健康信息传播网络及主题特征进行研究,进而为社区的建设和维护提供建议。【方法/过程】首先,利用社会网络分析法对不同... 【目的/意义】本文利用用户在健康信息问答过程中产生的真实数据,从网络结构和信息主题两个维度对网络健康社区中的健康信息传播网络及主题特征进行研究,进而为社区的建设和维护提供建议。【方法/过程】首先,利用社会网络分析法对不同时间阶段的健康信息传播网络进行指标测度和可视化呈现,探究其网络结构特征;然后结合LDA和已有词表,对社区内健康信息进行主题识别和提取,分析健康信息主题的分布及其变化趋势。【结果/结论】本研究发现实验选取的网络健康社区内部的健康信息传播网络具有小世界效应,用户流动性大,关键节点变更快;用户健康信息问答的内容集中在若干主题,且部分主题随时间呈现一定变化趋势。【创新/局限】网络健康信息的生成和传播源于用户之间的信息交互。本文从网络结构和信息主题两个维度开展研究,更符合其内部机理,研究更加深入和具象;网络健康社区种类众多,本文只选择其中一个社区进行研究,可能存在一定的局限性。 展开更多
关键词 网络健康社区 网络健康信息 健康信息传播 社会网络分析 主题分析
原文传递
我国专利地图研究的文献计量分析 被引量:13
15
作者 刘颖 唐永林 曾媛 《现代情报》 北大核心 2008年第10期153-157,共5页
本文利用重庆维普中文科技期刊数据库、清华同方的中国期刊全文数据库,对2003-2007年以来收录的专利地图研究领域的论文从文献的发表年代、期刊分布、著者分布、单位分布、基金资助、主题及引文进行了统计分析,探讨了这一领域文献研究... 本文利用重庆维普中文科技期刊数据库、清华同方的中国期刊全文数据库,对2003-2007年以来收录的专利地图研究领域的论文从文献的发表年代、期刊分布、著者分布、单位分布、基金资助、主题及引文进行了统计分析,探讨了这一领域文献研究现状及发展趋势,对今后的进一步研究提出了建议。 展开更多
关键词 专利地图 文献计量学 主题分析
下载PDF
基于在线健康社区用户画像的情感表达特征研究 被引量:11
16
作者 王帅 纪雪梅 《情报理论与实践》 CSSCI 北大核心 2022年第6期179-187,共9页
[目的/意义]通过构建在线健康社区用户画像,解释不同用户群体的情感差异和特征,以掌握社区用户情感表达规律,推动在线健康社区的信息支持与情感支持功能建设。[方法/过程]首先,分析建立用户画像的目的,结合在线健康社区的数据特点建立... [目的/意义]通过构建在线健康社区用户画像,解释不同用户群体的情感差异和特征,以掌握社区用户情感表达规律,推动在线健康社区的信息支持与情感支持功能建设。[方法/过程]首先,分析建立用户画像的目的,结合在线健康社区的数据特点建立包含基本信息、情感、主题和信息行为特征的用户画像概念模型。其次,确定各用户的标签属性,对标签属性进行抽取。最后,结合情感标签对用户角色进行划分,利用具有噪声的基于密度的空间聚类方法(Density-Based Spatial Clustering of Applications with Noise,DBSCAN)实现了用户画像并分析不同角色的画像特征。[结果/结论]提出的方法可以有效生成贴近用户原貌的画像并识别用户情感表达特征。通过实例分析挖掘出焦虑型、愤怒型、祈祷型、乐观型和悲哀型等5类社区用户群,各用户群体在性别、年龄、影响力、活跃度和兴趣主题方面均表现出不同的情感特征差异。 展开更多
关键词 在线健康社区 情感分析 用户画像 主题分析 DBSCAN聚类
原文传递
重大突发公共卫生事件下的公众情感演进分析:基于新冠肺炎疫情的考察 被引量:10
17
作者 边晓慧 徐童 《数据分析与知识发现》 CSSCI CSCD 北大核心 2022年第7期128-140,共13页
【目的】对重大突发公共卫生事件背景下公众在社交媒体中的情感表达进行分析,揭示疫情期间公众情感的时空差异、不同主题下的情感演化以及情感的跨地域扩散。【方法】利用主题模型提炼潜在话题与关键词群,从全局视角和主题视角探究公众... 【目的】对重大突发公共卫生事件背景下公众在社交媒体中的情感表达进行分析,揭示疫情期间公众情感的时空差异、不同主题下的情感演化以及情感的跨地域扩散。【方法】利用主题模型提炼潜在话题与关键词群,从全局视角和主题视角探究公众情感演进趋势,并使用社交传播模型描述公众情感的跨地域扩散。【结果】疫情期间公众以积极情感为主,消极情感呈现“恶”的情感主导、“惧”的情感先发、“哀”的情感反复等特征;疫区距离与经济水平导致公众情感存在空间差异。同时,情感表达及演化趋势因受时空变化、主题/事件区别等影响而具有一定规律的差异。此外,公众情感的地域扩散强度受空间关系和疫情严重性的双重影响。【局限】面向纯文本信息,无法对多模态信息如视频、图片等进行综合性分析。【结论】重大突发公共卫生事件下,公众在社交媒体上的情感表达及演化趋势受时空差异、主题差异等影响,并存在一定的地域扩散规律。这提示疫情防控要结合特定时期、特定地域采取差异化策略,关注不同主题类型对情感的关联性影响,同时注重疫情防控与舆情监控的区域统筹与合作,以实现对舆情的积极引导和公众情感的有效疏解。 展开更多
关键词 突发公共卫生事件 微博舆情 情绪演化 主题分析 时空分析
原文传递
政策对科研选题的影响——基于政策文本量化方法的研究 被引量:9
18
作者 梁继文 杨建林 王伟 《现代情报》 CSSCI 2021年第8期109-118,共10页
[目的/意义]提出自动化的政策文本量化方法,探索政策对科研选题的影响,为趋势预测、前沿识别以及未来的科研选题提供参考。[方法/过程]文章以战略性新兴产业中的新能源汽车领域为样板,综合使用了文献调研法、专家咨询法与政策工具,将政... [目的/意义]提出自动化的政策文本量化方法,探索政策对科研选题的影响,为趋势预测、前沿识别以及未来的科研选题提供参考。[方法/过程]文章以战略性新兴产业中的新能源汽车领域为样板,综合使用了文献调研法、专家咨询法与政策工具,将政策文本表征为词向量后,通过特征扩展来识别关键性政策文本,并抽取政策关键短语来代表政策主题;选用LDA模型提取论文主题来表征科研选题,通过对比分析政策文本主题与论文主题来探索政策对科研选题的影响。[结果/结论]通过实证研究表明,文章提出的方法可以实现政策文本的自动分解;证实了政策会对科研选题产生一定程度的影响,并为前沿识别与趋势预测研究提供建议。 展开更多
关键词 政策文本量化 政策分解 主题分析 科研选题 LDA模型 情报服务 前沿识别 趋势预测 新能源汽车
下载PDF
基于小世界模型的中文文本主题分析 被引量:9
19
作者 石晶 胡明 戴国忠 《中文信息学报》 CSCD 北大核心 2007年第3期69-75,共7页
本文旨在研究如何基于小世界模型进行文本分割,确定片段主题,进而总结全文的中心主题,使文本的主题脉络呈现出来。为此首先证明由文本形成的词汇共现图呈现短路径,高聚集度的特性,说明小世界结构存在于文本中;然后依据小世界结构将词汇... 本文旨在研究如何基于小世界模型进行文本分割,确定片段主题,进而总结全文的中心主题,使文本的主题脉络呈现出来。为此首先证明由文本形成的词汇共现图呈现短路径,高聚集度的特性,说明小世界结构存在于文本中;然后依据小世界结构将词汇共现图划分为“簇”,通过计算“簇”在文本中所占的密度比重识别片段边界,使“簇”与片段对应起来;最后利用短路径,高聚集度的特性提取图“簇”的主题词,采取背景词汇聚类及主题词联想的方式将主题词扩充到待分析文本之外,尝试挖掘隐藏于字词表面之下的文本内涵。虽然国际上已有很多关于小世界结构及基于其上的应用研究,但利用小世界特性进行主题分析还是一个崭新的课题。实验表明,本文所给方法的结果明显好于其他方法,说明可以为下一步文本推理的工作提供有价值的预处理。 展开更多
关键词 计算机应用 中文信息处理 主题分析 小世界模型 文本分割 词汇聚类
下载PDF
建筑火灾研究现状的可视化分析 被引量:8
20
作者 李杰 陈伟炯 《消防科学与技术》 CAS 北大核心 2018年第2期250-254,共5页
为了解我国建筑火灾研究的基本现状,以CNKI中收录的关于"建筑火灾"的核心期刊文献作为数据源,利用Cite Space科学可视化工具,分别从时间分布、空间合作、作者合作以及热点主题等方面进行分析。结果显示:我国建筑火灾研究已进... 为了解我国建筑火灾研究的基本现状,以CNKI中收录的关于"建筑火灾"的核心期刊文献作为数据源,利用Cite Space科学可视化工具,分别从时间分布、空间合作、作者合作以及热点主题等方面进行分析。结果显示:我国建筑火灾研究已进入相对成熟的时期;南京工业大学、中国科学技术大学及中国人民武装警察部队学院等以及来自这些机构的高产学者共同组成了建筑火灾的核心研究力量;建筑火灾的热点主题集中在高层建筑、数值模拟、性能化、火灾风险以及大空间建筑等方面。 展开更多
关键词 建筑火灾 可视化分析 合作网络 主题分析 关键词共现 研究热点 CITESPACE
下载PDF
上一页 1 2 9 下一页 到第
使用帮助 返回顶部