期刊文献+
共找到59篇文章
< 1 2 3 >
每页显示 20 50 100
基于LDA主题模型的科学文献主题识别:全局和学科两个视角的对比分析 被引量:17
1
作者 王曰芬 傅柱 陈必坤 《情报理论与实践》 CSSCI 北大核心 2016年第7期121-126,101,共7页
[目的]利用LDA主题模型来探究全局主题和学科主题之间存在的差异。[方法]基于LDA主题模型,以国内知识流研究领域为例,在主题抽取的基础上,比较与分析全局主题和学科主题所存在的差异。[结果]全局主题和学科主题在可描述性、内容相关性... [目的]利用LDA主题模型来探究全局主题和学科主题之间存在的差异。[方法]基于LDA主题模型,以国内知识流研究领域为例,在主题抽取的基础上,比较与分析全局主题和学科主题所存在的差异。[结果]全局主题和学科主题在可描述性、内容相关性、内容质量、学科分布4个方面具有显著的差异。[局限]采用经验判断选取了用于实验分析的全局热点主题和学科热点主题。 展开更多
关键词 LDA模型 科学文献 主题识别 知识流
原文传递
基于主题模型的产品在线论坛主题演化分析 被引量:13
2
作者 蒋翠清 吕孝忠 段锐 《系统工程学报》 CSCD 北大核心 2019年第5期598-609,共12页
产品论坛主题演化分析对企业的市场营销和产品改进决策具有重要价值.针对产品论坛的特点构建了一个基于潜在狄利克雷分布(latent Dirichlet allocation, LDA)模型的产品在线评论主题演化分析模型,从主题标签、主题热度和主题词热度三个... 产品论坛主题演化分析对企业的市场营销和产品改进决策具有重要价值.针对产品论坛的特点构建了一个基于潜在狄利克雷分布(latent Dirichlet allocation, LDA)模型的产品在线评论主题演化分析模型,从主题标签、主题热度和主题词热度三个层面挖掘海量在线产品评论的主题演化.实验表明,该方法能够挖掘产品在线论坛的主题演化规律.发现不同论坛上同一产品的消费者关注点存在共性和差异性,关注点热度变化存在随机性,关注中心存在稳定性,以及高评论丰富度的论坛更容易形成主题演化关系等规律. 展开更多
关键词 主题演化 产品在线论坛 潜在狄利克雷分布模型 主题热度
下载PDF
以分类主题抽取为视角的学科主题挖掘——基于LDA模型的国外知识流研究结构探讨 被引量:12
3
作者 傅柱 王曰芬 关鹏 《情报理论与实践》 CSSCI 北大核心 2016年第8期96-102,共7页
[目的]为了能够更为全面地探索和揭示研究领域的知识结构和热点主题,文章提出基于分类视角的LDA主题抽取方法。[方法]以国外知识流领域为研究对象,根据研究方向将知识流的相关文献分为5类。利用LDA主题模型分别对分类后的文献集进行主... [目的]为了能够更为全面地探索和揭示研究领域的知识结构和热点主题,文章提出基于分类视角的LDA主题抽取方法。[方法]以国外知识流领域为研究对象,根据研究方向将知识流的相关文献分为5类。利用LDA主题模型分别对分类后的文献集进行主题抽取,筛选得到不同研究方向下的11个热点主题,并深入分析不同研究方向下热点主题所揭示的知识点。[结果]实验结果表明,基于分类视角的LDA主题抽取方法能够较为全面和细致地挖掘研究领域的学科主题和研究热点。[局限]所提的方法未能与其他主题挖掘方法进行对比,研究结果也未与现有文献中分析出的知识流领域研究热点进行对照。 展开更多
关键词 知识流 LDA模型 主题抽取 知识结构 研究热点
原文传递
基于隐含狄利克雷分配模型的消费者在线评论复杂网络构建及其应用 被引量:10
4
作者 刘晓君 那日萨 崔雪莲 《系统工程学报》 CSCD 北大核心 2017年第3期305-312,共8页
为研究消费者在线评论的相互关系及整体演化发展,以隐含狄利克雷分配模型对消费者在线评论进行话题挖掘为基础,通过Pearson相似度确定评论间话题关系,构建了以评论为节点的复杂网络模型.以京东等平台上的手机评论语料库为例,对相应复杂... 为研究消费者在线评论的相互关系及整体演化发展,以隐含狄利克雷分配模型对消费者在线评论进行话题挖掘为基础,通过Pearson相似度确定评论间话题关系,构建了以评论为节点的复杂网络模型.以京东等平台上的手机评论语料库为例,对相应复杂网络的拓扑特性进行分析.研究表明,相同产品相同规模的评论网络统计特性相近;而相同平台上同一产品不同规模的评论网络性质差异明显,即小规模评论(产品销售初期)构成的网络是一个无标度网络,大规模评论(产品销售中后期)构成的网络演化为一个度分布为钟形分布的小世界网络.揭示了消费者发表在线评论行为之间相互作用,会影响整体评论网络的拓扑性质和演化规律,并为市场营销和管理实践提出了指导性建议. 展开更多
关键词 在线评论 隐含狄利克雷分配模型 复杂网络 皮尔森相似度 度分布
下载PDF
基于LDA主题模型的网络问答社区妊娠合并糖尿病孕产妇健康信息需求分析 被引量:6
5
作者 马誉萁 侯小妮 +4 位作者 段红梅 徐杨 陈延亭 李博文 金宁宁 《护理学杂志》 CSCD 北大核心 2023年第7期86-89,124,共5页
目的 应用LDA主题模型挖掘妊娠合并糖尿病孕产妇信息需求,为医护人员开展有效信息服务提供参考。方法 采用网络爬虫程序获取网络问答社区妊娠合并糖尿病板块的用户问答数据,采用LDA主题模型对数据进行主题识别,分析信息需求。结果 通过... 目的 应用LDA主题模型挖掘妊娠合并糖尿病孕产妇信息需求,为医护人员开展有效信息服务提供参考。方法 采用网络爬虫程序获取网络问答社区妊娠合并糖尿病板块的用户问答数据,采用LDA主题模型对数据进行主题识别,分析信息需求。结果 通过对126 616条数据的LDA主题分析,妊娠合并糖尿病孕产妇的信息需求包括8类:母儿危害与检查,母儿自我监护,营养体质量控制与胎儿生长发育,筛查与产检,病友经验分享与情感支持,细分食物类别的选择与升糖效应,分娩及产后母婴健康管理,血糖调控与餐食、胰岛素用药。结论 妊娠合并糖尿病孕产妇的信息需求多元、专业、精细化,包括认知、生理、情感等多个维度,医护人员应发挥医患共同信息服务主体作用,针对妊娠合并糖尿病孕产妇提供专业、精细、全面的信息服务。 展开更多
关键词 妊娠合并糖尿病 健康信息需求 网络问答社区 LDA主题模型 孕期保健 围生期护理
下载PDF
基于LDA模型的微博话题发现技术研究 被引量:10
6
作者 李凤岭 朱保平 《计算机应用与软件》 CSCD 北大核心 2014年第10期24-26,66,共4页
微博中存在着数以亿计的用户,这些用户每天发布大量的信息。这些海量的微博信息给热点话题发现提出了严峻的挑战。应用LDA(Latent Dirichlet Allocation)模型对微博中隐含的话题进行建模,利用话题间的共享词汇将话题构成一个无向加权图... 微博中存在着数以亿计的用户,这些用户每天发布大量的信息。这些海量的微博信息给热点话题发现提出了严峻的挑战。应用LDA(Latent Dirichlet Allocation)模型对微博中隐含的话题进行建模,利用话题间的共享词汇将话题构成一个无向加权图,并通过PageRank算法将话题进行排名。实验结果表明,排名后返回给用户的话题的准确性明显高于未排名的结果。 展开更多
关键词 微博 话题 排名 LDA模型
下载PDF
基于结构洞理论的虚拟社区边缘用户信息资源推荐模型构建研究 被引量:10
7
作者 夏立新 郑路 +1 位作者 翟姗姗 李重阳 《情报理论与实践》 CSSCI 北大核心 2017年第2期1-6,共6页
[目的/意义]在虚拟社区中,用户发布信息与传播信息是平台影响力与持续发展的重要因素。应挖掘边缘用户兴趣偏好,进行个性化资源推荐,满足其信息需求,让占据虚拟社区用户数量最大的"边缘用户"参与到信息传递的各个环节中,促使... [目的/意义]在虚拟社区中,用户发布信息与传播信息是平台影响力与持续发展的重要因素。应挖掘边缘用户兴趣偏好,进行个性化资源推荐,满足其信息需求,让占据虚拟社区用户数量最大的"边缘用户"参与到信息传递的各个环节中,促使其向核心用户"靠拢",甚至成为核心用户。[方法/过程]文章试图以边缘用户的好友之间的关注关系形成社会网络为基础,结合好友发布信息内容,运用基于聚类的社群分析方法 Concor算法以及LDA主题模型,实现多粒度兴趣主题发现,再融入结构洞测度方法,挖掘每个兴趣主题下"结构洞",将结构洞位置用户占据的信息资源推荐给边缘用户。[结果/结论]实现边缘用户资源推荐模型的构建。[局限]在今后的研究中,将在此基础上,依照该模型,通过虚拟社区真实数据,进一步验证、完善该模型。 展开更多
关键词 LDA模型 结构洞 资源推荐 虚拟社区
原文传递
政策工具视域下我国省级数字经济政策文本的量化分析——基于LDA的主题社会网络分析 被引量:5
8
作者 陈美 孙瑞乾 《情报杂志》 北大核心 2023年第11期174-182,共9页
[研究目的]数字经济发展如火如荼,各地方政府纷纷颁布数字经济发展的地方法规和规范性文件。开展省级层面数字经济政策的研究,力图为我国数字经济发展和政策制定提供参考。[研究方法]基于政策工具理论,采用效词分析法,运用LDA主题模型,... [研究目的]数字经济发展如火如荼,各地方政府纷纷颁布数字经济发展的地方法规和规范性文件。开展省级层面数字经济政策的研究,力图为我国数字经济发展和政策制定提供参考。[研究方法]基于政策工具理论,采用效词分析法,运用LDA主题模型,对截至2022年12月现行有效的24个省份综合性政策文本进行无监督的机器学习分析,以厘清各政策文本隐含关系。同时,借助社会网络分析计算主题特征词的关联程度,从可视化层面佐证LDA模型结果。[研究结论]现有数字经济政策辐射社会各领域,既包括常规性发展重点,也关注新兴社会问题和现行制度漏洞,但存在对供给型政策工具依赖过多,导致政策工具使用比例失衡和“强制性”治理理念主导。为此,优化配置政策工具、避免政府为中心的公共政策范式、促进政策目标、执行与体系的良性耦合和转变政策监管态度成为我国省级层面数字经济政策的未来发展路径。 展开更多
关键词 数字经济 政策工具 政策文本 LDA主题模型 文本挖掘 社会网络分析
下载PDF
失效专利的主题挖掘与应用分析——以2007—2016年镜头失效专利为例 被引量:8
9
作者 袁慧 马建霞 《情报理论与实践》 CSSCI 北大核心 2017年第12期128-133,74,共7页
[目的/意义]研究基于失效专利的数据,以相机和望远镜的镜头相关专利为例,从主题聚类的角度研究该领域中技术的节点并分析高频主题的技术成熟度;通过案例对专利失效的原因和应用过程中的侵权问题进行分析,为技术应用和创新提供思路。[方... [目的/意义]研究基于失效专利的数据,以相机和望远镜的镜头相关专利为例,从主题聚类的角度研究该领域中技术的节点并分析高频主题的技术成熟度;通过案例对专利失效的原因和应用过程中的侵权问题进行分析,为技术应用和创新提供思路。[方法/过程]使用LDA模型对失效专利的主题进行分析,计算得到主题出现的频率和主题之间的相似性,进而分析主题相关技术的成熟度;通过案例分析对比专利失效的原因以及应用中侵权的情况,归纳规避侵权的方法。[结果/结论]LDA模型能够很好地发现失效专利中的技术主题,文章使用的失效专利分析方法与侵权规避过程能够为企业进行技术市场重定位和技术应用创新提供一定的参考。 展开更多
关键词 失效专利 LDA模型 主题聚类 技术成熟度 应用分析
原文传递
在线母婴论坛中不同时期孕产妇健康信息需求的分析 被引量:6
10
作者 仁青卓玛 王世奇 +1 位作者 侯小妮 段红梅 《中华现代护理杂志》 2022年第16期2121-2125,共5页
目的了解母婴论坛中孕产妇的健康信息需求,为开展孕产妇健康教育工作提供理论依据和信息支持。方法2020年7月1—31日在"妈妈网"问答栏目中备孕期、怀孕期、哺乳期3大板块的提问文本,进行数据清洗和分词处理后采用潜在狄利克... 目的了解母婴论坛中孕产妇的健康信息需求,为开展孕产妇健康教育工作提供理论依据和信息支持。方法2020年7月1—31日在"妈妈网"问答栏目中备孕期、怀孕期、哺乳期3大板块的提问文本,进行数据清洗和分词处理后采用潜在狄利克雷分配(LDA)主题模型挖掘主题特征。结果"妈妈网"提问记录的主题特征分析显示,LDA模型将32466条提问记录共划分为3个阶段10个主题,即备孕期(孕前健康知识需求、备孕期情感特征、二胎备孕、辅助生殖),怀孕期(孕早期、孕中期、孕晚期、分娩期),哺乳期(喂养知识需求、婴儿照护需求)。结论基于LDA主题模型的研究结果可反映孕产妇用户关于在线母婴论坛的信息需求,为孕产妇不同时期孕产知识及特殊的情感需求提供信息指导与情感支持。 展开更多
关键词 母婴护理 孕产妇 健康信息 在线论坛 LDA模型
原文传递
结合半监督学习和LDA模型的文本分类方法 被引量:7
11
作者 韩栋 王春华 肖敏 《计算机工程与设计》 北大核心 2018年第10期3265-3271,共7页
针对样本集中具有较少标记样本情况下的文本分类问题,提出一种结合半监督学习(SSL)和隐含狄利克雷分配(LDA)主题模型的标记样本扩展方法(SSL-LDA),并整合朴素贝叶斯(NB)分类器构建一种文本分类方法。使用LDA主题模型生成主题分布,以表... 针对样本集中具有较少标记样本情况下的文本分类问题,提出一种结合半监督学习(SSL)和隐含狄利克雷分配(LDA)主题模型的标记样本扩展方法(SSL-LDA),并整合朴素贝叶斯(NB)分类器构建一种文本分类方法。使用LDA主题模型生成主题分布,以表示所有样本;根据训练集中已标记样本,通过一种简化粒子群优化(SPSO)算法获得SSL-LDA自训练模型的最优参数;基于SSL-LDA自训练模型对训练集中一些未标记样本进行标记,扩展训练集;基于扩展后的训练集,训练NB文本分类器。在3个数据集上的实验结果表明,该方法能够很好地应对标记样本较少的情况,获得了较高的分类精确度。 展开更多
关键词 文本分类 半监督学习 LDA主题模型 简化粒子群优化 标记样本扩展
下载PDF
检验医学期刊新媒体推文主题分析及优化策略
12
作者 周丽 方琪 +5 位作者 何金龙 曾蕴林 卜梦婵 陈丞 伍胤志 张耀元 《中国科技期刊研究》 北大核心 2024年第7期932-940,共9页
【目的】分析检验医学期刊新媒体高阅读量推文主题,以揭示用户关注的热点和偏好,指导制定推文主题优化策略,旨在提升检验医学期刊新媒体传播力和影响力。【方法】以“检验医学”微信公众号(以下简称“检验医学”)为例,采用Python编程筛... 【目的】分析检验医学期刊新媒体高阅读量推文主题,以揭示用户关注的热点和偏好,指导制定推文主题优化策略,旨在提升检验医学期刊新媒体传播力和影响力。【方法】以“检验医学”微信公众号(以下简称“检验医学”)为例,采用Python编程筛选出在2018年1月1日至2023年5月31日投放的阅读量排名前100的推文,基于隐含狄利克雷分布模型对100篇推文主题识别与分析,进而提出针对性的检验医学期刊新媒体推文主题优化策略。【结果】“检验医学”高阅读量推文主题为“新冠疫情防控核酸检测政策文件”主题、“医疗行业行为规范”主题、“职业资格考试和继续教育”主题。依据主题识别和分析结果提出多声部复调式(系列化子主题开发、新视角主题演绎及案例主题集萃)推文主题优化策略,以拉伸推文主题的叙事张力,从文本述说到述说文本,从而提升检验医学期刊新媒体推文主题内容的深度与广度。【结论】识别和分析“检验医学”高阅读量推文主题,有助于制定更精准的推文主题优化策略,为检验医学期刊新媒体高阅读量推文未来主题的研究创新与空间拓展提供依据。 展开更多
关键词 检验医学期刊 新媒体 推文主题 隐含狄利克雷分布模型 阅读量
原文传递
基于知识图谱的滑坡易发性评价文献综述及研究进展
13
作者 郭飞 赖鹏 +3 位作者 黄发明 刘磊磊 王秀娟 何政宇 《地球科学》 EI CAS CSCD 北大核心 2024年第5期1584-1606,共23页
滑坡易发性评价是滑坡风险评估的基础和核心内容,开展滑坡易发性文献计量分析可以定量化地分析其研究进展及发展趋势,为国内开展地灾风险评估工作提供参考.利用Web of Science和CNKI数据库,基于CiteSpace可视化知识图谱分析工具对1985-2... 滑坡易发性评价是滑坡风险评估的基础和核心内容,开展滑坡易发性文献计量分析可以定量化地分析其研究进展及发展趋势,为国内开展地灾风险评估工作提供参考.利用Web of Science和CNKI数据库,基于CiteSpace可视化知识图谱分析工具对1985-2022年已发表的滑坡易发性文献进行计量分析,并对摘要部分进行了LDA分析,来细分该领域内的研究.结果表明:(1)滑坡易发性评价仍然是当前的研究热点,中国是滑坡易发性研究较为活跃的国家且国际间合作较多;(2)滑坡易发性领域发文量前10的作者中4位来自中国,中国科学院成为发文最多的机构,接收易发性评价类文章最多的中英文期刊分别是《中国地质灾害与防治学报》和《Natural Hazard》,中国国家自然科学基金和国土资源大调查项目大力资助了滑坡易发性课题的研究;(3)近5年来,机器学习模型(包括深度学习等)在滑坡易发性的应用快速增长,已成为最热门的研究方法;(4)为了实现滑坡易发性建模的精简化和智能化,并进一步提高滑坡易发性评价结果的精度和实用性,滑坡易发性在滑坡编目、指标体系、评价单元、评价模型、联接方法和精度评价等方面还需开展深入探索. 展开更多
关键词 滑坡易发性 CITESPACE 知识图谱 计量分析 LDA主题模型 灾害 工程地质
原文传递
基于概率话题模型的轻微型肝性脑病患者肠道菌群结构研究 被引量:6
14
作者 王侠林 左赞 +2 位作者 范红 孔祥阳 贺建峰 《微生物学报》 CAS CSCD 北大核心 2018年第7期1274-1286,共13页
【目的】利用LDA(Latent Dirichlet Allocation)概率话题模型分析轻微型肝性脑病(MHE)患者服用利福昔明联合益生菌对其肠道菌群结构异质性和临床疗效的影响。【方法】采用R语言包中的LDA概率话题模型的折叠Gibbs抽样蒙特卡洛算法,对MHE... 【目的】利用LDA(Latent Dirichlet Allocation)概率话题模型分析轻微型肝性脑病(MHE)患者服用利福昔明联合益生菌对其肠道菌群结构异质性和临床疗效的影响。【方法】采用R语言包中的LDA概率话题模型的折叠Gibbs抽样蒙特卡洛算法,对MHE患者肠道菌群结构的时间异质性OTUs(operational taxonomic unit)数据集进行分析。【结果】LDA模型将MHE患者的42份粪便样本分成3个主题(topic),并能鉴定出影响MHE患者肠道菌群异质性结构最大的OTUs菌属,分别为埃希菌属(Escherichia)、类杆菌属(Bacteroides)和链球菌属(Streptococcus)。对比治疗前后,这3种菌属在组内的变异模式为同类型菌属的转变次数和频率均高于不同类型的菌属。利福昔明联合益生菌治疗组和单独利福昔明治疗组治疗后,MHE患者的肠道菌群结构均有所改变(P<0.05)。此外,根据临床疗效指标,对比两组患者治疗后血清IL-2、IL-4、IL-6、IL-10、TNF-α、TBIL、ALT、CRP、NCT-A、γ-GGT及血氨水平,观察组明显优于对照组,差异显著,有统计学意义(P<0.05)。治疗组总有效率88.8%,不良反应总发生率22.2%,对照组总有效率75%,不良反应总发生率38.5%(P<0.05)。【结论】LDA模型不仅能有效地量化菌群结构的异质性,还能鉴定出相对应影响异质性最大的OTUs。利福昔明联合益生菌疗法能明显改善MHE患者的血氨水平和血清炎性因子水平,且对MHE患者的肠道菌群结构也有一定的改变,具体表现为致病菌数量减少,有益菌数量增加,具有较好的临床应用价值。 展开更多
关键词 LDA模型 GIBBS采样 轻微型肝性脑病 利福昔明 利福昔明联合益生菌
原文传递
基于隐含狄利克雷分配模型的企业创新测量方法研究
15
作者 叶琴 蔡建峰 张秋韵 《科技进步与对策》 北大核心 2024年第2期90-98,共9页
如何准确测量企业创新是国家创新驱动发展战略背景下学界和业界亟待解决的关键问题。近年来,专利和研发支出作为当前主流企业创新代理指标备受质疑。为此,基于上市公司分析师报告文本,引入机器学习领域非监督学习方法,通过构建隐含狄利... 如何准确测量企业创新是国家创新驱动发展战略背景下学界和业界亟待解决的关键问题。近年来,专利和研发支出作为当前主流企业创新代理指标备受质疑。为此,基于上市公司分析师报告文本,引入机器学习领域非监督学习方法,通过构建隐含狄利克雷分配主题模型,开发一种新的测量企业创新的方法,并与当前主流方法进行比较。研究发现:①基于文本的企业创新测量方法既适用于专利和研发企业,也适用于非专利和非研发企业;②对于专利和研发企业而言,基于文本的企业创新与企业专利申请和研发支出显著相关;对于非专利和非研发企业而言,新测量方法能够有效识别企业利用新技术、开辟新市场等创新实践;③时间序列分析表明,基于文本分析的企业创新能够准确反映样本区间企业创新活动宏观趋势。 展开更多
关键词 隐含狄利克雷分配模型 企业创新 文本分析 主题模型 分析师报告
下载PDF
基于LDA的地铁施工安全隐患排查要点挖掘与可视化研究 被引量:3
16
作者 潘杏 钟波涛 +1 位作者 黑永健 骆汉宾 《土木建筑工程信息技术》 2021年第2期7-14,共8页
随着地铁的快速建设和隐患排查系统的建立,系统中积累了大量隐患排查记录,但是隐患排查记录信息冗杂,相关工作严重依赖导则与专家经验,需要投入大量人力成本。为提高隐患排查工作效率和安全管理决策,同时促进排查工作实现全程自动化,本... 随着地铁的快速建设和隐患排查系统的建立,系统中积累了大量隐患排查记录,但是隐患排查记录信息冗杂,相关工作严重依赖导则与专家经验,需要投入大量人力成本。为提高隐患排查工作效率和安全管理决策,同时促进排查工作实现全程自动化,本文提出了一种基于文本挖掘与可视化技术的自动化分析隐患排查文本框架,该框架主要包括以下四个步骤:第一,基于Term Frequency-Inverse Document Frequency(TF-IDF)算法,对隐患描述下的关键词有一个整体的概括;第二,基于TF-IDF筛出特征值较高的关键词,借助吉布斯抽样的Latent Dirichlet Allocation(LDA)模型识别出大规模隐患描述语料库中潜藏的主题信息和隐患排查要点;第三,结合时间维度,通过Word Cloud(WC)技术对隐患描述进行可视化分析,绘制隐患词云演化图;第四,借助Word Co-occurrence Network(WCN)模型,挖掘隐患共现关系。该框架在分析武汉地铁2016-2018年施工安全隐患排查记录中得到了应用和验证。实验结果表明,该框架有效挖掘出34类隐患所对应的隐患排查要点和可视化信息。 展开更多
关键词 安全管理 地铁施工安全 隐患排查要点 文本挖掘 latent dirichlet allocation模型 数据可视化
下载PDF
基于LDA模型热点主题的科技期刊发展分析与建议:以旱地农业领域期刊为例
17
作者 赵慧敏 吾际舟 +4 位作者 赵彩霞 何文清 毛丽丽 赵瑞雪 梅旭荣 《中国科技期刊研究》 北大核心 2023年第12期1672-1684,共13页
【目的】为深入了解旱地农业这一特定领域内科技期刊发展和分布的特点,探索学科热点主题发展与期刊发展之间的联系,以旱地农业领域文献数据为基础,提出基于隐含狄利克雷分布(LDA)模型的科技期刊发展分析的方法和框架。【方法】从LDA模... 【目的】为深入了解旱地农业这一特定领域内科技期刊发展和分布的特点,探索学科热点主题发展与期刊发展之间的联系,以旱地农业领域文献数据为基础,提出基于隐含狄利克雷分布(LDA)模型的科技期刊发展分析的方法和框架。【方法】从LDA模型提取的旱地农业领域热点主题入手,自定义期刊热点主题追随度指数、领域重点期刊的遴选标准和分类标准,对不同类型的期刊进行热点主题追随度分析,并对学科领域期刊的分布和中国期刊发展概况进行多方位的数据提取和展示。【结果】整个旱地农业领域研究的发展和重要期刊发展相互促进,不同类型期刊热点主题特点不一。发展速度快的重点期刊(包括顶级期刊、最快发展和较快发展重点期刊)中,所有旱地农业热点主题的相对增长率>0;非较快发展重点期刊和非重点期刊,其各个热点主题的增长率均<0。最快发展重点期刊紧随规模大且发展速度快的热点主题;顶级期刊和较快发展重点期刊则紧随旱地农业领域中发展速度相对快的方向。旱地农业领域发文期刊集中,77%以上论文出版于美国、荷兰、英国、瑞士、德国,仅4.3%的中国作者论文在本土出版。中国主要SCI期刊的期刊指数居中,刊出热点主题与全球一致性高。【结论】应积极推动中国SCI论文和中国SCI期刊的良性互动,优先建设快速发展的科研领域期刊。期刊要抓住研究热点,且在不同发展阶段有不同侧重点。 展开更多
关键词 隐含狄利克雷分布模型 主题聚类 期刊发展分析 重点期刊遴选 热点主题追随度 旱地农业
原文传递
在线医疗社区中银屑病患者健康信息需求的分析 被引量:3
18
作者 王艺锦 何旭东 段红梅 《中华现代护理杂志》 2022年第16期2131-2136,共6页
目的分析在线医疗社区中关于银屑病的问答记录,了解医患群体的相关信息及提问记录的主题特征,探究银屑病患者的健康信息需求。方法采集2020年1月1日—12月31日浏览量排名前3位的在线医疗社区的银屑病用户提问记录数据,对数据进行预处理... 目的分析在线医疗社区中关于银屑病的问答记录,了解医患群体的相关信息及提问记录的主题特征,探究银屑病患者的健康信息需求。方法采集2020年1月1日—12月31日浏览量排名前3位的在线医疗社区的银屑病用户提问记录数据,对数据进行预处理后,通过潜在狄利克雷分配(LDA)主题模型对提问记录进行主题特征挖掘,同时分析医患群体的相关信息。结果共得到8959条规范数据,分为8个主题,反映了患者在银屑病的治疗、护理、临床症状、发病因素等方面的实际需求。结论应用LDA主题模型分析在线医疗社区中的数据可以反映银屑病患者对健康信息的需求与治疗护理要点,可基于患者需求提供护理指导,完善皮肤疾病健康教育模式,为皮肤疾病护理的研究提供借鉴。 展开更多
关键词 银屑病 在线医疗社区 健康信息需求 LDA主题模型 主题挖掘
原文传递
基于LDA模型的大规模文本挖掘算法研究 被引量:2
19
作者 董薇 庞峰 顾炜江 《软件》 2020年第12期58-63,共6页
针对海量文本信息的挖掘与处理是目前文本挖掘领域的一个热点问题,LDA模型是文本挖掘领域中应用广泛的一种主流模型。LDA模型能够通过快速学习和训练,检测出文本集中潜在的主题词。传统算法对速度和内存优化并不明显。文章从几个不同的... 针对海量文本信息的挖掘与处理是目前文本挖掘领域的一个热点问题,LDA模型是文本挖掘领域中应用广泛的一种主流模型。LDA模型能够通过快速学习和训练,检测出文本集中潜在的主题词。传统算法对速度和内存优化并不明显。文章从几个不同的方面阐述了LDA模型及其扩展模型在处理大规模文本数据时的应用,从参数估计、在线学习和并行优化方面进行了比对,对其中在线模型进行了实验验证,引入狄利克雷参数、BP信念传播算法,在几组数据集上进行了实验,分析其性能。 展开更多
关键词 主题模型 潜在狄利克雷分布 在线LDA模型 BP信念传播算法 参数估计
下载PDF
语义约束和时间关联LDA的社交媒体主题词链提取 被引量:3
20
作者 万红新 彭云 《小型微型计算机系统》 CSCD 北大核心 2018年第4期742-747,共6页
网络社交媒体文本中蕴含着丰富的评论主题信息,由于数据规模大、自然语言表达以及随时间变化等因素,增加了从文本中提取主题词的难度.根据中文社交媒体的语法结构及语义特征,利用LDA主题模型的文本降维及主题词语获取功能,并结合语义约... 网络社交媒体文本中蕴含着丰富的评论主题信息,由于数据规模大、自然语言表达以及随时间变化等因素,增加了从文本中提取主题词的难度.根据中文社交媒体的语法结构及语义特征,利用LDA主题模型的文本降维及主题词语获取功能,并结合语义约束和时间关联提出了主题词链提取算法及模型.首先利用句法分析、词性关系和语境相关等进行词语语义关系获取,然后将语义和时间嵌入到LDA主题模型,构建符合中文社交媒体文本语法、语义结构特点的动态主题词链提取模型.实验结果表明,该模型可以改善LDA模型的语义理解功能和主题捕捉能力,提高主题词链提取的准确率和召回率. 展开更多
关键词 社交媒体 主题模型 语义约束 LDA模型 时间关联
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部