期刊文献+
共找到26篇文章
< 1 2 >
每页显示 20 50 100
基于专利挖掘的数字文旅关键技术识别和趋势分析 被引量:6
1
作者 李勇 欧志梅 +2 位作者 黄格 郭尚窈 杨思敏 《图书馆论坛》 北大核心 2023年第1期121-130,共10页
为揭示数字文旅领域关键技术,促进文旅融合及产业高质量发展,文章通过系统挖掘数字文旅技术专利,运用TF-IDF、LDA主题模型、ROST等方法和工具,从专利计量、技术热点、技术主题、技术关联4个方面展开研究并预测其趋势。研究发现:数字文... 为揭示数字文旅领域关键技术,促进文旅融合及产业高质量发展,文章通过系统挖掘数字文旅技术专利,运用TF-IDF、LDA主题模型、ROST等方法和工具,从专利计量、技术热点、技术主题、技术关联4个方面展开研究并预测其趋势。研究发现:数字文旅技术现处于成熟初期;专利主题可分为交互式人工智能技术、电子导航技术、智能传感技术、3D建模技术、虚拟现实技术5类;发展方向以挖掘5G信息技术潜力、注重以人为本提升游客体验、突破信息壁垒为主。 展开更多
关键词 数字文旅 专利挖掘 LDA主题模型
下载PDF
公众对上门护理服务的态度和关注点:基于网络爬虫的文本挖掘 被引量:4
2
作者 彭佳玲 周茂林 杨青 《护理学杂志》 CSCD 北大核心 2023年第5期110-113,116,共5页
目的基于网络爬虫获取上门服务平台评论数据,采用文本挖掘技术探讨用户对上门服务的关注焦点和情感态度。方法采用Python代码爬取上门护理服务平台评论数据,用狄利克雷分布主题模型挖掘获取评论潜在主题,利用ROSTCM6.0软件对评论文本数... 目的基于网络爬虫获取上门服务平台评论数据,采用文本挖掘技术探讨用户对上门服务的关注焦点和情感态度。方法采用Python代码爬取上门护理服务平台评论数据,用狄利克雷分布主题模型挖掘获取评论潜在主题,利用ROSTCM6.0软件对评论文本数据进行高频词统计、主题情感分析等过程,挖掘护士和患者所关注的热点、核心主题,以及评论情感倾向。结果共抓取到3166条评论,主题模型识别出6个潜在主题,分别为平台功能、服务价格和效率、服务内容和专业度、护士态度及患者体验、服务对象、平台的下载和使用;评论中用户对“护士”“服务”“态度”“方便”“平台”等词提及度较高,在一定程度上展现了用户感受和关注重点;用户积极情绪占59.19%,中性情绪占27.23%,消极情绪占13.58%,用户消极情绪主要集中在服务水平存在差异、收费不合理、平台下载使用等方面。结论用户对各平台整体服务感知较好,但目前发展中仍存在服务水平参差不齐,收费不规范、平台不正规等困境,建议针对发展过程中的短板精准地实施改进,推动上门护理服务良性发展。 展开更多
关键词 互联网+护理 护士上门服务 共享护士 网约平台 态度 文本挖掘 主题
下载PDF
一种基于LDA和TextRank的文本关键短语抽取方案的设计与实现 被引量:6
3
作者 郎冬冬 刘晨晨 +2 位作者 冯旭鹏 刘利军 黄青松 《计算机应用与软件》 北大核心 2018年第3期54-60,共7页
为了抽取出更能反映文本主题的关键词,也为了解决文本关键短语抽取任务中主题信息缺失的问题,提出一种基于LDA和TextRank的单文本关键短语抽取方法。该方法利用LDA模型对语料库中的文本进行主题挖掘,并融入目标文本中的主题覆盖度和词... 为了抽取出更能反映文本主题的关键词,也为了解决文本关键短语抽取任务中主题信息缺失的问题,提出一种基于LDA和TextRank的单文本关键短语抽取方法。该方法利用LDA模型对语料库中的文本进行主题挖掘,并融入目标文本中的主题覆盖度和词语共现关系构建无向加权词图;引入节点词汇主题影响力因素根据词语主题相关性来修改节点间的随机跳转概率,在词图的基础上运用TextRank算法获取候选关键词排序;再利用bootstraping算法的思想迭代生成表意性更强的关键短语。实验表明,该方法可有效提取出表意性强且涵盖文本主题信息的关键短语。 展开更多
关键词 关键短语抽取 LDA模型 主题挖掘 TextRank 主题影响力
下载PDF
我国战略科学家研究的热点透视与未来路向:基于LDA-SARIMA模型的研究
4
作者 黄涛 邹浙灿 《科技管理学报》 2024年第3期23-34,共12页
战略科学家是科技人才中的帅才,是支撑我国高水平科技自立自强的重要力量。探索战略科学家研究领域主题存在的取向和呈现的趋向,可为相关科技政策研究和制定工作提供借鉴。本文采用LDA主题建模和SARIMA预测分析方法对战略科学家这一重... 战略科学家是科技人才中的帅才,是支撑我国高水平科技自立自强的重要力量。探索战略科学家研究领域主题存在的取向和呈现的趋向,可为相关科技政策研究和制定工作提供借鉴。本文采用LDA主题建模和SARIMA预测分析方法对战略科学家这一重要研究领域进行主题挖掘与实证分析,抽取与战略科学家相关的6个核心主题,对该领域的研究现状与发展动态进行探讨。研究表明:战略科学家的研究具有显著的周期性特征;研究集中在建设国家战略人才力量层面,强调战略科学家对于承担国家战略任务,推动战略人才体系建设的作用;通过模型的定量预测功能得出培育和使用战略科学家、借助新媒体技术开展科学普及和教育工作是未来研究的趋向。建议在探讨如何完善战略科学家的培养体系时,紧跟时代发展的步伐,培养符合新时代需求的战略科学家。 展开更多
关键词 战略科学家 实证分析 主题挖掘 LDA 主题模型
下载PDF
基于K-means与Word2vec的哺乳文胸评论主题挖掘研究
5
作者 刘妍 刘驰 《人类工效学》 2024年第2期40-45,共6页
目的为了了解消费者在网络平台购买哺乳文胸时的关注侧重点,文章从在线评论中抽取有效关键词构建哺乳文胸主题,并通过计算主题的重要程度协助商家了解消费者关注重点方向。方法选用TF-IDF关键词抽取算法,结合K-means和Word2vec进行语义... 目的为了了解消费者在网络平台购买哺乳文胸时的关注侧重点,文章从在线评论中抽取有效关键词构建哺乳文胸主题,并通过计算主题的重要程度协助商家了解消费者关注重点方向。方法选用TF-IDF关键词抽取算法,结合K-means和Word2vec进行语义聚类、主题识别、主题词挖掘及主题重要度计算。结果哺乳文胸评论文本聚类后的主题重要程度排名是:产品品质(45.47%)、产品外观(35.83%)、产品服务(18.79%)。结论通过该方法能够有效的识别和构建哺乳文胸主题及主题词,同时,通过主题的重要程度,能够了解消费者对于网络平台购买哺乳文胸时关注的重点方向,为哺乳内衣企业进行产品改善及生产等提供理论参考。 展开更多
关键词 服装工程 文本聚类分析 哺乳文胸 在线评论 K-MEANS Word2vec 主题挖掘 主题重要程度 文献计量分析
下载PDF
基于共词网络的专家技能挖掘方法
6
作者 邵明阳 单菁 王佳英 《计算机与数字工程》 2024年第7期2129-2134,共6页
专家技能指专家熟悉的研究领域,为了更方便快捷地挖掘专家技能,提出了一种基于共词网络的技能挖掘方法。方法从专家发表的文献题目入手,将题目分解成短语,利用短语之间的共现关系构建共词网络,然后将网络划分出不同的技能主题社区,最后... 专家技能指专家熟悉的研究领域,为了更方便快捷地挖掘专家技能,提出了一种基于共词网络的技能挖掘方法。方法从专家发表的文献题目入手,将题目分解成短语,利用短语之间的共现关系构建共词网络,然后将网络划分出不同的技能主题社区,最后根据专家论文题目中所涉及到的社区以及专家在文献中所处的署名位序信息加权得出专家对技能的熟悉程度。实验数据采用DBLP开源数据集,选取发文量大于40篇的300位专家共36981条题目进行验证分析。实验结果表明,基于共词网络的专家技能挖掘方法在准确率和召回率上的表现较好,最高达到了61.3%和69.2%。基于共词网络的专家技能挖掘方法不仅能快速有效处理大量数据,而且可以较好地从专家发表的文献题目中挖掘出专家技能。 展开更多
关键词 共词网络 社区划分 词语共现 技能挖掘 主题社区
下载PDF
基于在线评论的政府数据开放平台用户增量需求研究 被引量:5
7
作者 李冠 赵毅 《数字图书馆论坛》 CSSCI 2022年第12期37-46,共10页
深入研究政府数据开放平台用户需求特征,更有效地为用户提供数据服务,让开放数据创造更大的经济和社会价值具有重要意义。本文采集9个省(市、自治区)级政府数据开放平台的用户评论数据,首先运用LDA模型挖掘平台初建期和发展期用户需求主... 深入研究政府数据开放平台用户需求特征,更有效地为用户提供数据服务,让开放数据创造更大的经济和社会价值具有重要意义。本文采集9个省(市、自治区)级政府数据开放平台的用户评论数据,首先运用LDA模型挖掘平台初建期和发展期用户需求主题,分析其需求热点;其次选取朴素贝叶斯算法研究用户需求主题的情感倾向;最后计算两个时期的平台用户需求主题相似度,揭示用户增量需求的动态演进路径。研究结果表明,“数据改进”“社会保障”“公共安全”等需求主题是用户持续关注的领域,其中“社会保障”主题的情感倾向概率为0.75,用户情感倾向积极,“数据改进”主题的情感倾向概率为0.22,用户情感倾向消极。本文研究平台用户需求主题、情感诉求以及需求变化,促进政府数据开放平台根据用户增量需求不断持续改进,为平台建设发展提供有力支持。 展开更多
关键词 政府数据开放平台 用户增量需求 主题挖掘 情感倾向 文本相似度 主题演进
下载PDF
数据挖掘在教育信息化中的应用研究 被引量:5
8
作者 高晓佳 《电脑知识与技术(过刊)》 2012年第2X期1199-1200,1202,共3页
随着数据挖掘理论在各个领域中的应用日益广泛,利用数据挖掘理论挖掘教育信息中的有价值信息就越发的体现出其必要性。该文从挖掘主题、数据库设计等几方面对教育决策系统进行了研究和设计,提出许多极具价值的辅助性建议,从而优化了高... 随着数据挖掘理论在各个领域中的应用日益广泛,利用数据挖掘理论挖掘教育信息中的有价值信息就越发的体现出其必要性。该文从挖掘主题、数据库设计等几方面对教育决策系统进行了研究和设计,提出许多极具价值的辅助性建议,从而优化了高校的教学管理系统。 展开更多
关键词 数据挖掘 挖掘主题 数据库 教育决策
下载PDF
面向科技文献的国内外知识挖掘研究热点与展望——基于WOS核心合集与CNKI数据库的计量分析
9
作者 孙盟盟 奚洋洋 《河北科技图苑》 2023年第5期66-75,共10页
以WOS核心合集与CNKI数据库作为数据来源,运用文献计量和内容分析方法,借助Citespace、VOSviewer对国内外关于科技文献的知识挖掘研究情况进行系统梳理。通过对发文趋势、作者共现、机构共现和关键词共现进行分析,揭示该领域的热点主题... 以WOS核心合集与CNKI数据库作为数据来源,运用文献计量和内容分析方法,借助Citespace、VOSviewer对国内外关于科技文献的知识挖掘研究情况进行系统梳理。通过对发文趋势、作者共现、机构共现和关键词共现进行分析,揭示该领域的热点主题与发展趋势。研究发现关于科技文献知识挖掘的热点主题集中于面向科技创新的知识挖掘、知识产权与主题演化分析、细粒度知识抽取及知识关联挖掘等方面。提出未来需要探索多样化的知识挖掘方法,以更好地开发科技文献价值的相关建议。 展开更多
关键词 科技文献 知识挖掘 主题演化 文献计量
下载PDF
基于主题模型的技术预见文本分析 被引量:3
10
作者 吕皓 周晓纪 《情报探索》 2018年第10期52-59,共8页
[目的/意义]通过主题模型分析和文本降维的方法,为"中国工程科技2035技术预见"提供备选技术方向的分析研究方案。[方法/过程]利用隐含狄利克雷分布(LDA)对中国工程科技2035的11个不同领域进行话题分析,同时通过T-分布邻域嵌... [目的/意义]通过主题模型分析和文本降维的方法,为"中国工程科技2035技术预见"提供备选技术方向的分析研究方案。[方法/过程]利用隐含狄利克雷分布(LDA)对中国工程科技2035的11个不同领域进行话题分析,同时通过T-分布邻域嵌入算法对技术项文本进行降维处理,将对应的技术项文本投影到二维平面上。[结果/结论]LDA模型可用于提取主题,确定技术项在主题上的概率分布,实现技术预见下技术项目的话题分布挖掘。文本形式数据的降维使用T-SNE法更为妥当。T-SNE方法的技术项可视化分析方法能够支撑专家对技术项(特别是交叉领域的技术项)所属领域进行分析,实现对不同领域技术方向的直观平面展示,有助于各领域整体把握所属领域的技术方向以及相关领域的技术方向。 展开更多
关键词 技术预见 文本挖掘 主题模型 可视化
下载PDF
DOLDA模型设计与主题演化分析 被引量:3
11
作者 蒋权 郑山红 +1 位作者 刘凯 李万龙 《计算机工程与设计》 北大核心 2018年第2期446-451,485,共7页
为解决OLDA模型挖掘大规模文档主题时计算效率低下和不能发现新主题的问题,提出一种分布式的DOLDA模型(distribute online LDA,DOLDA)。建立分布式矩阵存储主题-词项,设计一种动态负载均衡策略来提升计算速度和线程调度的性能,根据Zipf... 为解决OLDA模型挖掘大规模文档主题时计算效率低下和不能发现新主题的问题,提出一种分布式的DOLDA模型(distribute online LDA,DOLDA)。建立分布式矩阵存储主题-词项,设计一种动态负载均衡策略来提升计算速度和线程调度的性能,根据Zipf定律结合主题的遗传度提出一种文档权值设置方法。在Spark分布式计算平台的实验结果表明,相比OLDA模型,DOLDA模型能够提高近16%的加速比,有效地在线分析主题的演化。 展开更多
关键词 主题挖掘 分布式计算 在线的潜在狄利克雷分布模型 动态负载均衡 主题演化
下载PDF
电商直播消费者购买满意度研究--基于弹幕文本分析和计量模型的证据
12
作者 王胜源 何江林 《情报探索》 2022年第8期18-26,共9页
[目的/意义]基于海量直播弹幕挖掘消费者对电商直播服务评价和满意度的影响因素,对电商直播平台长远发展具有重要意义。[方法/过程]研究一:基于服装类、化妆品类、3C产品类、家电类、生鲜类、零食类等产品直播弹幕,通过改进TF-IDF算法、... [目的/意义]基于海量直播弹幕挖掘消费者对电商直播服务评价和满意度的影响因素,对电商直播平台长远发展具有重要意义。[方法/过程]研究一:基于服装类、化妆品类、3C产品类、家电类、生鲜类、零食类等产品直播弹幕,通过改进TF-IDF算法、SnowNLP情感分析、LDA主题提取等方法,挖掘消费者满意度影响因素;研究二:根据研究一满意度影响因素构建计量回归模型,对消费者满意度影响因素进行交叉验证。[结果/结论]研究一:发现电商直播消费者满意度影响因素:主播知名度、主播可信度、商品性价比、商品预告、互动质量、主播口碑、直播节奏、物流发货速度、商品可抢购性、商品展示、商品讲解专业性、商品质量、商品上架时间、售后服务;研究二:证实满意度各影响因素与消费者购买行为正相关;商品预告、直播节奏、商品上架时间与消费者观看意愿不相关。 展开更多
关键词 直播弹幕 文本挖掘 改进TF-IDF 情感分析 LDA主题 计量模型
下载PDF
大数据视域下余华文学作品文本挖掘研究
13
作者 杨秀璋 武帅 +5 位作者 宋籍文 任天舒 廖文婧 刘建义 夏换 于小民 《现代计算机》 2022年第14期21-27,34,共8页
利用大数据和人工智能方法精准识别海量学术成果的主流学术关键,挖掘作品内涵知识及分析文学主题关联尤为重要,本文针对余华文学作品的研究文献开展主题特征、行文脉络研究,在数字人文视域下为把握作者创作倾向和特点提供依据。结合数... 利用大数据和人工智能方法精准识别海量学术成果的主流学术关键,挖掘作品内涵知识及分析文学主题关联尤为重要,本文针对余华文学作品的研究文献开展主题特征、行文脉络研究,在数字人文视域下为把握作者创作倾向和特点提供依据。结合数据挖掘和主题演化的方法对中国知网余华文学作品相关文献进行分析,确认余华文学作品研究核心团体。再对余华文学文献进行文本挖掘,发掘出余华文学研究热点及关联。本文挖掘出了余华作品的核心主题、现实意义和艺术价值,为以其小说为素材的影视改编、艺术创作尽可能还原主题起到积极作用,可提供有效参考和借鉴。 展开更多
关键词 大数据 文本挖掘 主题演化 文学作品 社交网络分析
下载PDF
“金课”建设背景下基于文本挖掘的线上与线下教学满意度对比研究——以《财务管理》课程为例
14
作者 仇艳 曾晓霞 刘小刚 《吉林工程技术师范学院学报》 2021年第4期66-69,共4页
“金课”建设背景下,课程教学内容、教学方式等需要不断优化。以《财务管理》课程为例,以Python作为文本分析语言,挖掘学生对课程教学的总结与反思文本数据信息,对隐含在文本中的课程满意度进行对比分析。研究结果表明:学生重点关注教... “金课”建设背景下,课程教学内容、教学方式等需要不断优化。以《财务管理》课程为例,以Python作为文本分析语言,挖掘学生对课程教学的总结与反思文本数据信息,对隐含在文本中的课程满意度进行对比分析。研究结果表明:学生重点关注教学内容、教学方式和任课教师,相比线下教学,学生对线上教学方式的认知更丰富、对任课教师的依赖程度更小。同时,学生对线上教学的满意度略高于对线下教学的满意度,对课程总体上具有较高的满意度。为进一步提高学生对课程的满意度,打造高质量的“金课”,应当善用优质互联网课程资源,开展线下和线上相结合的混合式教学,营造沉浸式虚拟仿真实验教学的体验环境。 展开更多
关键词 财务管理 文本挖掘 课程满意度 LDA主题
下载PDF
基于数据挖掘的中国民谣歌曲行业研究分析
15
作者 赵紫如 莫慕璇 +2 位作者 夏换 杨秀璋 武帅 《信息技术与信息化》 2019年第10期198-201,共4页
随着新媒体的不断涌现,以及媒体强有力的传播,民谣作为小众品味的代表,却能在众多主流音乐类型中独出于众,在当下媒介泛化的社会中受到越来越多的关注,不断地引发人们的热议,民谣歌手也受到了大批粉丝听众的追捧和用户。本文以网易云音... 随着新媒体的不断涌现,以及媒体强有力的传播,民谣作为小众品味的代表,却能在众多主流音乐类型中独出于众,在当下媒介泛化的社会中受到越来越多的关注,不断地引发人们的热议,民谣歌手也受到了大批粉丝听众的追捧和用户。本文以网易云音乐的民谣歌曲为研究对象,对其歌手、歌曲、歌词进行数据挖掘,分析歌词中的情感,并对其结果进行可视化分析,使更多人了解民谣歌曲的内容,同时可以优化中国民谣歌曲行业,为听众提供更多的优质民谣歌曲。 展开更多
关键词 中国民谣 数据挖掘 主题演化 网易云音乐 LDA主题模型
下载PDF
微博舆情传播周期中不同传播者的主题挖掘与观点识别 被引量:55
16
作者 廖海涵 王曰芬 关鹏 《图书情报工作》 CSSCI 北大核心 2018年第19期77-85,共9页
[目的/意义]探索微博舆情传播周期中不同传播者关注的舆情热点和传播内容的主要观点,进而发现舆情传播的特点和规律,为舆情分析与决策提供依据。[方法/过程]以特定舆情事件的事实文本数据为来源,以生命周期理论和LDA方法为指导,设计研... [目的/意义]探索微博舆情传播周期中不同传播者关注的舆情热点和传播内容的主要观点,进而发现舆情传播的特点和规律,为舆情分析与决策提供依据。[方法/过程]以特定舆情事件的事实文本数据为来源,以生命周期理论和LDA方法为指导,设计研究流程与构建研究模型,对微博舆情事件中不同传播者的话题进行主题研究,其中包括主题抽取和结果语义标注、各阶段的不同传播者主题的语义分析、基于时间维度的舆情主题观点识别与刻画。[结果/结论]研究发现,论文所提出的研究模型能够挖掘出舆情传播周期中不同传播者的主题结构、观点脉络以及特征,研判出分布在文字当中有关联性的、代表性的、重要的词语。同时,结论中还发现微博中的官媒、大众媒体发布信息中的话题和用户谈论的热点话题具有明显的差异性。 展开更多
关键词 微博舆情 不同传播者 主题挖掘 观点识别 生命周期理论 LDA主题模型
原文传递
“一带一路”若干区域社会发展态势大数据分析 被引量:12
17
作者 马明清 袁武 +4 位作者 葛全胜 袁文 杨林生 李汉青 李萌 《地理科学进展》 CSSCI CSCD 北大核心 2019年第7期1009-1020,共12页
"一带一路"倡议已成为中国的基本国际政策,及时掌握沿线国家的社会发展态势,对确保该倡议的稳步推进与顺利实施至关重要。为此,论文将GDELT数据库作为数据来源,获取了"一带一路"沿线25个国家近5 a的英文新闻全文数... "一带一路"倡议已成为中国的基本国际政策,及时掌握沿线国家的社会发展态势,对确保该倡议的稳步推进与顺利实施至关重要。为此,论文将GDELT数据库作为数据来源,获取了"一带一路"沿线25个国家近5 a的英文新闻全文数据,引入主题模型,结合无监督方法(LDA)与监督方法(Labeled LDA)挖掘新闻数据中蕴含的主题,构建社会稳定度模型,分析各国社会发展态势。研究发现:①沿线国家社会发展态势不均衡,可划分为4类,即稳定型,如阿曼、越南等;较稳定型,如乌兹别克斯坦、伊朗等;较高风险型,如科威特、约旦、巴基斯坦、缅甸;高风险型,如叙利亚、阿富汗等。②通过新闻主题时空挖掘,可有效发现热点区域,例如论文发现安集延对中亚地区社会发展与稳定具有重要影响。③利用监督主题模型,能够发现乌兹别克斯坦经济产业结构,识别出重大社会事件,发现其社会安全风险及变化趋势。采用论文方法可有效挖掘新闻事件时空变化规律,发现各国潜在风险,支撑对沿线国家社会发展态势的实时动态监控,为"一带一路"倡议的实施提供辅助决策支持,具有重要的应用价值。 展开更多
关键词 一带一路 时空数据挖掘 主题模型 社会发展态势 社会稳定度 大数据
原文传递
基于时空大数据演化的新冠肺炎疫情政策主题挖掘及层级扩散特征分析 被引量:2
18
作者 吴鹏 张蒙蒙 索金琳 《情报理论与实践》 北大核心 2023年第5期185-192,153,共9页
[目的/意义]文章旨在揭示不同层级政府针对新冠肺炎疫情的应急模式,纵向探究新冠肺炎疫情治理体系,对政府应急管理超前布局具有一定借鉴意义。[方法/过程]基于时空大数据演化技术,结合政策内部特征和外部特征视角揭示不同层级政府政策... [目的/意义]文章旨在揭示不同层级政府针对新冠肺炎疫情的应急模式,纵向探究新冠肺炎疫情治理体系,对政府应急管理超前布局具有一定借鉴意义。[方法/过程]基于时空大数据演化技术,结合政策内部特征和外部特征视角揭示不同层级政府政策扩散特征,并通过可视化方法展示。在内部特征方面,通过主题挖掘分析政策时间维度和层级维度主题演变;在外部特征方面,从发文时间、发文部门、发文数量维度上构建政策扩散特征指标,实验以中央、湖北省、北京市政策文本为数据源开展。[结果/结论]研究发现,首先,不同阶段主题存在差异性,但在疫情防控、企业扶持主题上存在延续性;其次,中央政策具有指导性、宏观把控性,湖北省整体注重疫情防控、医疗救治和复工复产,北京市侧重企业扶持、疫情防控、政务服务;最后,同层级政府的政策扩散特征表现不同。 展开更多
关键词 新冠肺炎疫情 主题挖掘 政策扩散 LDA主题模型 政府层级
原文传递
基于社交网络分析和LDA主题挖掘的短文本挖掘研究 被引量:5
19
作者 武帅 施奕 +1 位作者 杨秀璋 项美玉 《现代电子技术》 2022年第20期124-128,共5页
随着自媒体技术的不断发展,如何高效挖掘短文本数据信息已成为现阶段的研究重点。传统主题挖掘方法进行短文本数据分析时,仅考虑单位词出现频率进行判断,未考虑语义关联结构信息,分析效果欠佳。针对短文本数据的稀缺性,文中提出一种基... 随着自媒体技术的不断发展,如何高效挖掘短文本数据信息已成为现阶段的研究重点。传统主题挖掘方法进行短文本数据分析时,仅考虑单位词出现频率进行判断,未考虑语义关联结构信息,分析效果欠佳。针对短文本数据的稀缺性,文中提出一种基于社交网络分析和LDA的主题挖掘分析模型。首先结合共词分析算法,分析不同文档间主题词的关系;然后结合社交网络分析算法,提高共词网络主题词耦合度;再借助隐含空间模型对共词网络进行降维,提高社交网络耦合性;最后结合隐含位置聚类算法发掘潜在社区,提高主题识别效果。实验结果表明,所提方法能够在一定程度上优化主题挖掘算法在识别短文本主题的效果,便于进行短文本研究,具有实用价值,也可为后续应用于前沿主题识别提供参考。 展开更多
关键词 LDA主题挖掘 共词分析 社交网络分析 短文本挖掘 隐含空间模型 隐含位置聚类 主题识别 吉布斯抽样
下载PDF
面向信息弱势群体的电子公共服务网络评论观点挖掘与诉求主题分析 被引量:1
20
作者 王宇琪 周庆山 赵菲菲 《情报资料工作》 北大核心 2023年第4期77-84,共8页
[目的/意义]随着电子政务与数智技术的融合发展,电子公共服务日益成为公众获取公共服务的核心路径,与此同时,也给信息弱势群体,如老年人、残疾人等群体带来不少障碍。以往这一研究多从问卷调查、访谈等小样本入手研究弱势群体自身诉求,... [目的/意义]随着电子政务与数智技术的融合发展,电子公共服务日益成为公众获取公共服务的核心路径,与此同时,也给信息弱势群体,如老年人、残疾人等群体带来不少障碍。以往这一研究多从问卷调查、访谈等小样本入手研究弱势群体自身诉求,利用数据挖掘分析网民评论研究信息弱势群体的电子公共服务利用问题极少。文章将根据网络评论数据挖掘网民观点和诉求主题,并提出缓解信息弱势群体利用电子公共服务障碍的相应对策和建议。[方法/过程]文章对主流媒体报道有关话题新闻进行采集,通过聚类算法进行热点事件/话题判定,针对相关事件/话题网页链接定向采集所有网民评论信息。构建面向网络评论观点识别和情感判别方法实现评论观点倾向分析,并对评论中的诉求表达进行主题编码。[结果/结论]信息弱势群体利用电子公共服务评论诉求主题包含了信息素养、社会支持、技术交互及政策援助4个方面,据此提出了完善相关服务的对策及建议。 展开更多
关键词 信息弱势群体 电子公共服务 观点挖掘 诉求主题分析
原文传递
上一页 1 2 下一页 到第
使用帮助 返回顶部