期刊文献+
共找到25篇文章
< 1 2 >
每页显示 20 50 100
融合关系与内容分析的社会标签推荐 被引量:42
1
作者 张斌 张引 +2 位作者 高克宁 郭朋伟 孙达明 《软件学报》 EI CSCD 北大核心 2012年第3期476-488,共13页
标签是Web 2.0时代信息分类与索引的重要方式.为解决标签系统所面临的不一致性、冗余性以及完备性等问题,标签推荐通过提供备选标签的方法来提高标签的质量.为了进一步提升标签推荐的质量,提出了一种基于标签系统中对象间关系与资源内... 标签是Web 2.0时代信息分类与索引的重要方式.为解决标签系统所面临的不一致性、冗余性以及完备性等问题,标签推荐通过提供备选标签的方法来提高标签的质量.为了进一步提升标签推荐的质量,提出了一种基于标签系统中对象间关系与资源内容融合分析的标签推荐方法,给出了基于LDA(latent Dirichlet allocation)的融合表示对象间关系与资源内容的标签系统生成模型TSM/Forc,提出了一种基于概率的标签推荐方法,并给出了基于吉布斯(Gibbs)抽样的参数估计方法.实验结果表明,该方法可以提供比当前主流与最新方法更加准确的推荐结果. 展开更多
关键词 Web 2.0 社会标签 标签推荐 融合方法 lda(latent DIRICHLET allocation)
下载PDF
图像-文本相关性挖掘的Web图像聚类方法 被引量:10
2
作者 吴飞 韩亚洪 +1 位作者 庄越挺 邵健 《软件学报》 EI CSCD 北大核心 2010年第7期1561-1575,共15页
为了实现Web图像检索结果的聚类,提出了一种Web图像的图聚类方法.首先定义了两种类型关联:单词与图像结点之间的异构链接以及单词结点之间的同构链接.为了克服传统的TF-IDF方法不能直接反映单词与图像之间的语义关联局限性,提出并定义... 为了实现Web图像检索结果的聚类,提出了一种Web图像的图聚类方法.首先定义了两种类型关联:单词与图像结点之间的异构链接以及单词结点之间的同构链接.为了克服传统的TF-IDF方法不能直接反映单词与图像之间的语义关联局限性,提出并定义了单词可见度(visibility)这一属性,并将其集成到传统的tf-idf模型中以挖掘单词-图像之间关联的权重.根据LDA(latent Dirichlet allocation)模型,单词-单词之间关联权重通过一个定义的主题相关度函数来计算.最后,应用复杂图聚类和二部图协同谱聚类等算法验证了在图模型上引入两种相关性关联的有效性,达到了改进了Web图像聚类性能的目的. 展开更多
关键词 图聚类 复杂图 可见度 lda(latent DIRICHLET allocation) 谱聚类
下载PDF
一种面向社区型问句检索的主题翻译模型 被引量:7
3
作者 张伟男 张宇 刘挺 《计算机学报》 EI CSCD 北大核心 2015年第2期313-321,共9页
基于统计机器翻译模型的问句检索模型,其相关性排序机制主要依赖于词项间的翻译概率,然而已有的模型没有很好地控制翻译模型的噪声,使得当前的问句检索模型存在不完善之处.文中提出一种基于主题翻译模型的问句检索模型,从理论上说明,该... 基于统计机器翻译模型的问句检索模型,其相关性排序机制主要依赖于词项间的翻译概率,然而已有的模型没有很好地控制翻译模型的噪声,使得当前的问句检索模型存在不完善之处.文中提出一种基于主题翻译模型的问句检索模型,从理论上说明,该模型利用主题信息对翻译进行合理的约束,达到控制翻译模型噪声的效果,从而提高问句检索的结果.实验结果表明,文中提出的模型在MAP(Mean Average Precision)、MRR(Mean Reciprocal Rank)以及p@1(precision at position one)等指标上显著优于当前最先进的问句检索模型. 展开更多
关键词 社区型问答 问句检索 主题模型 翻译模型 lda(latent DIRICHLET Allocation) 社会计算 社交网络
下载PDF
汉语语义选择限制知识的自动获取研究 被引量:5
4
作者 贾玉祥 王浩石 +2 位作者 昝红英 俞士汶 王治敏 《中文信息学报》 CSCD 北大核心 2014年第5期66-73,共8页
语义选择限制刻画了谓语对论元的语义选择倾向,是一种重要的词汇语义知识,对自然语言的句法、语义分析具有重要作用。该文研究汉语语义选择限制知识的自动获取,提出基于HowNet和基于LDA(Latent Dirichlet Allocation)的两种知识获取方法... 语义选择限制刻画了谓语对论元的语义选择倾向,是一种重要的词汇语义知识,对自然语言的句法、语义分析具有重要作用。该文研究汉语语义选择限制知识的自动获取,提出基于HowNet和基于LDA(Latent Dirichlet Allocation)的两种知识获取方法,对方法进行了实验对比与分析。实验表明,前者所获取的知识可理解性更好,后者所获取的知识应用效果更好。两种方法具有很好的互补性,我们提出了一个二者的融合方案。 展开更多
关键词 语义选择限制 知识获取 HOWNET lda(latent DIRICHLET Allocation)
下载PDF
基于LDA模型的电力投诉文本热点话题识别 被引量:3
5
作者 许睿 龙丹 +1 位作者 刘佳 刘畅 《云南大学学报(自然科学版)》 CAS CSCD 北大核心 2020年第S02期26-31,共6页
电力客户投诉是评价电网公司客户满意度的核心指标.传统人工分析方法存在发现热点话题上存在低效率、实时性不高等问题,提出一种基于LDA(Latent Dirichlet Allocation)模型的电力投诉文本热点话题的识别方法.首先,使用TF-IDF方法从电力... 电力客户投诉是评价电网公司客户满意度的核心指标.传统人工分析方法存在发现热点话题上存在低效率、实时性不高等问题,提出一种基于LDA(Latent Dirichlet Allocation)模型的电力投诉文本热点话题的识别方法.首先,使用TF-IDF方法从电力投诉文本中提取TOP-N关键词,作为该文本的特征词集合,并采用词袋模型,将文本向量表示;其次,使用LDA模型提取文本的话题,得到"文本-话题"矩阵和"话题-单词"矩阵;然后,根据关键词在话题-单词矩阵中出现的分布概率以及关键词在文本中出现的频率,选取从最大权重值的关键词,作为该话题的特征词;最后,使用文档话题支持度,从提取的话题中识别出热点话题.实验结果表明该方法可以准确识别电力投诉文本中的热点话题. 展开更多
关键词 话题识别 lda(latent Dirichlet Allocation)模型 TF-IDF 电力投诉文本
下载PDF
基于VSM和LDA模型的FAQ问答系统 被引量:3
6
作者 郑诚 刘娇丽 项珑 《计算机技术与发展》 2014年第1期133-135,共3页
传统的搜索引擎返回的数据太过庞大,很多情况下用户不能快速地找到自己要的答案。在这种情况下,文中引入FAQ系统。FAQ中如何找到最佳匹配答案,是文中的研究重点。改进了传统的VSM模型,使得它能更好地体现问题中词的权重。重点引入了LDA... 传统的搜索引擎返回的数据太过庞大,很多情况下用户不能快速地找到自己要的答案。在这种情况下,文中引入FAQ系统。FAQ中如何找到最佳匹配答案,是文中的研究重点。改进了传统的VSM模型,使得它能更好地体现问题中词的权重。重点引入了LDA模型,并用计算机故障领域内的文档资料对它进行训练,得到主题-词的概率分布。通过主题-词中词的概率分布,计算词与词的相关度,提出通过词与词间相关度计算句子与句子间相似度的算法。对两个算法进行综合,得到最终的相似度算法。文中对FAQ进行整理,得到了FAQ问答系统的雏形。通过实验分析,说明相似度算法有很好的效果。 展开更多
关键词 VSM 相似度计算 lda(latent DIRICHLET Allocation) 主题-词分布
下载PDF
支持联机分析处理的推特用户兴趣维层次提取方法 被引量:3
7
作者 俞东进 倪智勇 孙景超 《电子与信息学报》 EI CSCD 北大核心 2017年第9期2081-2088,共8页
从海量推特数据中探索用户兴趣的分布规律和相关性有利于实现精确的个性化推荐。联机分析处理(OnLine Analytical Processing,OLAP)提供了一种适合人们探究数据的直观形式。将OLAP技术应用于推特数据的关键是如何挖掘和构建推特用户的... 从海量推特数据中探索用户兴趣的分布规律和相关性有利于实现精确的个性化推荐。联机分析处理(OnLine Analytical Processing,OLAP)提供了一种适合人们探究数据的直观形式。将OLAP技术应用于推特数据的关键是如何挖掘和构建推特用户的兴趣维层次。针对现有方法只能提取单一层次兴趣的不足,该文提出一种支持联机分析处理的推特用户兴趣维层次提取方法。该方法首先通过Rest API获取推特数据,然后通过改进的LDA(Latent Dirichlet Allocation)模型挖掘用户的兴趣和子兴趣,最后在此基础上构建兴趣维层次结构。实验评估了该方法的模型效果和可扩展性,并证实与LDA和h LDA相比可以更有效地提取出推特用户的兴趣维层次并应用于联机分析处理。 展开更多
关键词 联机分析处理 推特 维层次 兴趣 lda(latent DIRICHLET Allocation)模型
下载PDF
基于LDA与新兴主题特征分析的新兴主题探测研究 被引量:60
8
作者 范云满 马建霞 《情报学报》 CSSCI 北大核心 2014年第7期698-711,共14页
本文尝试基于LDA主题模型探测文档集中的新兴主题.本文采用主题的新颖度、发文量指标,并引入被引量,得到新兴主题的特征指标,在此基础上对主题在进入成熟阶段前各个时期的特征进行了分析.并提出了针对上述新兴主题探测指标,基于LDA主题... 本文尝试基于LDA主题模型探测文档集中的新兴主题.本文采用主题的新颖度、发文量指标,并引入被引量,得到新兴主题的特征指标,在此基础上对主题在进入成熟阶段前各个时期的特征进行了分析.并提出了针对上述新兴主题探测指标,基于LDA主题模型抽取文档的语义主题词,利用文档-主题矩阵建立主题和文档的映射,得到主题的新颖度指标和发文量指标、被引量指标,并形成新兴主题探测表格和探测曲线VDP,从而探测出新兴主题,并对新兴主题VDP与基线VDP距离的发展趋势进行预测,根据拟合的曲线对其进行分析,得到最值得关注的新兴主题. 展开更多
关键词 隐狄利克雷分布 主题模型 新兴主题 主题特征 新颖度指标 发文量指标 被引量指标 生命周期
下载PDF
一种基于kmeans聚类算法和LDA主题模型的文本检索方法及有效性验证 被引量:41
9
作者 刘江华 《情报科学》 CSSCI 北大核心 2017年第2期16-21,26,共7页
【目的/意义】非常态分布状态下,LDA主题模型的检索效果较差;在数据量较小的情况下LDA主题模型计算出来的正确率较低。【方法/过程】本文提出一种基于Kmeans聚类算法的LDA主题模型检索方法,本检索方法以Kmeans算法为基础,对文本主题进... 【目的/意义】非常态分布状态下,LDA主题模型的检索效果较差;在数据量较小的情况下LDA主题模型计算出来的正确率较低。【方法/过程】本文提出一种基于Kmeans聚类算法的LDA主题模型检索方法,本检索方法以Kmeans算法为基础,对文本主题进行聚类和语义相关度分析,避免了传统LDA主题模型存在的诸多缺陷。【结果/结论】实验结果显示,不论是一般还是多义主题关键词的检索,本文的LDA主题模型在耗时和准确率上均比本文列出的其他三种主题模型具有明显的优势,进一步验证了本文提出方法的有效性。 展开更多
关键词 lda(潜在狄利克雷分布) 主题模型 聚类分析 文本检索
原文传递
基于LDA的网络评论主题发现研究 被引量:39
10
作者 阮光册 《情报杂志》 CSSCI 北大核心 2014年第3期161-164,共4页
网络用户评论的主题发现研究是Web2.0时代信息分析的重要方式,如何从冗杂的用户评论中分析出有价值的信息是研究的热点。针对网络用户评论信息内容短、信息量少的特征,提出基于LDA(latent Dirichlet allocation)主题发现模型结合HowNet... 网络用户评论的主题发现研究是Web2.0时代信息分析的重要方式,如何从冗杂的用户评论中分析出有价值的信息是研究的热点。针对网络用户评论信息内容短、信息量少的特征,提出基于LDA(latent Dirichlet allocation)主题发现模型结合HowNet知识库进行信息分析的方法,对网络评论进行主题发现的研究。首先通过评论文本的词性标注、语义分析,形成语料库,然后利用HowNet对语料库中的词项进行语义相似度的计算,完成语义去重、合并,最后通过LDA主题模型将用户评论的内容映射到主题上,实现对用户评论信息主题的发现。 展开更多
关键词 网络评论 主题发现 网络信息分析 lda(latentDirichletallocation) 语义分析 文本挖掘
下载PDF
基于主题和链接分析的微博社区发现算法 被引量:28
11
作者 闫光辉 舒昕 +1 位作者 马志程 李祥 《计算机应用研究》 CSCD 北大核心 2013年第7期1953-1957,共5页
针对传统社区发现方法大多基于链接或主题关系,且没有考虑获取微博用户社会信息时的限制,无法有效识别微博中多个社区的问题,提出了一种综合基于主题和链接分析的微博社区发现算法来挖掘微博中多个社区。算法首先研究微博用户的链接及... 针对传统社区发现方法大多基于链接或主题关系,且没有考虑获取微博用户社会信息时的限制,无法有效识别微博中多个社区的问题,提出了一种综合基于主题和链接分析的微博社区发现算法来挖掘微博中多个社区。算法首先研究微博用户的链接及博文主题特性,定义了链接相关度和主题相关度公式;然后推出用户总相关度公式,以此来计算节点间的传递概率,用改进后的标签传递算法对用户分类;最终划分出兴趣相似且社会联系紧密的用户群。真实数据集上的仿真实验验证了该方法的合理性和有效性。 展开更多
关键词 微博 社区发现 潜层Dirichlet分配 主题模型 链接分析 标签传递算法
下载PDF
基于Rao-Stirling指数和LDA模型的领域学科交叉主题识别——以纳米科技为例 被引量:18
12
作者 韩正琪 刘小平 寇晶晶 《情报科学》 CSSCI 北大核心 2020年第2期116-124,共9页
【目的/意义】基于Rao-Stirling指数和LDA模型进行领域学科交叉主题识别,并以纳米科技为例验证将Rao-Stirling指数和LDA模型用于领域学科交叉主题识别的有效性和适用性。【方法/过程】基于Rao-Stirling指数测度领域文献学科交叉程度,设... 【目的/意义】基于Rao-Stirling指数和LDA模型进行领域学科交叉主题识别,并以纳米科技为例验证将Rao-Stirling指数和LDA模型用于领域学科交叉主题识别的有效性和适用性。【方法/过程】基于Rao-Stirling指数测度领域文献学科交叉程度,设定阈值发现高度学科交叉文献。基于LDA模型对筛选出的学科交叉文献进行主题识别,发现学科交叉点和学科交叉研究主题。【结果/结论】基于Rao-Stirling指数从引文的角度进行领域文献学科交叉测度可以有效地发现与某领域相关的学科交叉文献,且有利于大数据集的学科交叉文献发现研究的实现。基于LDA模型进行学科交叉主题识别可以有效地发现学科交叉主题。两方法的组合应用为发现某领域学科交叉主题研究提供一种新视角。 展开更多
关键词 学科交叉 主题识别 Rao-Stirling指数 lda模型 纳米科技
原文传递
一种基于用户长短期兴趣的微博推荐方法 被引量:8
13
作者 陈杰 刘学军 李斌 《小型微型计算机系统》 CSCD 北大核心 2016年第5期952-956,共5页
针对为微博用户推荐符合其兴趣取向的个性化微博信息的问题,结合LDA主题模型,提出一种基于用户长短期兴趣(LSI)的微博推荐方法.LSI方法首先引入时间函数,推断出用户的稳定兴趣向量,通过对新发布的微博数据的内容进行聚类分组,以用户的... 针对为微博用户推荐符合其兴趣取向的个性化微博信息的问题,结合LDA主题模型,提出一种基于用户长短期兴趣(LSI)的微博推荐方法.LSI方法首先引入时间函数,推断出用户的稳定兴趣向量,通过对新发布的微博数据的内容进行聚类分组,以用户的稳定兴趣向量筛选与用户最匹配的分组,随后以网格索引的形式对选定的分组中微博进行查询,并与用户的近期兴趣关注点进行匹配和排序,最终形成推荐列表.实验验证了LSI方法较之传统方法更具有效性和高效性. 展开更多
关键词 长短期兴趣 lda 网格查询 个性化推荐 微博
下载PDF
货车驾驶人驾驶行为与行车安全研究进展 被引量:7
14
作者 覃文文 李欢 +2 位作者 李武 谷金晶 戢晓峰 《交通运输系统工程与信息》 EI CSCD 北大核心 2022年第5期55-74,共20页
驾驶行为是影响交通安全最活跃的因素,在“人-车-路”复杂环境中扮演着关键角色。为了深入理解货车驾驶人驾驶行为规律和行为风险性,本文聚焦货车驾驶人驾驶行为对行车安全的影响,对货车驾驶人的驾驶行为风格、行为风险性及其与行车安... 驾驶行为是影响交通安全最活跃的因素,在“人-车-路”复杂环境中扮演着关键角色。为了深入理解货车驾驶人驾驶行为规律和行为风险性,本文聚焦货车驾驶人驾驶行为对行车安全的影响,对货车驾驶人的驾驶行为风格、行为风险性及其与行车安全的关系等相关研究成果进行系统地梳理和分析。首先,利用构建的文献检索策略,筛选出38篇相关文献,并结合LDA(Latent Dirichlet Allocation)模型,对生成的4个研究主题,即货车驾驶人驾驶行为辨识,危险驾驶行为与行车安全,货车碰撞事故致因分析及驾驶安全风险评估进行总结;其次,针对数据源、特征工程及建模方法等分析要素,构建了适用于任意研究主题的通用研究路径,并重点归纳了目前研究主题在数据源、变量选择方法、研究地点及建模方法等关键要素的研究进展;最后,分析和探讨了货车驾驶人驾驶行为与行车安全领域面临的主要问题,从描述、解释、关联及应用的角度提炼该领域研究的未来发展趋势。研究认为:有必要将驾驶状态特性、车辆运行状态及道路交通状况等多维特征变量进行多源信息融合,开展基于大数据和人工智能双驱动的驾驶行为研究;需加强研究山区公路环境下货车与其他类型车辆之间的交互作用机制,从“人-车-路”视角分析货车碰撞事故致因;需进一步完善智能网联和自动驾驶等高新智能自动化环境下的货车驾驶人驾驶行为与行车安全关系研究;拓展面向驾驶安全的货车驾驶人驾驶风险评估的理论方法和应用框架。研究成果将为货车事故治理、公路货运平台监控及道路线形设计等应用场景提供重要依据,并有助于相对全面地理解货车驾驶人驾驶行为与道路行车安全的交互作用机理。 展开更多
关键词 交通工程 驾驶行为 lda模型 货车驾驶人 行车安全 风险评估
下载PDF
结合LDA和用户特征的协同过滤算法 被引量:6
15
作者 梁静 葛宇 《计算机工程与设计》 北大核心 2021年第9期2519-2525,共7页
针对协同过滤推荐算法的冷启动和数据稀疏问题,提出一种结合LDA和用户特征的协同过滤算法。利用基于吉布斯采样的LDA主题模型生成项目-主题隶属概率矩阵,通过矩阵运算构造用户-主题评分数据,设计结合夹角余弦法的用户相似性计算方案,从... 针对协同过滤推荐算法的冷启动和数据稀疏问题,提出一种结合LDA和用户特征的协同过滤算法。利用基于吉布斯采样的LDA主题模型生成项目-主题隶属概率矩阵,通过矩阵运算构造用户-主题评分数据,设计结合夹角余弦法的用户相似性计算方案,从概率角度论证方案处理稀疏数据的有效性;针对用户特征信息结合海明距离进行编码,设计冷启动用户相似性评价方案,提高冷启动用户相似性评价的合理性。基于MovieLens数据集的实验结果表明,所提算法在面临数据稀疏和冷启动问题时均有较好推荐效果,在最近邻个数较少时有较好表现。 展开更多
关键词 协同过滤 数据稀疏 冷启动 lda(隐含狄利克雷分布) 矩阵运算 海明距离
下载PDF
国外智慧旅游政策和理论的主题建模及趋势研究
16
作者 陈秋英 宋姗姗 《科技和产业》 2024年第5期56-64,共9页
为理清国外智慧旅游政策和理论的研究热点及趋势,通过LDA(隐含狄利克雷分布)主题模型得出4个政策主题、8个理论主题。分析发现“digital travel(数字旅游)”“intelligent travel(智能旅游)”“smart tourism standards(智慧旅游标准)... 为理清国外智慧旅游政策和理论的研究热点及趋势,通过LDA(隐含狄利克雷分布)主题模型得出4个政策主题、8个理论主题。分析发现“digital travel(数字旅游)”“intelligent travel(智能旅游)”“smart tourism standards(智慧旅游标准)”是政策文本重点内容。通过主题模型和知识图谱分析学术文本发现,智慧旅游“data mining (数据挖掘)”“smart tourism system(智慧旅游系统)”信息推荐功能日渐显著,游客行为满意度与智慧旅游城市的选择两者之间关系密切。针对研究结论提出强化智慧旅游工作绩效评估机制、完善标准化政策体系、加大政策扶持新力度等建议。 展开更多
关键词 智慧旅游 lda(隐含狄利克雷分布)主题建模 CITESPACE 研究趋势
下载PDF
基于LDA模型的专利文本主题分析——以国内元宇宙领域为例 被引量:2
17
作者 陆振昇 马超 《科技和产业》 2023年第11期85-88,共4页
为了探究元宇宙作为新兴产业的热点,解决国内元宇宙领域研究重点不明确的问题,提出使用LDA主题模型的专利文本分析方法。将LDA主题模型运用到国内元宇宙领域相关专利文本分析中,结合人为判断和主题困惑度的方法,实现了对专利技术主题的... 为了探究元宇宙作为新兴产业的热点,解决国内元宇宙领域研究重点不明确的问题,提出使用LDA主题模型的专利文本分析方法。将LDA主题模型运用到国内元宇宙领域相关专利文本分析中,结合人为判断和主题困惑度的方法,实现了对专利技术主题的识别和划分。通过实验分析得出结论:人工智能、区块链、云计算等是当前中国元宇宙产业应用专利的热点技术;通过LDA主题模型分析国内元宇宙的专利文本,可以实现其技术热点主题的分类和细分判别,可以为未来的行业发展提供建议。 展开更多
关键词 lda主题模型 元宇宙 专利文本分析
下载PDF
基于知识图谱和LDA模型的社会媒体数据抽取 被引量:6
18
作者 麻友 岳昆 +2 位作者 张子辰 王笑一 郭建斌 《华东师范大学学报(自然科学版)》 CAS CSCD 北大核心 2018年第5期183-194,共12页
社会媒体数据的抽取,是社会舆论集散、新闻信息传播、企业品牌推广、商业营销拓展等研究和应用的基础,准确的抽取结果是数据分析有效性的重要保证.本文针对社会媒体数据的非结构、多主题特征,基于LDA(Latent Dirichlet Allocation)模型... 社会媒体数据的抽取,是社会舆论集散、新闻信息传播、企业品牌推广、商业营销拓展等研究和应用的基础,准确的抽取结果是数据分析有效性的重要保证.本文针对社会媒体数据的非结构、多主题特征,基于LDA(Latent Dirichlet Allocation)模型挖掘数据中的隐含主题,利用数据特征词序列和知识图谱描述的实体及实体间的关联关系,实现对特定领域数据的抽取.建立在"今日头条"新闻数据和新浪微博数据之上的实验结果表明,本文提出的方法能有效地实现社会媒体数据的抽取. 展开更多
关键词 社会媒体数据 数据抽取 隐含狄利克雷分配 知识图谱
下载PDF
基于密度Canopy的评论文本主题识别方法 被引量:1
19
作者 刘滨 詹世源 +7 位作者 刘宇 雷晓雨 杨雨宽 陈伯轩 刘格格 高歆 皇甫佳悦 陈莉 《河北科技大学学报》 CAS 北大核心 2023年第5期493-501,共9页
融合Sentence-BERT和LDA的评论文本主题识别(SBERT-LDA)方法,将LDA的主题数作为K-means算法中的k值,导致算法可解释性较差、主题一致性较低。为了解决上述问题,提出基于密度Canopy的SBERT-LDA优化方法(SBERT-LDA-DC),利用密度Canopy改进... 融合Sentence-BERT和LDA的评论文本主题识别(SBERT-LDA)方法,将LDA的主题数作为K-means算法中的k值,导致算法可解释性较差、主题一致性较低。为了解决上述问题,提出基于密度Canopy的SBERT-LDA优化方法(SBERT-LDA-DC),利用密度Canopy改进Kmeans算法。实验结果表明,提出的方法在一致性指标上要优于使用K-means以及K-means++对特征向量聚类的同类方法;与SBERT-LDA方法相比,在1852条戏剧评论数据集上,一致性指标值提高了22.9%。因此,所提出的SBERT-LDA-DC方法是有效的,对产品或服务提供者更好地了解用户意见、完善自身产品或提升服务水平提供了新方法,具有较强的实际应用价值。 展开更多
关键词 自然语言处理 主题识别 评论文本 Sentence-BERT lda
下载PDF
抖音电商平台助农产品在线评论主题挖掘及扩展分析
20
作者 邵婷 杨佩婷 姜红波 《厦门理工学院学报》 2023年第4期55-64,共10页
基于潜在狄利克雷分配(latent Dirichlet allocation,LDA)模型,引入高频词分析、共现网络分析、情感分析等方法,对抖音电商平台上助农产品在线评论的主题进行挖掘和扩展分析表明,消费者对助农产品的关注点主要包括产品质量和价格、商家... 基于潜在狄利克雷分配(latent Dirichlet allocation,LDA)模型,引入高频词分析、共现网络分析、情感分析等方法,对抖音电商平台上助农产品在线评论的主题进行挖掘和扩展分析表明,消费者对助农产品的关注点主要包括产品质量和价格、商家服务和物流服务、消费者感知价值、助农活动和县长支持等。通过共现网络分析和情感分析均发现消费者对抖音平台助农产品总体是满意的,但仍有改善空间。建议抖音电商平台通过挖掘消费者需求、保证助农产品性价比、把握“电商助农”宣传方向、加强主播培训等方式来提升消费者的购物体验和满意度。 展开更多
关键词 抖音电商平台 助农产品 在线评论 主题挖掘 扩展分析 lda模型
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部