期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
基于层次话题模型的煤矿安全事故致因要素研究 被引量:9
1
作者 林永明 《安全与环境学报》 CAS CSCD 北大核心 2018年第2期619-623,共5页
为促进安全发展,强化煤矿安全管理的科技支撑,在事故致因理论基础上,利用文本挖掘中的话题模型和创新性构建的层次致因要素话题模型,对我国2000—2015年发生的386起重特大煤矿事故调查报告进行了深入地挖掘、分析和研究。发现事故致因... 为促进安全发展,强化煤矿安全管理的科技支撑,在事故致因理论基础上,利用文本挖掘中的话题模型和创新性构建的层次致因要素话题模型,对我国2000—2015年发生的386起重特大煤矿事故调查报告进行了深入地挖掘、分析和研究。发现事故致因隐含的规律及各类事故之间的关联与共性,并进一步研究发现不同致因要素随时间的演化规律及致灾倾向,为煤矿安全管理找出重点,指导煤矿安全生产管理实践。 展开更多
关键词 安全管理工程 煤矿安全事故 致因要素 层次话题模型
下载PDF
层次化话题发现与跟踪方法及系统实现 被引量:11
2
作者 邱立坤 龙志祎 +1 位作者 钟华 程葳 《广西师范大学学报(自然科学版)》 CAS 北大核心 2007年第2期157-160,共4页
自1996年话题发现与跟踪评测启动以来,该研究受到普遍关注,取得巨大进步,也遇到诸多困难。通过分析大量话题数据,提出层次化话题与层次聚类的区别在于话题的层次是由事件的构成决定的,层次化话题应当分为三层,即微类、中类和上类。原因... 自1996年话题发现与跟踪评测启动以来,该研究受到普遍关注,取得巨大进步,也遇到诸多困难。通过分析大量话题数据,提出层次化话题与层次聚类的区别在于话题的层次是由事件的构成决定的,层次化话题应当分为三层,即微类、中类和上类。原因在于计算机自动分析产生的层次化话题必须与现实世界有客观的联系。据此提出一个面向大规模真实数据的有充分理论依据的层次化话题发现与跟踪方法,并在集群系统上予以实现。 展开更多
关键词 话题发现与跟踪 层次化话题识别 层次化话题跟踪 多层聚类 事件结构
下载PDF
英语作文切题度分析算法
3
作者 任丽娜 《自动化技术与应用》 2024年第3期99-103,共5页
为了在英语作文判阅工作中较为准确地提取出切题句子,提出一套基于关系三元组层次主题树模型的英语作文切题度分析算法。通过主题关系三元组的分布式向量来对作文中的句子加以描述,并以余弦值算法对句子的切题度进行判断。最后通过实验... 为了在英语作文判阅工作中较为准确地提取出切题句子,提出一套基于关系三元组层次主题树模型的英语作文切题度分析算法。通过主题关系三元组的分布式向量来对作文中的句子加以描述,并以余弦值算法对句子的切题度进行判断。最后通过实验分析的方式来验证该算法的有效性。实验研究发现,所提出的英语作文切题度分析算法能够较为准确地识别并提取出英语作文中的切题句子,具有一定的应用价值。 展开更多
关键词 切题度分析算法 英语作文 层次主题树模型 信息提取
下载PDF
应用hLDA进行多文档主题建模关键因素研究 被引量:5
4
作者 衡伟 于佳 +1 位作者 李蕾 刘咏彬 《中文信息学报》 CSCD 北大核心 2013年第6期117-127,共11页
hLDA(层次潜在狄利克雷分配)在层次主题建模中的良好效果已经得到广泛验证。为了实现半监督或无监督,通常采用交叉验证或抽样超参来确定参数。但由于语料特征、建模需求等不确定因素,参数调节方法、建模效果和效率都是实际应用中的难点... hLDA(层次潜在狄利克雷分配)在层次主题建模中的良好效果已经得到广泛验证。为了实现半监督或无监督,通常采用交叉验证或抽样超参来确定参数。但由于语料特征、建模需求等不确定因素,参数调节方法、建模效果和效率都是实际应用中的难点。该文首先结合贝叶斯线索和范围线索构成的统一分析框架,研究hLDA主题建模中的关键影响因素,然后给出一个切实有效的建模策略及流程,最终结合ACL MultiLing 2013多文档摘要语料进行实际建模效果评估。 展开更多
关键词 层次潜在狄利克雷分配 层次主题建模 统一分析框架
下载PDF
层次概念的分布式表示和学习方法综述
5
作者 朱晓光 《计算机技术与发展》 2023年第10期1-7,共7页
层次概念能够有效解释语言模型的隐含知识,并且提升语言模型的结构化优化性能。针对层次概念表示和学习模型的多样化发展,该文分析了层次概念表示的线性空间、概率空间和文本蕴含性质,梳理了概念学习模型的层次结构和优化原理,用于促进... 层次概念能够有效解释语言模型的隐含知识,并且提升语言模型的结构化优化性能。针对层次概念表示和学习模型的多样化发展,该文分析了层次概念表示的线性空间、概率空间和文本蕴含性质,梳理了概念学习模型的层次结构和优化原理,用于促进概念学习模型的应用效果。通过阐述概念学习过程和语义空间的层次性质,归纳层次概念学习的四类计算模型:基于条件熵的文本层次概念抽取;建立语言资源的概念层次和神经网络的隐含层次之间的映射;通过迭代的随机过程拓展主题模型;在正则化因子中添加语义关系约束。通过概念学习综述得出如下结论:层次性的语言模型广泛结合了显明和隐含的概念表示方法;统计模型和语言资源的语义映射是拓展层次结构的主要路径;层次结构具有双曲空间和嵌套球形结构;层次结构分析可以提升统计模型的解释水平。 展开更多
关键词 层次概念 概念学习 分布式表示 统计语言模型 层次主题模型
下载PDF
基于主题本体树的文本流层次主题检测技术 被引量:2
6
作者 张琪 陈千 郭鑫 《微电子学与计算机》 CSCD 北大核心 2013年第7期60-63,共4页
本文首先提出主题本体树层次结构的主题结构模型,并研究了基于主题本体树的层次主题检测技术.在真实新闻数据上的仿真实验表明,该方法能从文本流中有效检测层次主题,实验表明三种测度中混合对称测度效果更好.
关键词 文本流 层次主题检测 主题本体树
下载PDF
Personalized topic modeling for recommending user-generated content
7
作者 Wei ZHANG Jia-yu ZHUANG +3 位作者 Xi YONG Jian-kou LI Wei CHEN Zhe-min LI 《Frontiers of Information Technology & Electronic Engineering》 SCIE EI CSCD 2017年第5期708-718,共11页
User-generated content(UGC) such as blogs and twitters are exploding in modern Internet services. In such systems, recommender systems are needed to help people filter vast amount of UGC generated by other users. Howe... User-generated content(UGC) such as blogs and twitters are exploding in modern Internet services. In such systems, recommender systems are needed to help people filter vast amount of UGC generated by other users. However, traditional recommendation models do not use user authorship of items. In this paper, we show that with this additional information, we can significantly improve the performance of recommendations. A generative model that combines hierarchical topic modeling and matrix factorization is proposed. Empirical results show that our model outperforms other state-of-the-art models, and can provide interpretable topic structures for users and items. Furthermore, since user interests can be inferred from their productions, recommendations can be made for users that do not have any ratings to solve the cold-start problem. 展开更多
关键词 User-generated content(UGC) Collaborative filtering(CF) Matrix factorization(MF) hierarchical topic modeling
原文传递
基于层次概率主题模型的科技文献主题发现及演化 被引量:31
8
作者 王平 《图书情报工作》 CSSCI 北大核心 2014年第22期70-77,共8页
自动挖掘科技文献主题并识别主题变化对于科研工作者及时获取相关领域的最新研究动态有着重要作用。针对科技文献主题多样、动态性强等特点,分析科技文献主题发现及演化具体方法,基于层次概率主题模型h LDA,采用Gibbs抽样来进行模型参... 自动挖掘科技文献主题并识别主题变化对于科研工作者及时获取相关领域的最新研究动态有着重要作用。针对科技文献主题多样、动态性强等特点,分析科技文献主题发现及演化具体方法,基于层次概率主题模型h LDA,采用Gibbs抽样来进行模型参数估计,并运用互信息的方法对主题词进行筛选,以提取高质量的主题词。最后,利用先/后离散分析方法研究主题随时间的演化问题。实验结果验证了主题发现及演化方法的可行性及有效性。 展开更多
关键词 主题发现 主题演化 层次概率主题模型
原文传递
基于最优输运和k-近邻的离群文档检测 被引量:1
9
作者 水泽农 张星宇 沙朝锋 《计算机科学》 CSCD 北大核心 2021年第7期105-111,共7页
离群点或异常检测是数据挖掘和机器学习等领域的研究热点之一,研究人员已提出了多种离群点检测方法,并将其应用于入侵检测和异常交易检测等问题。但多数离群点检测方法主要针对表数据或时间序列数据等,无法直接应用于离群文档检测。现... 离群点或异常检测是数据挖掘和机器学习等领域的研究热点之一,研究人员已提出了多种离群点检测方法,并将其应用于入侵检测和异常交易检测等问题。但多数离群点检测方法主要针对表数据或时间序列数据等,无法直接应用于离群文档检测。现有基于相近性的离群文档检测方法一般用文档与整个文档集的距离来衡量离群性,无法发现基于局部考量的离群文档,而且采用欧几里德距离可能无法刻画出文档间的语义相近性。基于概率模型的离群文档检测方法过于复杂,并且同样只从全局来定义文档的离群值。针对这些问题,文中提出了一种新的基于相近性的离群文档检测方法。该方法引入最优输运距离,基于利用文档词嵌入向量的语义信息,在文档之间使用最优输运算法以度量距离,并利用LDA主题模型对文本进行层级抽象,通过最优输运算法算出主题之间的距离后,再计算文档距离,文中基于这两种最优运输距离计算文档与它的k近邻文档之间的距离来衡量该文档的离群程度。该方法从局部视角来定义文档的离群性,所采用的文档距离能体现文档之间的语义相近性。在两个开源数据集上进行了较细致的对比实验,实验结果显示,所提方法在多个指标上优于基准离群文档检测方法;还检验了基于k近邻离群文档定义的有效性以及k值的选取对结果的影响。 展开更多
关键词 离群文档检测 最优输运 词搬动距离 层次型最优主题输运
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部