期刊文献+
共找到43篇文章
< 1 2 3 >
每页显示 20 50 100
多源信息融合用于新兴技术发展趋势识别——以区块链为例 被引量:52
1
作者 张维冲 王芳 赵洪 《情报学报》 CSSCI CSCD 北大核心 2019年第11期1166-1176,共11页
科技文献不断丰富,成为十分有价值的计量分析数据。对不同来源、不同类型科技文献的信息融合分析,能为全面揭示新兴技术的发展现状及趋势提供有力的情报支撑。从多源异构数据中有效获取主题是多源信息融合中解决"主题"计量实... 科技文献不断丰富,成为十分有价值的计量分析数据。对不同来源、不同类型科技文献的信息融合分析,能为全面揭示新兴技术的发展现状及趋势提供有力的情报支撑。从多源异构数据中有效获取主题是多源信息融合中解决"主题"计量实体问题的一项技术难点。本文面向专利、期刊论文、学位论文、会议论文、图书、基金项目、行业报告共7种不同的科技文献类型,提出了基于摘要的主题解析方法,从多源异构文本中获取主题词,并进行数据融合与主题关联分析,在处理效果和效率上都取得不错的效果,为该问题的解决提供了参考。实验部分以区块链为例,在数据融合的基础上分别进行时序性关联分析和主题关联分析,以揭示区块链技术的发展情况。结果显示,本文所提方法有效地揭示了区块链技术创新在科技文献中的产生过程、主题扩散和演化轨迹。 展开更多
关键词 多源数据 信息融合 主题关联 新兴技术 区块链
下载PDF
基于专利功效矩阵的技术主题关联分析及核心专利挖掘 被引量:32
2
作者 许海云 方曙 《情报学报》 CSSCI 北大核心 2014年第2期158-166,共9页
随着专利数量的快速增多,如何掌握技术主题间的关联和全貌,并快速有效的从海量专利文献中找出具有特定技术功效的核心专利簇具有重要意义。本文利用专利功效矩阵的技术维度和功效维度的关联规则分析获取领域内技术主题与达成功效主题... 随着专利数量的快速增多,如何掌握技术主题间的关联和全貌,并快速有效的从海量专利文献中找出具有特定技术功效的核心专利簇具有重要意义。本文利用专利功效矩阵的技术维度和功效维度的关联规则分析获取领域内技术主题与达成功效主题的关联度,通过获取低支持度、高置信度的技术功效关联对弥补低共现一弱关系技术主题的遗漏。在此基础上,通过对技术功效主题组合的2模网络分析识别具有相同技术功效、相同技术或相同功效的核心专利或专利簇。最后以深海潜水器的水下导航系统为例做了实证分析,通过人工判读和领域专家的评价验证了本文所用方法可以帮助技术专家更有效的掌握技术主题关联,并找到具备特定技术功效的核心专利簇。 展开更多
关键词 主题挖掘 专利计量 功效矩阵 关联规则 核心专利
下载PDF
基于LDA主题关联过滤的领域主题演化研究 被引量:27
3
作者 秦晓慧 乐小虬 《现代图书情报技术》 CSSCI 2015年第3期18-25,共8页
【目的】发现领域文献中主题的新生、消亡、继承、分裂和合并的演化轨迹。【方法】根据文献出版时间划分多个时间窗口,通过LDA主题模型识别各个时间窗口中的主题;利用主题关联(Topic Association)过滤规则确定相邻时间窗口主题间的演化... 【目的】发现领域文献中主题的新生、消亡、继承、分裂和合并的演化轨迹。【方法】根据文献出版时间划分多个时间窗口,通过LDA主题模型识别各个时间窗口中的主题;利用主题关联(Topic Association)过滤规则确定相邻时间窗口主题间的演化关系;形成连续时间段内主题新生、消亡、继承、分裂和合并的演化轨迹。【结果】在保证主题延续性的条件下,更准确地识别主题的新生、消亡、继承、分裂和合并的演化类型。【局限】固定的时间窗口,未考虑主题演化周期的多样性。【结论】该方法可以有效降低LDA主题模型中相似度较小主题的干扰,提升主题演化关系识别的准确性。 展开更多
关键词 主题关联 主题演化 主题模型LDA
原文传递
基于LDA话题关联的话题演化 被引量:20
4
作者 楚克明 李芳 《上海交通大学学报》 EI CAS CSCD 北大核心 2010年第11期1496-1500,共5页
话题演化可以帮助人们快速获取信息和了解趋势.提出了一种挖掘话题随时间变化的方法,通过话题抽取和话题关联实现话题的演化.对不同时间段的文集进行话题的自动抽取,话题数目在不同时间段是可变的;计算相邻时间段中任意2个话题的分布距... 话题演化可以帮助人们快速获取信息和了解趋势.提出了一种挖掘话题随时间变化的方法,通过话题抽取和话题关联实现话题的演化.对不同时间段的文集进行话题的自动抽取,话题数目在不同时间段是可变的;计算相邻时间段中任意2个话题的分布距离和话题的特征向量相似度实现话题的关联.实验结果证明,该方法不但可以描述同一个话题随时间的强度变化,还可以描述新话题的产生,旧话题的消失以及话题内容随时间的演化. 展开更多
关键词 话题探测 话题关联 话题演化 潜在狄里特里分配
下载PDF
基于医学文献的主题演化类型与演化路径识别方法研究 被引量:17
5
作者 范少萍 安新颖 +2 位作者 单连慧 晏归来 宫小翠 《情报理论与实践》 CSSCI 北大核心 2019年第3期114-119,共6页
[目的/意义]利用医学语义关系,基于医学文献开展主题演化类型与演化路径识别方法研究,为进一步丰富和完善主题演化理论与方法提供参考。[方法/过程]首先描述主题演化的新生、消亡、继承、分裂、融合和孤立6种类型,设计了基于统计与语义... [目的/意义]利用医学语义关系,基于医学文献开展主题演化类型与演化路径识别方法研究,为进一步丰富和完善主题演化理论与方法提供参考。[方法/过程]首先描述主题演化的新生、消亡、继承、分裂、融合和孤立6种类型,设计了基于统计与语义相结合的关键关联计算方法,提出利用密度和热度开展核心主题识别的研究,从关键关联与核心主题两方面共同识别主题的演化路径,进而确定主题演化类型。[结果/结论]采用本文研究思路与方法,对肝癌致病机制的研究领域文献开展主题演化路径识别与演化类型确定研究,实验证明所提方法可以较好描述领域的主要演化情况。后续研究将改进关键关联构建方法,以提升演化路径识别方法的精度。 展开更多
关键词 主题演化 演化类型 演化路径 语义关联
原文传递
舆情评论与新闻报道的话题识别及其主题关联分析 被引量:16
6
作者 王曰芬 许杜娟 +1 位作者 杨振怡 罗浩 《现代情报》 CSSCI 2018年第6期3-10,共8页
[目的/意义]针对同一事件新闻报道与舆情评论既相互依存又偏离的现象,通过话题识别与主题关联分析,探索新闻报道引发的舆情评论在主题内容与时间阶段上的异同,拟为研究以舆情评论表达的舆情事件和以新闻报道表达的社会现实之间的共振与... [目的/意义]针对同一事件新闻报道与舆情评论既相互依存又偏离的现象,通过话题识别与主题关联分析,探索新闻报道引发的舆情评论在主题内容与时间阶段上的异同,拟为研究以舆情评论表达的舆情事件和以新闻报道表达的社会现实之间的共振与偏离,进而为探究社会舆情传播规律提供参考,为服务政府科学决策提供依据。[方法/过程]以拉斯韦尔(5W)模型、LDA主题模型和Python工具为基础,设计研究思路和流程,从腾讯新闻和知乎平台上抓取新闻报道和评论的数据,经过处理加工过后加以分析挖掘。[结果/结论]研究发现:舆情事件主题会一定程度偏离社会现实主题,衍生出更多隐性主题;舆情事件与社会现实的发展走向较一致;此外,社交媒体相较于新闻媒体所衍生的舆情事件主题更多,而两者反映的社会现实主题类似。 展开更多
关键词 舆情评论 新闻报道 主题发现 舆情事件 社会现实 关联分析
下载PDF
基于社交媒体的医药领域关联主题预测方法研究 被引量:10
7
作者 吴胜男 田若楠 +4 位作者 蒲虹君 梁雯琪 张亚飞 于琦 贺培凤 《数据分析与知识发现》 CSSCI CSCD 北大核心 2021年第12期98-109,共12页
【目的】从社交媒体视角出发,提出一种全新的知识发现思路和方法,预测医药领域主题关联机会,实现新兴主题早发现、早研究。【方法】以社交媒体为数据源,针对医药卫生领域文本挖掘研究方法存在的不足,提出Co-LDA主题模型和链路预测相结... 【目的】从社交媒体视角出发,提出一种全新的知识发现思路和方法,预测医药领域主题关联机会,实现新兴主题早发现、早研究。【方法】以社交媒体为数据源,针对医药卫生领域文本挖掘研究方法存在的不足,提出Co-LDA主题模型和链路预测相结合的方法,预测核心主题关联机会。并选用新浪微博中糖尿病类药物数据为实验样本,对所提方法进行实例验证。【结果】医药研究领域不含权主题共现网络链路预测AUC值高于含权网络,且最优指标为Katz指标;未来糖尿病药物领域研究最可能和药效学研究与治疗方案的改进、医药行业发展以及药物新适应症研究产生关联。【局限】仅从语义角度进行主题挖掘,缺乏情感和时间维度的多层次分析;链路预测算法复杂度高且对于连通性较差的网络预测效果欠佳。【结论】利用所提方法从社交媒体角度预测医药领域主题关联机会具有一定的科学性和有效性。 展开更多
关键词 知识发现 主题关联 LDA 链路预测
原文传递
学术APP用户在线评论主题语义关联研究 被引量:10
8
作者 王欣研 张向先 张莉曼 《情报科学》 CSSCI 北大核心 2020年第6期25-31,共7页
【目的/意义】针对学术APP评论数据特征,挖掘用户评论语义关联关系,为平台运营者和开发者高效获取用户需求和关注点提供思路和指导方法。【方法/过程】首先,基于LDA主题模型和GloVe词向量模型构建学术APP用户在线评论主题语义关联研究框... 【目的/意义】针对学术APP评论数据特征,挖掘用户评论语义关联关系,为平台运营者和开发者高效获取用户需求和关注点提供思路和指导方法。【方法/过程】首先,基于LDA主题模型和GloVe词向量模型构建学术APP用户在线评论主题语义关联研究框架,然后,采集超星移动图书馆APP在线评论作为样本数据,通过主题识别获取用户评论主题并基于词向量相似性得到主题语义关联,最后构建出语义关联主题图谱。【结果/结论】实验结果表明运用文章提出的思路方法能够有效发现用户评论主题和主题间关联关系并得到主题关联图谱,从而为学术A PP平台运营者完善平台功能提供参考和借鉴。 展开更多
关键词 学术APP 用户评论 主题识别 语义关联
原文传递
考虑语义距离的领域科学知识主题关联与演化研究 被引量:5
9
作者 张瑞 何禄鑫 杨艳妮 《情报杂志》 CSSCI 北大核心 2022年第10期121-129,共9页
[研究目的]传统主题建模忽略了词汇之间的关联情况,本研究提出一种基于语义距离的主题相似度计算方法,从而改进主题边界模糊的问题。[研究方法]基于文献题录数据,将生命科学领域文献按出版时间离散到不同年份,运用LDA主题模型聚类不同... [研究目的]传统主题建模忽略了词汇之间的关联情况,本研究提出一种基于语义距离的主题相似度计算方法,从而改进主题边界模糊的问题。[研究方法]基于文献题录数据,将生命科学领域文献按出版时间离散到不同年份,运用LDA主题模型聚类不同年份下的主题,分析主题强度和内容变化,在语义距离的基础上结合MeSH本体库,对不同年份下的主题进行相似度计算和关联,并揭示生命科学领域知识演化路径。[研究结论]考虑语义距离的主题关联方法对弱关联的主题识别具有一定优势,而不同主题的演化路径能够有效检测和跟踪主题,验证了本研究所提方法的科学性和可行性。 展开更多
关键词 语义距离 科学知识 主题建模 主题关联 主题演化 LDA
下载PDF
基金项目和论文主题扩散演化路径识别及其可视化研究 被引量:6
10
作者 刘自强 岳丽欣 +1 位作者 朱承宁 刘春江 《现代情报》 CSSCI 2022年第11期76-86,共11页
[目的/意义]定量化、可视化识别基金项目和论文等科技文献主题扩散演化路径,对于揭示科技文献主题之间隐含关联关系辅助研究前沿识别、新兴趋势检测等科技情报分析实践工作具有重要意义。[方法/过程]提出基金项目和论文主题扩散演化路... [目的/意义]定量化、可视化识别基金项目和论文等科技文献主题扩散演化路径,对于揭示科技文献主题之间隐含关联关系辅助研究前沿识别、新兴趋势检测等科技情报分析实践工作具有重要意义。[方法/过程]提出基金项目和论文主题扩散演化路径可视化方法,首先基于LDA模型进行基金项目和论文主题识别,然后利用余弦相似度算法进行基金项目和论文主题关联构建,最后基于Web前端可视化技术设计基金项目和论文主题扩散演化路径可视化方案,揭示基金项目和论文主题的隐含关联关系,辅助进行基金项目和论文主题扩散演化路径分析。[结果/结论]通过对美国近20年纳米农业领域基金项目和论文数据的实证,验证了本文提出方法的准确性和可行性。 展开更多
关键词 主题识别 关联构建 演化路径 交互可视化
下载PDF
文本数据主题挖掘与关联搜索研究 被引量:6
11
作者 朱卫星 徐伟光 +1 位作者 何红悦 李雯 《计算机科学》 CSCD 北大核心 2017年第B11期411-413,456,共4页
文本数据是存储和交换信息最自然的方式,文本挖掘技术可以发现海量文本数据中隐藏的潜在知识模式。研究了文本数据主题挖掘与关联搜索技术,首先通过文本解析提取、分词预处理和索引等进行文本信息处理,然后利用基于潜在语义关系的主题... 文本数据是存储和交换信息最自然的方式,文本挖掘技术可以发现海量文本数据中隐藏的潜在知识模式。研究了文本数据主题挖掘与关联搜索技术,首先通过文本解析提取、分词预处理和索引等进行文本信息处理,然后利用基于潜在语义关系的主题发现模型挖掘大量文本数据中隐藏的主题信息,最后利用主题模型计算关键词间的关联程度进行查询扩展,从而实现关联搜索。实现了一个文本数据挖掘与关联搜索的原型系统,对Tancorp数据集进行主题发现和关联搜索,并以视化和网页同步显示关联搜索的过程。 展开更多
关键词 文本挖掘 主题发现 关联搜索
下载PDF
基于微博平台的新冠疫苗主题发现研究 被引量:5
12
作者 吴鹏 诗童 凌晨 《情报科学》 CSSCI 北大核心 2022年第7期12-18,26,共8页
【目的/意义】通过对微博数据的挖掘,了解公众的态度和需求,为新冠疫苗后续的推广或其他疫苗的推广提供一定的参考。【方法/过程】基于内容分析法对564条微博热搜词条进行分类编码,得出公众广泛关注的10大主题。将BTM主题模型和关联规... 【目的/意义】通过对微博数据的挖掘,了解公众的态度和需求,为新冠疫苗后续的推广或其他疫苗的推广提供一定的参考。【方法/过程】基于内容分析法对564条微博热搜词条进行分类编码,得出公众广泛关注的10大主题。将BTM主题模型和关联规则相结合,进一步对主题包含的热搜话题下的推文和评论进行挖掘,更详细地了解公众的态度和需求。【结果/结论】公众对我国新冠疫苗的态度总体上是积极的,公众最关注的问题为新冠疫苗的不良反应情况、接种禁忌、保护效果。【创新/局限】本研究的创新点在于通过微博平台热搜数据的主题发现研究,分析了公众对新冠疫苗的态度和需求。 展开更多
关键词 新冠疫苗 主题发现 内容分析 BTM主题模型 关联规则
原文传递
会话分析视角下的突发公共事件主题演化研究——以"新冠肺炎疫情"为例 被引量:4
13
作者 翟姗姗 王左戎 +1 位作者 陈欢 潘港辉 《图书情报工作》 CSSCI 北大核心 2022年第11期87-99,共13页
[目的/意义]会话分析理论的引入为主题演化研究提供了新的研究视角,细化了主题演化分析粒度。同时,更为完善的主题演化分析思路被应用于突发公共事件之中,有利于提升监管部门的舆情疏导效率。[方法/过程]针对现有研究中的主题识别方法... [目的/意义]会话分析理论的引入为主题演化研究提供了新的研究视角,细化了主题演化分析粒度。同时,更为完善的主题演化分析思路被应用于突发公共事件之中,有利于提升监管部门的舆情疏导效率。[方法/过程]针对现有研究中的主题识别方法与主题演化判断标准,结合会话分析与主题分析,将会话内容与会话组织结构引入主题演化分析过程中,并以"新冠肺炎疫情"中用户生成内容(UGC)作为数据来源进行实证分析。通过基于时序性与讨论热度的主题演化分析,从主题强度层面识别不同层级内容的演化规律,并在主题内容分析层面引入知识发现的关联规则计算思想以挖掘语料内容间的参照关系,结合社会网络分析方法确定关键演化路径。[结果/结论]研究结果表明,网络结构中不同层级的主题内容存在一定差异并对主题演化趋势有着重要影响,对有着重要作用的层级的内容进行有效监管会对引导舆情走向产生积极作用。 展开更多
关键词 会话分析 突发公共事件 主题识别 主题演化 关联规则
原文传递
领域知识结构认知——基于大数据环境的适用性分析
14
作者 杨欣谊 苏新宁 《图书情报工作》 CSSCI 北大核心 2024年第23期4-16,共13页
[目的/意义]大数据环境下,知识泛在、碎片化、规模庞大且动态变化,认知和把握已有领域知识结构,能为科学高效的领域知识组织提供借鉴。[方法/过程]领域知识结构认知剖析知识单元关联形成的结构,体现组合形成的领域知识的原理、内涵及框... [目的/意义]大数据环境下,知识泛在、碎片化、规模庞大且动态变化,认知和把握已有领域知识结构,能为科学高效的领域知识组织提供借鉴。[方法/过程]领域知识结构认知剖析知识单元关联形成的结构,体现组合形成的领域知识的原理、内涵及框架。从不同视角、环境、应用目的组织的知识呈现出不同的知识结构。《中国图书馆分类法》和《汉语主题词表》架构了知识单元之间的等级、等同和相关关系,前者侧重知识类别归属建构了树状跨领域的知识体系,后者通过概念组配、相关关系和多重隶属关联连接主题知识形成网状结构,表述主题关联拓展的知识。语义关联知识结构通过三元组连接形成语义网络,表述类别归属、属性和语义关系的知识,并由推理表述隐含知识。[结果/结论]大数据环境下,知识单元之间建构了多重隶属、交叉连接的树状等级结构,表述泛在知识的类别归属;主题法实现了碎片化、细粒度知识的粗粒化、概念化表述,同时语义关系更加明确具体;语义关联的知识结构更加动态、灵活,能够提供基于推理的知识;领域知识结构向适用于大数据环境知识组织的方向演进。 展开更多
关键词 领域知识组织 结构认知 分类体系 主题关联 语义知识组织
原文传递
多主题下基于LSTM语义关联的长文本过滤研究 被引量:4
15
作者 曹春萍 武婷 《计算机技术与发展》 2019年第11期1-6,共6页
现如今互联网上出现了很多评论性文章,这些文章字符数多,且包含较多与主题无关的信息,会影响后续的文本分析任务的性能。因此,针对传统的解决方案不能够对多主题长文本进行建模,以及现有的神经网络无法从相对较长的时间步长中捕获语义... 现如今互联网上出现了很多评论性文章,这些文章字符数多,且包含较多与主题无关的信息,会影响后续的文本分析任务的性能。因此,针对传统的解决方案不能够对多主题长文本进行建模,以及现有的神经网络无法从相对较长的时间步长中捕获语义关联等问题,文中提出了一种结合单层神经网络和分层长短记忆网络的深度网络模型,并在长文本过滤任务中进行应用。该模型通过词语层LSTM网络获得句子内部词语之间的关系并得到具有语义的句向量,然后将句向量输入主题依赖度计算模型和句子层LSTM网络模型,进而得到句子与各主题类别的依赖度以及待过滤句子与其他句子之间的关联。最后,在从马蜂窝获取的游记数据集上进行的实验表明,该模型相比SVM、朴素贝叶斯、LSTM、Bi-LSTM等效果更好。 展开更多
关键词 长文本过滤 多主题 语义关联 LSTM 分层模型
下载PDF
科技信息资源内容监测与分析服务平台概况 被引量:3
16
作者 徐硕 乔晓东 +1 位作者 朱礼军 张运良 《数字图书馆论坛》 2011年第11期38-44,共7页
为了方便研究者分析领域的研究动态,了解领域内研究的重要研究者和重要文献,并对科技文献和科技工作者的工作进行准确的评价,作者借助国家科技图书文献中心(NSTL)雄厚的资源优势,联合清华大学等有关优势单位,共同开发了面向西文... 为了方便研究者分析领域的研究动态,了解领域内研究的重要研究者和重要文献,并对科技文献和科技工作者的工作进行准确的评价,作者借助国家科技图书文献中心(NSTL)雄厚的资源优势,联合清华大学等有关优势单位,共同开发了面向西文资源的科技信息资源内容监测与分析服务平台,该平台具有专家、期刊/会议和关键词统一检索功能,具有研究者关联路径发现、主题发现等功能,并且内嵌了专家和论文排名功能。 展开更多
关键词 知识服务 话题模型 关联路径 排名 全文索引
下载PDF
语义约束和时间关联LDA的社交媒体主题词链提取 被引量:3
17
作者 万红新 彭云 《小型微型计算机系统》 CSCD 北大核心 2018年第4期742-747,共6页
网络社交媒体文本中蕴含着丰富的评论主题信息,由于数据规模大、自然语言表达以及随时间变化等因素,增加了从文本中提取主题词的难度.根据中文社交媒体的语法结构及语义特征,利用LDA主题模型的文本降维及主题词语获取功能,并结合语义约... 网络社交媒体文本中蕴含着丰富的评论主题信息,由于数据规模大、自然语言表达以及随时间变化等因素,增加了从文本中提取主题词的难度.根据中文社交媒体的语法结构及语义特征,利用LDA主题模型的文本降维及主题词语获取功能,并结合语义约束和时间关联提出了主题词链提取算法及模型.首先利用句法分析、词性关系和语境相关等进行词语语义关系获取,然后将语义和时间嵌入到LDA主题模型,构建符合中文社交媒体文本语法、语义结构特点的动态主题词链提取模型.实验结果表明,该模型可以改善LDA模型的语义理解功能和主题捕捉能力,提高主题词链提取的准确率和召回率. 展开更多
关键词 社交媒体 主题模型 语义约束 LDA模型 时间关联
下载PDF
基于主题时态关联的科学领域研究演化识别 被引量:3
18
作者 田依林 李星 《情报科学》 CSSCI 北大核心 2021年第5期146-155,共10页
【目的/意义】从主题时态的角度,构建主题时态关联的科学领域研究演化的识别方法,为研究人员精准把握领域发展轨迹和科研创新提供参考。【方法/过程】提出基于主题时态关联的领域研究演化识别三阶段模型。首先利用TF-IDF模型提取领域文... 【目的/意义】从主题时态的角度,构建主题时态关联的科学领域研究演化的识别方法,为研究人员精准把握领域发展轨迹和科研创新提供参考。【方法/过程】提出基于主题时态关联的领域研究演化识别三阶段模型。首先利用TF-IDF模型提取领域文献数据集的特征词;再以特征词作为关联规则算法的挖掘条件,生成并过滤主题时态;最后,依据主题时态关联关系和强度值,构建主题时序演化路径可视化图谱进行领域研究演化识别分析。【结果/结论】以在线评论有用性领域外文科技文献为实证研究对象进行主题时态关联演化分析,识别出影响因素有用性、消费者意愿及应用、研究理论技术和有用性排序等主要领域研究的发展演化过程,验证了方法模型的有效性。【创新/局限】清晰地描绘了主题在时间序列上形成、发展和关注强度的动态演化过程,使得主题演进脉络和关联更加具有可读性,但样本数据未实现全覆盖,对领域研究的整体态势分析不够全面。 展开更多
关键词 主题时态 TF-IDF模型 关联规则 层次聚类 研究演化 在线评论
原文传递
基于关联词的主题模型语义标注 被引量:3
19
作者 周亦鹏 杜军平 《智能系统学报》 北大核心 2012年第4期327-332,共6页
互联网主题分析中经常采用概率主题模型对主题进行描述,但存在对于一般用户难以理解的问题,提出一种概率主题模型的自动语义标注方法.首先通过基于语义分类的关联规则挖掘关联主题词并建立候选标签集合,然后以关联词在数据集中的概率分... 互联网主题分析中经常采用概率主题模型对主题进行描述,但存在对于一般用户难以理解的问题,提出一种概率主题模型的自动语义标注方法.首先通过基于语义分类的关联规则挖掘关联主题词并建立候选标签集合,然后以关联词在数据集中的概率分布来设计相关性判别函数,计算候选标签和主题模型的相关度,最后根据最大边缘相关选择高语义覆盖度和区分度的标签.在食品安全和旅游领域主题模型标注的实验表明,与最大概率主题词标记方法相比,提出的方法能够明显提高标注的准确性,并且解决了多标签标记中语义类别单一的问题,能够以较少数量的标签表达更为丰富的语义,这有助于进一步实现更为准确的主题跟踪和主题信息检索. 展开更多
关键词 主题分析 语义标注 生成模型 关联词 关联规则
下载PDF
基于主题图的地理空间关系表达与组织 被引量:2
20
作者 梁慧姣 崔铁军 郭继发 《天津师范大学学报(自然科学版)》 CAS 2017年第2期50-56,共7页
空间关系间的关联性和层次性等非常复杂,为了更好地进行地理空间关系的应用和教学,基于主题图(topic maps,TM)技术归纳整理目前常用的地理空间关系,按照主题图技术规范的要求抽取出主题、关联和资源指引等要素,针对不同的关联关系建立... 空间关系间的关联性和层次性等非常复杂,为了更好地进行地理空间关系的应用和教学,基于主题图(topic maps,TM)技术归纳整理目前常用的地理空间关系,按照主题图技术规范的要求抽取出主题、关联和资源指引等要素,针对不同的关联关系建立了多种空间关系主题的联系类型,利用Java和Ontopia构建了空间关系主题图,形成了一个统一完整的空间关系知识复杂网络,利用主题图技术实现了地理空间关系的有效管理和检索. 展开更多
关键词 地理空间关系 主题图 关联 资源指引类型
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部