期刊文献+
共找到14篇文章
< 1 >
每页显示 20 50 100
基于潜在语义主题融合的铁路扣件状态检测 被引量:6
1
作者 狄仕磊 刘甲甲 +1 位作者 罗建桥 李柏林 《传感器与微系统》 CSCD 2016年第7期19-21,25,共4页
针对现有单一底层特征识别扣件状态的算法存在描述能力差、特征维度过高等问题,提出一种基于两种扣件底层特征的潜在语义主题融合的扣件检测模型。通过潜在狄利克雷分布(LDA)模型分别获取扣件图像的局部二值模式(LBP)特征和方向梯度直方... 针对现有单一底层特征识别扣件状态的算法存在描述能力差、特征维度过高等问题,提出一种基于两种扣件底层特征的潜在语义主题融合的扣件检测模型。通过潜在狄利克雷分布(LDA)模型分别获取扣件图像的局部二值模式(LBP)特征和方向梯度直方图(HOG)特征的扣件语义主题向量。将这两种语义主题向量进行加权融合,权值由该图像LBP特征图和其梯度图的信息熵来确定。以该向量训练分类器,判断待检扣件状态。实验表明:与目前的主流扣件检测方法相比,该方法的漏检率和误检率明显降低,检测能力显著增强。 展开更多
关键词 铁路扣件检测 语义主题 潜在狄利克雷分布模型 信息熵 加权融合
下载PDF
基于PLSA模型的Web页面语义标注算法研究 被引量:5
2
作者 王云英 《情报杂志》 CSSCI 北大核心 2013年第1期141-144,共4页
高效的Web页面语义标注方法是提高Web信息资源利用效率和知识创新的关键。针对当前Web页面语义标注方法存在的问题和Web页面表现出的结构特征和文本特征及其主题分布规律,设计了基于PLSA主题模型的Web页面语义标注算法。该算法分别对We... 高效的Web页面语义标注方法是提高Web信息资源利用效率和知识创新的关键。针对当前Web页面语义标注方法存在的问题和Web页面表现出的结构特征和文本特征及其主题分布规律,设计了基于PLSA主题模型的Web页面语义标注算法。该算法分别对Web页面的结构特征和文本特征构建独立的PLSA主题模型,采用自适应不对称学习算法对这些独立的PLSA主题模型进行集成和优化,最终形成新的综合性的PLSA主题模型进行未知Web页面的自动语义标注。实验结果表明,该算法能够显著提高Web页面语义标注的准确率和效率,可以有效地解决大规模Web页面语义标注问题。 展开更多
关键词 语义标注 PLSA模型 潜在语义主题 标注算法 WEB页面
下载PDF
基于视觉语义主题的图像自动标注 被引量:3
3
作者 孙君顶 李海华 靳姣林 《测控技术》 CSCD 2016年第12期11-15,共5页
为减小图像检索中语义鸿沟的影响,提出了一种基于视觉语义主题的图像自动标注方法。首先,提取图像前景与背景区域,并分别进行预处理;然后,基于概率潜在语义分析与高斯混合模型建立图像底层特征、视觉语义主题与标注关键词间的联系,并基... 为减小图像检索中语义鸿沟的影响,提出了一种基于视觉语义主题的图像自动标注方法。首先,提取图像前景与背景区域,并分别进行预处理;然后,基于概率潜在语义分析与高斯混合模型建立图像底层特征、视觉语义主题与标注关键词间的联系,并基于该模型实现对图像的自动标注。采用corel 5数据库进行验证,实验结果证明了本文方法的有效性。 展开更多
关键词 视觉语义主题 概率潜在语义分析 高斯混合模型 图像自动标注
下载PDF
基于PLSA的大众标注资源主题挖掘 被引量:5
4
作者 王嵩 代逸生 李保珍 《现代图书情报技术》 CSSCI 北大核心 2010年第3期47-51,共5页
针对大众标注中用户生成标签的随意性以及无规则性所导致的标签混乱问题,引入潜在语义索引分析PLSA算法,得到特定资源主题下的标签集,为网络信息组织及用户获取提供有效的途径。通过抽取Delicious网站中的用户标注信息,证实PLSA方法对... 针对大众标注中用户生成标签的随意性以及无规则性所导致的标签混乱问题,引入潜在语义索引分析PLSA算法,得到特定资源主题下的标签集,为网络信息组织及用户获取提供有效的途径。通过抽取Delicious网站中的用户标注信息,证实PLSA方法对于特定资源的主题特征具有比较好的效果。 展开更多
关键词 大众标注 概率潜在语义分析 语义标签 资源主题
原文传递
基于语义爬虫的商品信息主题采集研究 被引量:7
5
作者 黄炜 张李义 《现代图书情报技术》 CSSCI 北大核心 2010年第1期3-8,共6页
结合网页主题链接分析和网页主题内容语义分析,提出一个以主题爬虫实现采集商品信息的方法。在爬行过程中通过对本体的统计学习,使主题本体参照物不断得到优化。实验结果表明,该方法较其他传统爬行算法更有效,并能防止主题漂移的发生,... 结合网页主题链接分析和网页主题内容语义分析,提出一个以主题爬虫实现采集商品信息的方法。在爬行过程中通过对本体的统计学习,使主题本体参照物不断得到优化。实验结果表明,该方法较其他传统爬行算法更有效,并能防止主题漂移的发生,带来较高的主题收获率。 展开更多
关键词 主题爬虫 商务信息语义 主题链接分析 本体学习
原文传递
基于CTM模型和最优标签集的图像标注 被引量:3
6
作者 朱韶平 夏利民 朱城 《复旦学报(自然科学版)》 CAS CSCD 北大核心 2014年第1期147-153,162,共8页
为了提高自动标注系统的性能,提出了一种基于最优标签集图像自动标注系统优化算法.用词袋模型表示图像,采用CTM模型进行图像标注,在此基础上,采用基于词频因子的词间相关性以及启发式迭代算法对获得的标注词进行有效的优化,提高了标注... 为了提高自动标注系统的性能,提出了一种基于最优标签集图像自动标注系统优化算法.用词袋模型表示图像,采用CTM模型进行图像标注,在此基础上,采用基于词频因子的词间相关性以及启发式迭代算法对获得的标注词进行有效的优化,提高了标注词的准确性.在Corel5K数据集中利用LDA模型和CTM模型进行图像标注对比实验,实验结果表明本文提出的图像标注方法能有效提高标注系统的性能. 展开更多
关键词 CTM模型 LDA模型 潜在语义主题 最佳标签集
原文传递
基于“语义主题模型”的知识系统框架设计及应用研究
7
作者 李颖 张毅 《数字图书馆论坛》 2012年第4期24-27,共4页
构建语义化知识服务系统是数字图书馆在语义Web环境下的发展方向。针对目前各种语义Web技术在数字图书馆开发应用的现状和问题,本研究融合国际基于Topic的语义知识组织技术,结合国内的需求,提出了“语义主题模型”,目标为构建可实... 构建语义化知识服务系统是数字图书馆在语义Web环境下的发展方向。针对目前各种语义Web技术在数字图书馆开发应用的现状和问题,本研究融合国际基于Topic的语义知识组织技术,结合国内的需求,提出了“语义主题模型”,目标为构建可实施的语义化知识系统。文章首先对以“概念化主题、主题关联、语义标签”为内涵的“语义主题化模型”概念进行定义;其次,设计基于此模型的语义化知识系统框架;再次,对相关应用进行了探讨;最后,对未来开发工作进行了规划。 展开更多
关键词 语义主题模型 知识系统框架 主题
下载PDF
试析“连”字句的信息结构特点 被引量:66
8
作者 袁毓林 《语言科学》 2006年第2期14-28,共15页
本文首先证明在“连”字句“连NP+都/也VP”中,“连”引导的成分NP是“都、也”约束的语义焦点,它既不是典型的话题、也不是所谓的“话题焦点”。接着,分析“连”字句中NP和VP在新旧信息组配上的格局和限制,证明整个“连”字句是一个传... 本文首先证明在“连”字句“连NP+都/也VP”中,“连”引导的成分NP是“都、也”约束的语义焦点,它既不是典型的话题、也不是所谓的“话题焦点”。接着,分析“连”字句中NP和VP在新旧信息组配上的格局和限制,证明整个“连”字句是一个传递新信息的广焦点。然后,揭示“连”字句的意义引申的句法、语义机制是:从谓语部分拷贝话题,并且话题隐含述题的部分意义。最后,讨论“连”字句中“连”的省略对相关句式的结构形式和焦点结构的影响,特别是对“都”的约束方向转变的决定性影响。 展开更多
关键词 语义焦点 话题焦点 广焦点 话题拷贝 语义隐含
下载PDF
基于双向LSTM语义强化的主题建模 被引量:14
9
作者 彭敏 杨绍雄 朱佳晖 《中文信息学报》 CSCD 北大核心 2018年第4期40-49,共10页
当前,双向LSTM神经网络等深度学习方法已经能有效地表达文本语义特征,为构建深层次的具有语义连贯性的主题模型提供了可能。但是,现有方法在文本的概率主题建模方面,提升的效果还比较有限。该文提出了一个基于双向LSTM语义强化的概率主... 当前,双向LSTM神经网络等深度学习方法已经能有效地表达文本语义特征,为构建深层次的具有语义连贯性的主题模型提供了可能。但是,现有方法在文本的概率主题建模方面,提升的效果还比较有限。该文提出了一个基于双向LSTM语义强化的概率主题模型DGPU-LDA(double generalized polya Urn with LDA)。该模型一方面结合双向LSTM文档语义编码框架DS-Bi-LSTM(document semantic bi-directional LSTM)来实现文档宏观语义的嵌入表示,另一方面采用文档—主题和词汇—词汇双GPU(generalized polya Urn)语义强化机制以及LSTM来刻画参数推断过程中的吉布斯采样过程。在搜狗新闻数据集以及20新闻组数据集上的实验结果表明,相对于一些比较前沿的主题模型,DGPU-LDA模型在主题语义连贯性、文本分类准确率方面展现了一定的优势,同时该模型在文本语义特征表达方面的有效性也得到了证明。 展开更多
关键词 双向LSTM 语义强化 主题模型
下载PDF
话题结构与主谓结构——话题的语义类型与英译转换 被引量:4
10
作者 邵志洪 赵宏 《解放军外国语学院学报》 北大核心 2003年第3期6-10,共5页
本文以郁达夫短篇小说《春风沉醉的晚上》中的话题结构为语料,根据话题的语义类型,分门别类与其对应的英语译文进行对比分析,目的在于检验话题结构的语义关系类型与句法表现,对比话题化与主语化两种不同语法化的结果,从而为汉语话题—... 本文以郁达夫短篇小说《春风沉醉的晚上》中的话题结构为语料,根据话题的语义类型,分门别类与其对应的英语译文进行对比分析,目的在于检验话题结构的语义关系类型与句法表现,对比话题化与主语化两种不同语法化的结果,从而为汉语话题—述题结构转化成英语主语—谓语结构提供一定依据和规律。 展开更多
关键词 话题结构 主谓结构 转换 话题语义类型
下载PDF
网络信息语义组织和检索的实现路径 被引量:6
11
作者 包冬梅 《图书情报工作》 CSSCI 北大核心 2006年第12期12-16,共5页
针对网络信息语义组织和检索的研究现状,指出基于语义知识组织基础上的语义概念检索是解决问题的根本之道,主要探讨在受限领域中如何引入新兴的知识组织技术——本体和主题图实现语义检索,阐述语义信息组织和检索的两条实现路径:基于本... 针对网络信息语义组织和检索的研究现状,指出基于语义知识组织基础上的语义概念检索是解决问题的根本之道,主要探讨在受限领域中如何引入新兴的知识组织技术——本体和主题图实现语义检索,阐述语义信息组织和检索的两条实现路径:基于本体的语义检索及基于主题图的知识导航。 展开更多
关键词 信息组织 语义检索 本体 主题图
原文传递
基于本体的Web信息采集 被引量:2
12
作者 徐德智 王庆涛 王斌 《现代图书情报技术》 CSSCI 北大核心 2007年第2期53-55,共3页
将语义网技术同传统的信息检索技术相结合,给出基于本体的Web信息采集框架结构,提出利用主题本体及对应词典判断主题相关度的方法,并得出实验结果和评价。
关键词 信息采集 本体 语义网 主题相关性
下载PDF
文档内可视化分析工具的比较研究 被引量:2
13
作者 陆泉 赵琴 陈静 《信息资源管理学报》 2016年第2期63-71,共9页
文章对现有文档内可视化分析工具进行梳理,根据可视化对象差异将工具分为基于文档内词汇分布的可视化、基于文档内语义结构的可视化、基于文档内主题内容的可视化共三种类型;然后从适用文档、文本分析方法、可视化形式、可视化对象、交... 文章对现有文档内可视化分析工具进行梳理,根据可视化对象差异将工具分为基于文档内词汇分布的可视化、基于文档内语义结构的可视化、基于文档内主题内容的可视化共三种类型;然后从适用文档、文本分析方法、可视化形式、可视化对象、交互方式、优势、局限性等方面对其中12种典型工具进行详细分析和比较,并由此总结归纳出三类工具的特点、差异性和共性;最后对现有文档内可视化分析工具的发展提出几点建议,以期为相关研究人员提供参考。 展开更多
关键词 文档内可视化 词汇分布 语义结构 主题 比较研究
下载PDF
基于LDA的用户轨迹分析 被引量:2
14
作者 蔡文学 萧超武 黄晓宇 《计算机应用与软件》 CSCD 2015年第5期307-309,333,共4页
随着以GPS导航仪和智能手机为代表的智能终端的普及应用,大量用户轨迹数据得以收集。这些轨迹数据背后隐含了丰富的空间结构信息和用户行为规律信息。对其进行深入挖掘有可能发现用户日常的行为规律,这对城市规划、交通管制等应用都具... 随着以GPS导航仪和智能手机为代表的智能终端的普及应用,大量用户轨迹数据得以收集。这些轨迹数据背后隐含了丰富的空间结构信息和用户行为规律信息。对其进行深入挖掘有可能发现用户日常的行为规律,这对城市规划、交通管制等应用都具有非常重要的意义。然而从大量轨迹数据中理解用户行为是一件艰难的工作,提出使用狄利克雷指派LDA(Latent Dirichlet Allocation)模型来对用户轨迹进行语义解释。通过LDA模型可以发现轨迹集中的主题区域以及热门路径,从而可以帮助理解用户的出行意图。实验结果表明LDA能有效地解释用户轨迹。 展开更多
关键词 用户轨迹 语义解释 LDA 主题区域
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部