期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
14
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于潜在语义主题融合的铁路扣件状态检测
被引量:
6
1
作者
狄仕磊
刘甲甲
+1 位作者
罗建桥
李柏林
《传感器与微系统》
CSCD
2016年第7期19-21,25,共4页
针对现有单一底层特征识别扣件状态的算法存在描述能力差、特征维度过高等问题,提出一种基于两种扣件底层特征的潜在语义主题融合的扣件检测模型。通过潜在狄利克雷分布(LDA)模型分别获取扣件图像的局部二值模式(LBP)特征和方向梯度直方...
针对现有单一底层特征识别扣件状态的算法存在描述能力差、特征维度过高等问题,提出一种基于两种扣件底层特征的潜在语义主题融合的扣件检测模型。通过潜在狄利克雷分布(LDA)模型分别获取扣件图像的局部二值模式(LBP)特征和方向梯度直方图(HOG)特征的扣件语义主题向量。将这两种语义主题向量进行加权融合,权值由该图像LBP特征图和其梯度图的信息熵来确定。以该向量训练分类器,判断待检扣件状态。实验表明:与目前的主流扣件检测方法相比,该方法的漏检率和误检率明显降低,检测能力显著增强。
展开更多
关键词
铁路扣件检测
语义主题
潜在狄利克雷分布模型
信息熵
加权融合
下载PDF
职称材料
基于PLSA模型的Web页面语义标注算法研究
被引量:
5
2
作者
王云英
《情报杂志》
CSSCI
北大核心
2013年第1期141-144,共4页
高效的Web页面语义标注方法是提高Web信息资源利用效率和知识创新的关键。针对当前Web页面语义标注方法存在的问题和Web页面表现出的结构特征和文本特征及其主题分布规律,设计了基于PLSA主题模型的Web页面语义标注算法。该算法分别对We...
高效的Web页面语义标注方法是提高Web信息资源利用效率和知识创新的关键。针对当前Web页面语义标注方法存在的问题和Web页面表现出的结构特征和文本特征及其主题分布规律,设计了基于PLSA主题模型的Web页面语义标注算法。该算法分别对Web页面的结构特征和文本特征构建独立的PLSA主题模型,采用自适应不对称学习算法对这些独立的PLSA主题模型进行集成和优化,最终形成新的综合性的PLSA主题模型进行未知Web页面的自动语义标注。实验结果表明,该算法能够显著提高Web页面语义标注的准确率和效率,可以有效地解决大规模Web页面语义标注问题。
展开更多
关键词
语义标注
PLSA模型
潜在语义主题
标注算法
WEB页面
下载PDF
职称材料
基于视觉语义主题的图像自动标注
被引量:
3
3
作者
孙君顶
李海华
靳姣林
《测控技术》
CSCD
2016年第12期11-15,共5页
为减小图像检索中语义鸿沟的影响,提出了一种基于视觉语义主题的图像自动标注方法。首先,提取图像前景与背景区域,并分别进行预处理;然后,基于概率潜在语义分析与高斯混合模型建立图像底层特征、视觉语义主题与标注关键词间的联系,并基...
为减小图像检索中语义鸿沟的影响,提出了一种基于视觉语义主题的图像自动标注方法。首先,提取图像前景与背景区域,并分别进行预处理;然后,基于概率潜在语义分析与高斯混合模型建立图像底层特征、视觉语义主题与标注关键词间的联系,并基于该模型实现对图像的自动标注。采用corel 5数据库进行验证,实验结果证明了本文方法的有效性。
展开更多
关键词
视觉语义主题
概率潜在语义分析
高斯混合模型
图像自动标注
下载PDF
职称材料
基于PLSA的大众标注资源主题挖掘
被引量:
5
4
作者
王嵩
代逸生
李保珍
《现代图书情报技术》
CSSCI
北大核心
2010年第3期47-51,共5页
针对大众标注中用户生成标签的随意性以及无规则性所导致的标签混乱问题,引入潜在语义索引分析PLSA算法,得到特定资源主题下的标签集,为网络信息组织及用户获取提供有效的途径。通过抽取Delicious网站中的用户标注信息,证实PLSA方法对...
针对大众标注中用户生成标签的随意性以及无规则性所导致的标签混乱问题,引入潜在语义索引分析PLSA算法,得到特定资源主题下的标签集,为网络信息组织及用户获取提供有效的途径。通过抽取Delicious网站中的用户标注信息,证实PLSA方法对于特定资源的主题特征具有比较好的效果。
展开更多
关键词
大众标注
概率潜在语义分析
语义标签
资源主题
原文传递
基于语义爬虫的商品信息主题采集研究
被引量:
7
5
作者
黄炜
张李义
《现代图书情报技术》
CSSCI
北大核心
2010年第1期3-8,共6页
结合网页主题链接分析和网页主题内容语义分析,提出一个以主题爬虫实现采集商品信息的方法。在爬行过程中通过对本体的统计学习,使主题本体参照物不断得到优化。实验结果表明,该方法较其他传统爬行算法更有效,并能防止主题漂移的发生,...
结合网页主题链接分析和网页主题内容语义分析,提出一个以主题爬虫实现采集商品信息的方法。在爬行过程中通过对本体的统计学习,使主题本体参照物不断得到优化。实验结果表明,该方法较其他传统爬行算法更有效,并能防止主题漂移的发生,带来较高的主题收获率。
展开更多
关键词
主题爬虫
商务信息语义
主题链接分析
本体学习
原文传递
基于CTM模型和最优标签集的图像标注
被引量:
3
6
作者
朱韶平
夏利民
朱城
《复旦学报(自然科学版)》
CAS
CSCD
北大核心
2014年第1期147-153,162,共8页
为了提高自动标注系统的性能,提出了一种基于最优标签集图像自动标注系统优化算法.用词袋模型表示图像,采用CTM模型进行图像标注,在此基础上,采用基于词频因子的词间相关性以及启发式迭代算法对获得的标注词进行有效的优化,提高了标注...
为了提高自动标注系统的性能,提出了一种基于最优标签集图像自动标注系统优化算法.用词袋模型表示图像,采用CTM模型进行图像标注,在此基础上,采用基于词频因子的词间相关性以及启发式迭代算法对获得的标注词进行有效的优化,提高了标注词的准确性.在Corel5K数据集中利用LDA模型和CTM模型进行图像标注对比实验,实验结果表明本文提出的图像标注方法能有效提高标注系统的性能.
展开更多
关键词
CTM模型
LDA模型
潜在语义主题
最佳标签集
原文传递
基于“语义主题模型”的知识系统框架设计及应用研究
7
作者
李颖
张毅
《数字图书馆论坛》
2012年第4期24-27,共4页
构建语义化知识服务系统是数字图书馆在语义Web环境下的发展方向。针对目前各种语义Web技术在数字图书馆开发应用的现状和问题,本研究融合国际基于Topic的语义知识组织技术,结合国内的需求,提出了“语义主题模型”,目标为构建可实...
构建语义化知识服务系统是数字图书馆在语义Web环境下的发展方向。针对目前各种语义Web技术在数字图书馆开发应用的现状和问题,本研究融合国际基于Topic的语义知识组织技术,结合国内的需求,提出了“语义主题模型”,目标为构建可实施的语义化知识系统。文章首先对以“概念化主题、主题关联、语义标签”为内涵的“语义主题化模型”概念进行定义;其次,设计基于此模型的语义化知识系统框架;再次,对相关应用进行了探讨;最后,对未来开发工作进行了规划。
展开更多
关键词
语义主题模型
知识系统框架
主题
下载PDF
职称材料
试析“连”字句的信息结构特点
被引量:
66
8
作者
袁毓林
《语言科学》
2006年第2期14-28,共15页
本文首先证明在“连”字句“连NP+都/也VP”中,“连”引导的成分NP是“都、也”约束的语义焦点,它既不是典型的话题、也不是所谓的“话题焦点”。接着,分析“连”字句中NP和VP在新旧信息组配上的格局和限制,证明整个“连”字句是一个传...
本文首先证明在“连”字句“连NP+都/也VP”中,“连”引导的成分NP是“都、也”约束的语义焦点,它既不是典型的话题、也不是所谓的“话题焦点”。接着,分析“连”字句中NP和VP在新旧信息组配上的格局和限制,证明整个“连”字句是一个传递新信息的广焦点。然后,揭示“连”字句的意义引申的句法、语义机制是:从谓语部分拷贝话题,并且话题隐含述题的部分意义。最后,讨论“连”字句中“连”的省略对相关句式的结构形式和焦点结构的影响,特别是对“都”的约束方向转变的决定性影响。
展开更多
关键词
语义焦点
话题焦点
广焦点
话题拷贝
语义隐含
下载PDF
职称材料
基于双向LSTM语义强化的主题建模
被引量:
14
9
作者
彭敏
杨绍雄
朱佳晖
《中文信息学报》
CSCD
北大核心
2018年第4期40-49,共10页
当前,双向LSTM神经网络等深度学习方法已经能有效地表达文本语义特征,为构建深层次的具有语义连贯性的主题模型提供了可能。但是,现有方法在文本的概率主题建模方面,提升的效果还比较有限。该文提出了一个基于双向LSTM语义强化的概率主...
当前,双向LSTM神经网络等深度学习方法已经能有效地表达文本语义特征,为构建深层次的具有语义连贯性的主题模型提供了可能。但是,现有方法在文本的概率主题建模方面,提升的效果还比较有限。该文提出了一个基于双向LSTM语义强化的概率主题模型DGPU-LDA(double generalized polya Urn with LDA)。该模型一方面结合双向LSTM文档语义编码框架DS-Bi-LSTM(document semantic bi-directional LSTM)来实现文档宏观语义的嵌入表示,另一方面采用文档—主题和词汇—词汇双GPU(generalized polya Urn)语义强化机制以及LSTM来刻画参数推断过程中的吉布斯采样过程。在搜狗新闻数据集以及20新闻组数据集上的实验结果表明,相对于一些比较前沿的主题模型,DGPU-LDA模型在主题语义连贯性、文本分类准确率方面展现了一定的优势,同时该模型在文本语义特征表达方面的有效性也得到了证明。
展开更多
关键词
双向LSTM
语义强化
主题模型
下载PDF
职称材料
话题结构与主谓结构——话题的语义类型与英译转换
被引量:
4
10
作者
邵志洪
赵宏
《解放军外国语学院学报》
北大核心
2003年第3期6-10,共5页
本文以郁达夫短篇小说《春风沉醉的晚上》中的话题结构为语料,根据话题的语义类型,分门别类与其对应的英语译文进行对比分析,目的在于检验话题结构的语义关系类型与句法表现,对比话题化与主语化两种不同语法化的结果,从而为汉语话题—...
本文以郁达夫短篇小说《春风沉醉的晚上》中的话题结构为语料,根据话题的语义类型,分门别类与其对应的英语译文进行对比分析,目的在于检验话题结构的语义关系类型与句法表现,对比话题化与主语化两种不同语法化的结果,从而为汉语话题—述题结构转化成英语主语—谓语结构提供一定依据和规律。
展开更多
关键词
话题结构
主谓结构
转换
话题语义类型
下载PDF
职称材料
网络信息语义组织和检索的实现路径
被引量:
6
11
作者
包冬梅
《图书情报工作》
CSSCI
北大核心
2006年第12期12-16,共5页
针对网络信息语义组织和检索的研究现状,指出基于语义知识组织基础上的语义概念检索是解决问题的根本之道,主要探讨在受限领域中如何引入新兴的知识组织技术——本体和主题图实现语义检索,阐述语义信息组织和检索的两条实现路径:基于本...
针对网络信息语义组织和检索的研究现状,指出基于语义知识组织基础上的语义概念检索是解决问题的根本之道,主要探讨在受限领域中如何引入新兴的知识组织技术——本体和主题图实现语义检索,阐述语义信息组织和检索的两条实现路径:基于本体的语义检索及基于主题图的知识导航。
展开更多
关键词
信息组织
语义检索
本体
主题图
原文传递
基于本体的Web信息采集
被引量:
2
12
作者
徐德智
王庆涛
王斌
《现代图书情报技术》
CSSCI
北大核心
2007年第2期53-55,共3页
将语义网技术同传统的信息检索技术相结合,给出基于本体的Web信息采集框架结构,提出利用主题本体及对应词典判断主题相关度的方法,并得出实验结果和评价。
关键词
信息采集
本体
语义网
主题相关性
下载PDF
职称材料
文档内可视化分析工具的比较研究
被引量:
2
13
作者
陆泉
赵琴
陈静
《信息资源管理学报》
2016年第2期63-71,共9页
文章对现有文档内可视化分析工具进行梳理,根据可视化对象差异将工具分为基于文档内词汇分布的可视化、基于文档内语义结构的可视化、基于文档内主题内容的可视化共三种类型;然后从适用文档、文本分析方法、可视化形式、可视化对象、交...
文章对现有文档内可视化分析工具进行梳理,根据可视化对象差异将工具分为基于文档内词汇分布的可视化、基于文档内语义结构的可视化、基于文档内主题内容的可视化共三种类型;然后从适用文档、文本分析方法、可视化形式、可视化对象、交互方式、优势、局限性等方面对其中12种典型工具进行详细分析和比较,并由此总结归纳出三类工具的特点、差异性和共性;最后对现有文档内可视化分析工具的发展提出几点建议,以期为相关研究人员提供参考。
展开更多
关键词
文档内可视化
词汇分布
语义结构
主题
比较研究
下载PDF
职称材料
基于LDA的用户轨迹分析
被引量:
2
14
作者
蔡文学
萧超武
黄晓宇
《计算机应用与软件》
CSCD
2015年第5期307-309,333,共4页
随着以GPS导航仪和智能手机为代表的智能终端的普及应用,大量用户轨迹数据得以收集。这些轨迹数据背后隐含了丰富的空间结构信息和用户行为规律信息。对其进行深入挖掘有可能发现用户日常的行为规律,这对城市规划、交通管制等应用都具...
随着以GPS导航仪和智能手机为代表的智能终端的普及应用,大量用户轨迹数据得以收集。这些轨迹数据背后隐含了丰富的空间结构信息和用户行为规律信息。对其进行深入挖掘有可能发现用户日常的行为规律,这对城市规划、交通管制等应用都具有非常重要的意义。然而从大量轨迹数据中理解用户行为是一件艰难的工作,提出使用狄利克雷指派LDA(Latent Dirichlet Allocation)模型来对用户轨迹进行语义解释。通过LDA模型可以发现轨迹集中的主题区域以及热门路径,从而可以帮助理解用户的出行意图。实验结果表明LDA能有效地解释用户轨迹。
展开更多
关键词
用户轨迹
语义解释
LDA
主题区域
下载PDF
职称材料
题名
基于潜在语义主题融合的铁路扣件状态检测
被引量:
6
1
作者
狄仕磊
刘甲甲
罗建桥
李柏林
机构
西南交通大学机械工程学院
出处
《传感器与微系统》
CSCD
2016年第7期19-21,25,共4页
基金
四川省科技支撑计划资助项目(2013GZ0032
2014GZ0005)
文摘
针对现有单一底层特征识别扣件状态的算法存在描述能力差、特征维度过高等问题,提出一种基于两种扣件底层特征的潜在语义主题融合的扣件检测模型。通过潜在狄利克雷分布(LDA)模型分别获取扣件图像的局部二值模式(LBP)特征和方向梯度直方图(HOG)特征的扣件语义主题向量。将这两种语义主题向量进行加权融合,权值由该图像LBP特征图和其梯度图的信息熵来确定。以该向量训练分类器,判断待检扣件状态。实验表明:与目前的主流扣件检测方法相比,该方法的漏检率和误检率明显降低,检测能力显著增强。
关键词
铁路扣件检测
语义主题
潜在狄利克雷分布模型
信息熵
加权融合
Keywords
railway
fastener
detection
semantic
topics
latent
Dirichlet
allocation(LDA)
model
information
entropy
weighted
fusion
分类号
TP391.4 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于PLSA模型的Web页面语义标注算法研究
被引量:
5
2
作者
王云英
机构
湘南学院图书馆
出处
《情报杂志》
CSSCI
北大核心
2013年第1期141-144,共4页
文摘
高效的Web页面语义标注方法是提高Web信息资源利用效率和知识创新的关键。针对当前Web页面语义标注方法存在的问题和Web页面表现出的结构特征和文本特征及其主题分布规律,设计了基于PLSA主题模型的Web页面语义标注算法。该算法分别对Web页面的结构特征和文本特征构建独立的PLSA主题模型,采用自适应不对称学习算法对这些独立的PLSA主题模型进行集成和优化,最终形成新的综合性的PLSA主题模型进行未知Web页面的自动语义标注。实验结果表明,该算法能够显著提高Web页面语义标注的准确率和效率,可以有效地解决大规模Web页面语义标注问题。
关键词
语义标注
PLSA模型
潜在语义主题
标注算法
WEB页面
Keywords
semantic
annotation
PLSA
model
latent
semantic
topics
annotation
algorithm
web
pages
分类号
G350 [文化科学—情报学]
下载PDF
职称材料
题名
基于视觉语义主题的图像自动标注
被引量:
3
3
作者
孙君顶
李海华
靳姣林
机构
河南理工大学计算机科学与技术学院
出处
《测控技术》
CSCD
2016年第12期11-15,共5页
基金
河南省基础与前沿技术研究项目(132300410462
112300410281)
文摘
为减小图像检索中语义鸿沟的影响,提出了一种基于视觉语义主题的图像自动标注方法。首先,提取图像前景与背景区域,并分别进行预处理;然后,基于概率潜在语义分析与高斯混合模型建立图像底层特征、视觉语义主题与标注关键词间的联系,并基于该模型实现对图像的自动标注。采用corel 5数据库进行验证,实验结果证明了本文方法的有效性。
关键词
视觉语义主题
概率潜在语义分析
高斯混合模型
图像自动标注
Keywords
visual
semantic
topics
probabilistic
latent
semantic
analysis
Gaussian
mixture
model
automaticimage
annotation
分类号
TP391.4 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于PLSA的大众标注资源主题挖掘
被引量:
5
4
作者
王嵩
代逸生
李保珍
机构
江苏科技大学经济管理学院
出处
《现代图书情报技术》
CSSCI
北大核心
2010年第3期47-51,共5页
基金
教育部人文社会科学研究项目"Web2.0环境下基于大众标注的网络民意跟踪与鉴别模式"(项目编号:09YJC870010)
江苏省教育厅高校哲学社科基金项目"基于大众标注的网络舆情监测"(项目编号:09SJB860002)的研究成果之一
文摘
针对大众标注中用户生成标签的随意性以及无规则性所导致的标签混乱问题,引入潜在语义索引分析PLSA算法,得到特定资源主题下的标签集,为网络信息组织及用户获取提供有效的途径。通过抽取Delicious网站中的用户标注信息,证实PLSA方法对于特定资源的主题特征具有比较好的效果。
关键词
大众标注
概率潜在语义分析
语义标签
资源主题
Keywords
Social
tagging
Probabilistic
latent
semantic
analysis
semantic
tags
Resource
topics
分类号
TP391.3 [自动化与计算机技术—计算机应用技术]
原文传递
题名
基于语义爬虫的商品信息主题采集研究
被引量:
7
5
作者
黄炜
张李义
机构
武汉大学信息资源研究中心
湖北工业大学管理学院
出处
《现代图书情报技术》
CSSCI
北大核心
2010年第1期3-8,共6页
基金
教育部人文社会科学重点研究基地重大项目"电子商务中商务信息跨平台检索与信息重组"(项目编号:07JJD870220)
湖北省教育厅人文社会科学项目"Web数据危机下商务信息资源的语义化管理研究"(项目编号:2009b228)的研究成果之一
文摘
结合网页主题链接分析和网页主题内容语义分析,提出一个以主题爬虫实现采集商品信息的方法。在爬行过程中通过对本体的统计学习,使主题本体参照物不断得到优化。实验结果表明,该方法较其他传统爬行算法更有效,并能防止主题漂移的发生,带来较高的主题收获率。
关键词
主题爬虫
商务信息语义
主题链接分析
本体学习
Keywords
Focused
crawler
Merchandise
information
semantic
topic
link
analysis
Ontology
learning
分类号
TP393.092 [自动化与计算机技术—计算机应用技术]
原文传递
题名
基于CTM模型和最优标签集的图像标注
被引量:
3
6
作者
朱韶平
夏利民
朱城
机构
湖南财政经济学院信息管理系
中南大学信息科学与工程学院
出处
《复旦学报(自然科学版)》
CAS
CSCD
北大核心
2014年第1期147-153,162,共8页
基金
国家自然科学基金项目(50808025)
湖南省科技计划项目(2012FJ3021)
+1 种基金
湖南省教育科学"十二五"规划课题(XJK012CGD022)
湖南省普通高等学校教学改革研究资助课题(湘教通【2012】401号544)
文摘
为了提高自动标注系统的性能,提出了一种基于最优标签集图像自动标注系统优化算法.用词袋模型表示图像,采用CTM模型进行图像标注,在此基础上,采用基于词频因子的词间相关性以及启发式迭代算法对获得的标注词进行有效的优化,提高了标注词的准确性.在Corel5K数据集中利用LDA模型和CTM模型进行图像标注对比实验,实验结果表明本文提出的图像标注方法能有效提高标注系统的性能.
关键词
CTM模型
LDA模型
潜在语义主题
最佳标签集
Keywords
CTM
model
LDA
model
latent
semantic
topic
optimal
tag
sets
分类号
TP391.4 [自动化与计算机技术—计算机应用技术]
原文传递
题名
基于“语义主题模型”的知识系统框架设计及应用研究
7
作者
李颖
张毅
机构
中国科学技术信息研究所
北京外国语大学
出处
《数字图书馆论坛》
2012年第4期24-27,共4页
基金
“十二五科技支撑计划--科技知识组织体系共享服务平台建设”资金支持(编号:2011BAH10B03-2)
中国科学技术信息研究所“汉语科技词系统建设与应用工程”重点工作和国家抖技支撑计划“面向外文科技文献信息的超级科技词表和本体建设”子任务支持.
文摘
构建语义化知识服务系统是数字图书馆在语义Web环境下的发展方向。针对目前各种语义Web技术在数字图书馆开发应用的现状和问题,本研究融合国际基于Topic的语义知识组织技术,结合国内的需求,提出了“语义主题模型”,目标为构建可实施的语义化知识系统。文章首先对以“概念化主题、主题关联、语义标签”为内涵的“语义主题化模型”概念进行定义;其次,设计基于此模型的语义化知识系统框架;再次,对相关应用进行了探讨;最后,对未来开发工作进行了规划。
关键词
语义主题模型
知识系统框架
主题
Keywords
semantic
topic
ized
model,
Knowledge
system
framework,
topic
,
Subject
分类号
G250.76 [文化科学—图书馆学]
下载PDF
职称材料
题名
试析“连”字句的信息结构特点
被引量:
66
8
作者
袁毓林
机构
北京大学中文系
出处
《语言科学》
2006年第2期14-28,共15页
基金
国家社科基金的资助(项目编号:02BYY033)
文摘
本文首先证明在“连”字句“连NP+都/也VP”中,“连”引导的成分NP是“都、也”约束的语义焦点,它既不是典型的话题、也不是所谓的“话题焦点”。接着,分析“连”字句中NP和VP在新旧信息组配上的格局和限制,证明整个“连”字句是一个传递新信息的广焦点。然后,揭示“连”字句的意义引申的句法、语义机制是:从谓语部分拷贝话题,并且话题隐含述题的部分意义。最后,讨论“连”字句中“连”的省略对相关句式的结构形式和焦点结构的影响,特别是对“都”的约束方向转变的决定性影响。
关键词
语义焦点
话题焦点
广焦点
话题拷贝
语义隐含
Keywords
semantic
focus
topic
al
focus
broad
focus
topic
copying
semantic
implication
rightward
binding
分类号
H146.3 [语言文字—汉语]
下载PDF
职称材料
题名
基于双向LSTM语义强化的主题建模
被引量:
14
9
作者
彭敏
杨绍雄
朱佳晖
机构
武汉大学计算机学院
出处
《中文信息学报》
CSCD
北大核心
2018年第4期40-49,共10页
基金
国家自然科学基金(61472291)
文摘
当前,双向LSTM神经网络等深度学习方法已经能有效地表达文本语义特征,为构建深层次的具有语义连贯性的主题模型提供了可能。但是,现有方法在文本的概率主题建模方面,提升的效果还比较有限。该文提出了一个基于双向LSTM语义强化的概率主题模型DGPU-LDA(double generalized polya Urn with LDA)。该模型一方面结合双向LSTM文档语义编码框架DS-Bi-LSTM(document semantic bi-directional LSTM)来实现文档宏观语义的嵌入表示,另一方面采用文档—主题和词汇—词汇双GPU(generalized polya Urn)语义强化机制以及LSTM来刻画参数推断过程中的吉布斯采样过程。在搜狗新闻数据集以及20新闻组数据集上的实验结果表明,相对于一些比较前沿的主题模型,DGPU-LDA模型在主题语义连贯性、文本分类准确率方面展现了一定的优势,同时该模型在文本语义特征表达方面的有效性也得到了证明。
关键词
双向LSTM
语义强化
主题模型
Keywords
bi-directional
LSTM
semantic
reinforcements
topic
model
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
话题结构与主谓结构——话题的语义类型与英译转换
被引量:
4
10
作者
邵志洪
赵宏
机构
华东理工大学外语学院
出处
《解放军外国语学院学报》
北大核心
2003年第3期6-10,共5页
文摘
本文以郁达夫短篇小说《春风沉醉的晚上》中的话题结构为语料,根据话题的语义类型,分门别类与其对应的英语译文进行对比分析,目的在于检验话题结构的语义关系类型与句法表现,对比话题化与主语化两种不同语法化的结果,从而为汉语话题—述题结构转化成英语主语—谓语结构提供一定依据和规律。
关键词
话题结构
主谓结构
转换
话题语义类型
Keywords
topic
structure
SV
structure
transformation
semantic
types
of
topic
分类号
H314 [语言文字—英语]
下载PDF
职称材料
题名
网络信息语义组织和检索的实现路径
被引量:
6
11
作者
包冬梅
机构
南京政治学院上海分院军事信息管理系
出处
《图书情报工作》
CSSCI
北大核心
2006年第12期12-16,共5页
基金
2004年国家社会科学基金项目"面向网络信息组织的中文网络本体语言研究"(项目编号:04BTQ026)成果之一
文摘
针对网络信息语义组织和检索的研究现状,指出基于语义知识组织基础上的语义概念检索是解决问题的根本之道,主要探讨在受限领域中如何引入新兴的知识组织技术——本体和主题图实现语义检索,阐述语义信息组织和检索的两条实现路径:基于本体的语义检索及基于主题图的知识导航。
关键词
信息组织
语义检索
本体
主题图
Keywords
information
organization
semantic
retrieval
ontology
topic
map
分类号
G354 [文化科学—情报学]
原文传递
题名
基于本体的Web信息采集
被引量:
2
12
作者
徐德智
王庆涛
王斌
机构
中南大学信息科学与工程学院
出处
《现代图书情报技术》
CSSCI
北大核心
2007年第2期53-55,共3页
基金
湖南省自然科学基金资助项目"方面化构件模型及其组装和组装体系结构评价研究"(项目编号:05JJ40312)的研究成果之一
文摘
将语义网技术同传统的信息检索技术相结合,给出基于本体的Web信息采集框架结构,提出利用主题本体及对应词典判断主题相关度的方法,并得出实验结果和评价。
关键词
信息采集
本体
语义网
主题相关性
Keywords
Information
gathering
Ontology
semantic
Web
topic
-
specific
relevance
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
文档内可视化分析工具的比较研究
被引量:
2
13
作者
陆泉
赵琴
陈静
机构
中国记忆与数字保存协同创新中心
武汉大学信息管理学院
华中师范大学信息管理学院
出处
《信息资源管理学报》
2016年第2期63-71,共9页
基金
国家自然科学基金项目"图像信息资源可视化协同语义标注及实现研究"(71273195)和"图书层次主题自动标引研究"(71303089)的成果之一
文摘
文章对现有文档内可视化分析工具进行梳理,根据可视化对象差异将工具分为基于文档内词汇分布的可视化、基于文档内语义结构的可视化、基于文档内主题内容的可视化共三种类型;然后从适用文档、文本分析方法、可视化形式、可视化对象、交互方式、优势、局限性等方面对其中12种典型工具进行详细分析和比较,并由此总结归纳出三类工具的特点、差异性和共性;最后对现有文档内可视化分析工具的发展提出几点建议,以期为相关研究人员提供参考。
关键词
文档内可视化
词汇分布
语义结构
主题
比较研究
Keywords
Within-document
visualization
Lexical
distribution
semantic
structure
topic
Comparative
study
分类号
G250.76 [文化科学—图书馆学]
下载PDF
职称材料
题名
基于LDA的用户轨迹分析
被引量:
2
14
作者
蔡文学
萧超武
黄晓宇
机构
华南理工大学经济与贸易学院
出处
《计算机应用与软件》
CSCD
2015年第5期307-309,333,共4页
基金
广东省现代信息服务业项目"广东交通信息服务平台"(GDIID2008IS006)
文摘
随着以GPS导航仪和智能手机为代表的智能终端的普及应用,大量用户轨迹数据得以收集。这些轨迹数据背后隐含了丰富的空间结构信息和用户行为规律信息。对其进行深入挖掘有可能发现用户日常的行为规律,这对城市规划、交通管制等应用都具有非常重要的意义。然而从大量轨迹数据中理解用户行为是一件艰难的工作,提出使用狄利克雷指派LDA(Latent Dirichlet Allocation)模型来对用户轨迹进行语义解释。通过LDA模型可以发现轨迹集中的主题区域以及热门路径,从而可以帮助理解用户的出行意图。实验结果表明LDA能有效地解释用户轨迹。
关键词
用户轨迹
语义解释
LDA
主题区域
Keywords
Users
trajectory
semantic
interpretation
LDA
topic
region
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于潜在语义主题融合的铁路扣件状态检测
狄仕磊
刘甲甲
罗建桥
李柏林
《传感器与微系统》
CSCD
2016
6
下载PDF
职称材料
2
基于PLSA模型的Web页面语义标注算法研究
王云英
《情报杂志》
CSSCI
北大核心
2013
5
下载PDF
职称材料
3
基于视觉语义主题的图像自动标注
孙君顶
李海华
靳姣林
《测控技术》
CSCD
2016
3
下载PDF
职称材料
4
基于PLSA的大众标注资源主题挖掘
王嵩
代逸生
李保珍
《现代图书情报技术》
CSSCI
北大核心
2010
5
原文传递
5
基于语义爬虫的商品信息主题采集研究
黄炜
张李义
《现代图书情报技术》
CSSCI
北大核心
2010
7
原文传递
6
基于CTM模型和最优标签集的图像标注
朱韶平
夏利民
朱城
《复旦学报(自然科学版)》
CAS
CSCD
北大核心
2014
3
原文传递
7
基于“语义主题模型”的知识系统框架设计及应用研究
李颖
张毅
《数字图书馆论坛》
2012
0
下载PDF
职称材料
8
试析“连”字句的信息结构特点
袁毓林
《语言科学》
2006
66
下载PDF
职称材料
9
基于双向LSTM语义强化的主题建模
彭敏
杨绍雄
朱佳晖
《中文信息学报》
CSCD
北大核心
2018
14
下载PDF
职称材料
10
话题结构与主谓结构——话题的语义类型与英译转换
邵志洪
赵宏
《解放军外国语学院学报》
北大核心
2003
4
下载PDF
职称材料
11
网络信息语义组织和检索的实现路径
包冬梅
《图书情报工作》
CSSCI
北大核心
2006
6
原文传递
12
基于本体的Web信息采集
徐德智
王庆涛
王斌
《现代图书情报技术》
CSSCI
北大核心
2007
2
下载PDF
职称材料
13
文档内可视化分析工具的比较研究
陆泉
赵琴
陈静
《信息资源管理学报》
2016
2
下载PDF
职称材料
14
基于LDA的用户轨迹分析
蔡文学
萧超武
黄晓宇
《计算机应用与软件》
CSCD
2015
2
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部