期刊文献+
共找到35篇文章
< 1 2 >
每页显示 20 50 100
基于空间语义角色的自然语言空间概念提取 被引量:27
1
作者 杨崇俊 于文洋 《武汉大学学报(信息科学版)》 EI CSCD 北大核心 2005年第12期1100-1103,共4页
根据空间信息的特点,从定义的空间语义角色入手,通过语义角色标注、短语识别以及概念模式匹配等手段,具体分析了自然语言中的空间实体、实体间空间关系以及空间过程的表达与提取方法。
关键词 空间语义角色 GIS 信息提取(IE) 自然语言处理(NLP)
下载PDF
基于LDA主题关联过滤的领域主题演化研究 被引量:27
2
作者 秦晓慧 《现代图书情报技术》 CSSCI 2015年第3期18-25,共8页
【目的】发现领域文献中主题的新生、消亡、继承、分裂和合并的演化轨迹。【方法】根据文献出版时间划分多个时间窗口,通过LDA主题模型识别各个时间窗口中的主题;利用主题关联(Topic Association)过滤规则确定相邻时间窗口主题间的演化... 【目的】发现领域文献中主题的新生、消亡、继承、分裂和合并的演化轨迹。【方法】根据文献出版时间划分多个时间窗口,通过LDA主题模型识别各个时间窗口中的主题;利用主题关联(Topic Association)过滤规则确定相邻时间窗口主题间的演化关系;形成连续时间段内主题新生、消亡、继承、分裂和合并的演化轨迹。【结果】在保证主题延续性的条件下,更准确地识别主题的新生、消亡、继承、分裂和合并的演化类型。【局限】固定的时间窗口,未考虑主题演化周期的多样性。【结论】该方法可以有效降低LDA主题模型中相似度较小主题的干扰,提升主题演化关系识别的准确性。 展开更多
关键词 主题关联 主题演化 主题模型LDA
原文传递
基于能量演化线索的潜在爆发词探测方法 被引量:17
3
作者 洪娜 张智雄 《现代图书情报技术》 CSSCI 北大核心 2010年第11期45-52,共8页
从跟踪词能量演化线索的角度分析潜在爆发词探测的可行性,提出一种基于词的能量和能量增长趋势的潜在爆发词探测方法。首先对词的生命周期及其演化现象进行阐述,在方法分析和词的能量积累与衰减、能量趋势变化分析的基础上,提出建模依据... 从跟踪词能量演化线索的角度分析潜在爆发词探测的可行性,提出一种基于词的能量和能量增长趋势的潜在爆发词探测方法。首先对词的生命周期及其演化现象进行阐述,在方法分析和词的能量积累与衰减、能量趋势变化分析的基础上,提出建模依据,设计EneTr模型,并分别针对EneTr模型中的关键问题提出相应的解决方案,实现具体的算法,最后分别针对网络新闻和科学文献两种类型的文档流进行分析和实验,验证本方法的效果。 展开更多
关键词 时间序列 爆发词 潜在爆发词 能量
原文传递
面向领域科技文献的句子级创新点抽取研究 被引量:15
4
作者 张帆 《现代图书情报技术》 CSSCI 北大核心 2014年第9期15-21,共7页
【目的】抽取领域科技文献中句子级创新点。【方法】面向文献中的句子,以领域词表和本体中的关系为基础构建识别规则,采用基于主题词重叠度的冗余度计算方法过滤创新点候选集。【结果】选取肿瘤领域的数据集进行实验,抽取结果的准确率为... 【目的】抽取领域科技文献中句子级创新点。【方法】面向文献中的句子,以领域词表和本体中的关系为基础构建识别规则,采用基于主题词重叠度的冗余度计算方法过滤创新点候选集。【结果】选取肿瘤领域的数据集进行实验,抽取结果的准确率为89.42%,召回率为60.14%。【局限】规则有待进一步完善,提高召回率。【结论】利用领域词表和本体中的关系能有效地抽取科技文献中的句子级创新点。 展开更多
关键词 科技文献 语言学特征 结构式摘要 创新点抽取 冗余度计算
原文传递
基于Web服务的分布式WebGIS设计与应用 被引量:5
5
作者 钱贞国 杨崇俊 +1 位作者 刘冬林 《物探化探计算技术》 CAS CSCD 2005年第4期343-347,共5页
分布式W ebGIS是目前GIS领域研究的重点,对于实现空间信息共享和GIS互操作具有重要的意义。传统上,用于构建分布式W ebGIS的分布式对象技术主要有对象管理集团(OMG)的COBRA、微软的COM/DCOM和Sun的J2EE/EJB。然而,由于这些分布式对象技... 分布式W ebGIS是目前GIS领域研究的重点,对于实现空间信息共享和GIS互操作具有重要的意义。传统上,用于构建分布式W ebGIS的分布式对象技术主要有对象管理集团(OMG)的COBRA、微软的COM/DCOM和Sun的J2EE/EJB。然而,由于这些分布式对象技术往往要求服务使用者和提供者之间必须进行紧密耦合,因此无法适应基于Internet计算要求的松散性。鉴于以上不足,这里提出了一种基于W eb服务构建分布式W ebGIS的新方法,并设计出了基于W eb服务的分布式W ebGIS系统结构框架。论文结合应用研究项目,示例了基于.NET平台实现分布式W ebGIS应用系统的过程。实践证明,基于W eb服务建立的分布式W ebGIS系统具有稳定性、可扩展性和部署灵活等优点。 展开更多
关键词 WEB服务 分布式WEBGIS NET ASP.NET
下载PDF
基于决策树的潜在爆发词探测方法 被引量:12
6
作者 洪娜 张智雄 《情报学报》 CSSCI 北大核心 2012年第3期228-241,共14页
本文从多个维度对词进行综合判断,提出了一种基于决策树的潜在爆发词探测思路与方法。首先对词的生命周期及其爆发现象进行了分析,从词的能量演变、词与词簇的关系、词与已爆发词的关系等多个角度归纳了文档流中词爆发的潜在影响因素... 本文从多个维度对词进行综合判断,提出了一种基于决策树的潜在爆发词探测思路与方法。首先对词的生命周期及其爆发现象进行了分析,从词的能量演变、词与词簇的关系、词与已爆发词的关系等多个角度归纳了文档流中词爆发的潜在影响因素;然后在对综合决策方法对比分析的基础上,选取决策树作为综合判断模型,并针对决策树判别过程中的关键问题提出相应的解决方案;此外还实现了具体的算法,并分别针对网络新闻和科学文献两种类型的文档流进行分析和实验,验证了方法的效果。 展开更多
关键词 时间序列 爆发词 潜在爆发词 决策树
下载PDF
三维复杂场景管理研究 被引量:8
7
作者 于文洋 杨崇俊 +1 位作者 陈飞翔 《计算机工程与应用》 CSCD 北大核心 2006年第13期38-40,共3页
三维复杂场景管理是三维地理信息系统、三维景观系统、虚拟现实的基础和核心。三维复杂场景管理应该充分考虑场景数据的复杂性、数据组织及调用的高效性。论文提出了一种结合八叉树、二叉空间分割树,门剪切的空间分割可见性算法,在此基... 三维复杂场景管理是三维地理信息系统、三维景观系统、虚拟现实的基础和核心。三维复杂场景管理应该充分考虑场景数据的复杂性、数据组织及调用的高效性。论文提出了一种结合八叉树、二叉空间分割树,门剪切的空间分割可见性算法,在此基础上并结合动态场景的设计,以及空间数据内存管理,设计并实现了复杂三维场景引擎。 展开更多
关键词 三维复杂场景管理 空间分割 数据组织
下载PDF
基于WMD语义相似度的TextRank改进算法识别论文核心主题句研究 被引量:11
8
作者 王子璇 何远标 《数据分析与知识发现》 CSSCI CSCD 2017年第4期1-8,共8页
【目的】自动甄别科技论文中描述研究主题的关键语句。【方法】以论文小节为单位组织句子集,通过训练领域词向量计算句子间WMD距离得到相应语义相似度,优化Text Rank算法迭代过程,利用外部特征对所得权值进行调整,按句子权值降序选取关... 【目的】自动甄别科技论文中描述研究主题的关键语句。【方法】以论文小节为单位组织句子集,通过训练领域词向量计算句子间WMD距离得到相应语义相似度,优化Text Rank算法迭代过程,利用外部特征对所得权值进行调整,按句子权值降序选取关键主题句。【结果】以气候变化领域科技论文作为实验数据,以人工标注的结果为基准对本文的算法和传统的Text Rank算法进行对比实验,初步结果表明该方法的识别效果(F值)比传统Text Rank算法提升约5%。【局限】句子特征提取有待提高,词向量训练及方法中的相关参数需要做进一步优化。【结论】基于领域词向量,融合WMD语义相似度的Text Rank改进算法,能够较好地甄别科技论文小节内部中心句,辅以外部特征的权值调整后可以较好地识别出一篇论文的核心主题句。 展开更多
关键词 WMD TextRank 语义相似 主题句识别 外部特征
原文传递
空间命名实体的识别 被引量:7
9
作者 杨崇俊 刘冬林 《计算机工程》 EI CAS CSCD 北大核心 2005年第20期49-50,53,共3页
采用地理编码和汉语切分词相结合的方法对空间命名实体进行在线识别。通过全文粗扫描获取相关的地理编码来锁定文中涉及的空间范围,然后按照一定的策略在确定的空间范围内进行单句识别,从而显著地减少了词典的加载量,较好地解决了因命... 采用地理编码和汉语切分词相结合的方法对空间命名实体进行在线识别。通过全文粗扫描获取相关的地理编码来锁定文中涉及的空间范围,然后按照一定的策略在确定的空间范围内进行单句识别,从而显著地减少了词典的加载量,较好地解决了因命名实体词典数量庞大而导致的低效率问题。实验表明,该方法能有效降低内存的消耗量和识别时间,提高识别精度,基本满足空间命名实体在线识别和位置信息服务的要求。 展开更多
关键词 空间命名实体识别 自然语言处理 地理编码 位置服务
下载PDF
领域科技文献创新点句中主题属性实例识别方法研究 被引量:9
10
作者 张帆 《现代图书情报技术》 CSSCI 2015年第5期15-23,共9页
【目的】识别创新点句中主题属性实例,进一步挖掘创新点句中的知识关系。【方法】采用语义角色标注以及依存句法分析方法,借助领域本体中属性类目下主题词,从依存树中识别创新点句中的核心主题词以及属性实例;针对依存句法分析的特征,... 【目的】识别创新点句中主题属性实例,进一步挖掘创新点句中的知识关系。【方法】采用语义角色标注以及依存句法分析方法,借助领域本体中属性类目下主题词,从依存树中识别创新点句中的核心主题词以及属性实例;针对依存句法分析的特征,设计组合术语识别模块以及连接词关系识别模块以改善识别效果。【结果】创新点句中核心主题词识别的F值达到77.94%;创新点句中属性实例识别的平均F值在90%左右。【局限】使用Stanford依存句法分析工具对肿瘤领域进行句法分析造成的偏差影响识别效果;使用NCIt本体属性类别时,有待进一步过滤与规范。【结论】实验结果表明,该方法对领域创新点句中的主题属性实例具有较好的识别效果。 展开更多
关键词 领域本体 语义角色标注 依存句法分析 属性实例
原文传递
科技论文引用内容分析研究进展 被引量:9
11
作者 王露 《数据分析与知识发现》 CSSCI CSCD 北大核心 2022年第4期1-15,共15页
【目的】梳理近年来引用内容分析研究进展,理清研究方向及技术发展趋势。【文献范围】利用知网、Scopus、语义学者等搜索平台,以“引文全文本”、“引文上下文”、“引文内容”、“引用内容”、“citation content”等关键词进行检索,... 【目的】梳理近年来引用内容分析研究进展,理清研究方向及技术发展趋势。【文献范围】利用知网、Scopus、语义学者等搜索平台,以“引文全文本”、“引文上下文”、“引文内容”、“引用内容”、“citation content”等关键词进行检索,并进行人工筛选。【方法】从相关概念辨析、主要研究方向、关键技术、分析工具和平台4个方面对引用内容分析相关研究进行归纳和对比分析,提出现存问题和未来研究方向。【结果】引用内容分析在引用动机、引用评价、知识流向、论文推荐等研究方向出现一些新的研究思路和方法;在引用内容分析关键共性技术方面,引用句抽取、引用位置识别、引用情感分析、引用知识点识别等方面均取得进展。【局限】主要从宏观层面归纳总结引用内容分析相关研究,未进行各个方面内容的深入阐述。【结论】引用内容分析相对于引文分析具有独特的优势,随着自然语言处理技术的快速迭代,其发展前景广阔。 展开更多
关键词 引用内容 引用内容分析 机器学习 深度学习
原文传递
领域内中文科技文献中新发现语言描述特征分析 被引量:8
12
作者 毛琛瑜 《现代图书情报技术》 CSSCI 2016年第5期47-55,共9页
【目的】分析领域内中文科技文献新发现语言描述特征。【方法】语义标注新发现语言描述特征,通过句式分析、频次分布统计以及共现分析探究其特征规律。【结果】总结得到领域内中文科技文献新发现语言的句型,找出新发现语言的特征搭配。... 【目的】分析领域内中文科技文献新发现语言描述特征。【方法】语义标注新发现语言描述特征,通过句式分析、频次分布统计以及共现分析探究其特征规律。【结果】总结得到领域内中文科技文献新发现语言的句型,找出新发现语言的特征搭配。【局限】结果具有领域学科局限性,需要进一步对比研究。【结论】利用语义标注、频次统计以及共现分析可以有效地发现中文科技文献中新发现语言的描述特征。 展开更多
关键词 新发现 语言特征 语义标注
原文传递
嵌入式桌面信息服务及其系统实现 被引量:7
13
作者 李宇 +2 位作者 张晓林 张智雄 李春旺 《现代图书情报技术》 CSSCI 北大核心 2008年第3期7-11,共5页
在用户操作现场感知用户需求,采用情景驱动,将科技文献服务即时嵌入到用户的工作流程之中。介绍这种嵌入式桌面信息服务的基本思想及系统设计、实现方法。
关键词 嵌入式服务 桌面工具 Web2.0桌面 信息检索
下载PDF
学术论文大纲中关键术语抽取方法研究 被引量:7
14
作者 何远标 张帆 《现代图书情报技术》 CSSCI 北大核心 2014年第3期73-79,共7页
【目的】针对学术论文大纲内容精炼、层次性的特点,研究从中抽取重要且具有实质意义术语的方法。【方法】结合语言学规则和术语词典从大纲各级标题中识别出候选术语集,然后根据术语间的句法依存关系计算tf-idf,并利用大纲结构量化术语... 【目的】针对学术论文大纲内容精炼、层次性的特点,研究从中抽取重要且具有实质意义术语的方法。【方法】结合语言学规则和术语词典从大纲各级标题中识别出候选术语集,然后根据术语间的句法依存关系计算tf-idf,并利用大纲结构量化术语层级特征,最后结合tf-idf与层级特征对候选术语进行排名,选择出关键术语。【结果】实验证明,该方法的候选术语识别F值达到89.57%,术语选择F值达到36.89%。【局限】采用的术语抽取规则不完备,且tf-idf计算过程中的权值设置仅使用经验值,导致未能达到最优效果。【结论】该方法能有效抽取大纲中的关键术语,适用于层级结构中的关键术语抽取。 展开更多
关键词 候选术语识别 候选术语选择 句法依存关系 层级特征
原文传递
DPaper:一种面向语义出版的结构化论文写作工具设计与实现 被引量:7
15
作者 王子璇 +3 位作者 张晓林 何远标 付常雷 许丽媛 《现代图书情报技术》 CSSCI 2016年第11期76-81,共6页
【目的】面向语义出版构建论文写作工具,在论文写作阶段实现内容结构化、对象化,使得一篇论文即是一个系统,论文可运行、可交互、可体验。【方法】采用数字对象和数字模板技术将论文内容(元数据、章节、数据、富媒体等)分解成不同类型... 【目的】面向语义出版构建论文写作工具,在论文写作阶段实现内容结构化、对象化,使得一篇论文即是一个系统,论文可运行、可交互、可体验。【方法】采用数字对象和数字模板技术将论文内容(元数据、章节、数据、富媒体等)分解成不同类型数字对象,数字对象间采用模板进行组织,通过事件触发机制实现交互,采用HTML5网页形式进行编辑和呈现并存储为XML结构化文档包。【结果】DPaper结构化论文写作工具已上线,提供从素材收集(云笔记)、数字对象制作、自动标引参考文献、按期刊版式呈现到Word文档格式转换等一系列功能,论文内容实现对象化和部分语义化。【局限】与常规论文编辑器相比,数字对象编辑器功能还不完善,还不能创建公式、图形等对象,排版的灵活性不足。【结论】利用DPaper写作工具可以在写作阶段由作者构建出满足语义出版应用需求的结构化论文。 展开更多
关键词 DPaper 语义出版 结构化论文 数字对象 写作工具
原文传递
嵌入式泛在个人知识服务模型研究 被引量:6
16
作者 管仲 +1 位作者 袁国华 李宇 《现代图书情报技术》 CSSCI 北大核心 2009年第12期37-41,共5页
比较分析嵌入式服务的技术模式;针对当前应用上的不足,提出嵌入式泛在个人知识服务模型,旨在解决知识环境下克服应用环境的限制、围绕个人知识活动链路进行知识组织和服务构建问题;分别在理论、技术和实践三个层次上系统性阐述模型的基... 比较分析嵌入式服务的技术模式;针对当前应用上的不足,提出嵌入式泛在个人知识服务模型,旨在解决知识环境下克服应用环境的限制、围绕个人知识活动链路进行知识组织和服务构建问题;分别在理论、技术和实践三个层次上系统性阐述模型的基本思想、形式化描述方法、模型框架、处理流程以及关键技术,并给出知识单元、知识点表达方法和初步实践结果。 展开更多
关键词 嵌入式服务 知识服务 泛在环境 个人知识空间 知识单元 EUPKS
原文传递
非受限文本中深层空间语义的识别方法 被引量:4
17
作者 杨崇俊 《计算机工程》 EI CAS CSCD 北大核心 2006年第4期36-38,共3页
利用地理空间描述模型中的相关概念扩展自然语言中空间语义角色,通过空间语义角色标注、短语识别以及句法模式分析达到识别非受限文本中深层空间语义的目的。实验表明,该方法具有较好的准确率、召回率与通常的信息提取性能相当。
关键词 空间语义角色 语义分析 自然语言理解(NLU) 地理信息系统(GIS)
下载PDF
科技论文中数值指标实际取值识别 被引量:4
18
作者 郭少卿 《数据分析与知识发现》 CSSCI CSCD 北大核心 2018年第1期21-28,共8页
【目的】科技论文中数值指标的大小有多种描述形式,本文旨在从不同形式的描述句中准确识别数值指标的实际取值。【方法】分析数值指标句中指标实体与数字实体间最小句法树路径,采用远程监督学习数值指标句的句法特征及描述特征,从领域... 【目的】科技论文中数值指标的大小有多种描述形式,本文旨在从不同形式的描述句中准确识别数值指标的实际取值。【方法】分析数值指标句中指标实体与数字实体间最小句法树路径,采用远程监督学习数值指标句的句法特征及描述特征,从领域候选句中识别数值指标句;利用少量语义标注数据学习"大于"、"小于"、"等于"、"倍数"4类取值关系模板,通过模板识别数值指标句的取值关系类别,依据不同取值关系模板对应的数值指标实际取值换算关系计算指标实际数值的大小。【结果】在气候变化领域和天文学领域开展实验,F值分别达到82.35%和77.55%,识别效果达到同类研究平均水平之上。【局限】以单句为数据单元开展识别研究,对于跨句间的指标取值问题未做考虑。【结论】本方法能够有效识别单句中数值指标的实际取值,识别过程不需要大量人工标注语料,迁移到其他领域时不做额外处理,系统性能不会明显下降,具有一定的实用性。 展开更多
关键词 数值指标 实际取值 模板发现 远程监督
原文传递
JNI技术在桌面搜索工具中的应用 被引量:3
19
作者 周强 李曦 《计算机技术与发展》 2013年第2期170-172,176,共4页
DocFetcher是一个用Java语言编写的优秀开源桌面搜索工具,该工具支持的文档格式有PDF、Word、PowerPoint等。作者对DocFetcher进行了剪裁,编写了创建索引和检索索引程序。e划通是用Visual C++开发的,为了在e划通中集成DocFetcher,就需... DocFetcher是一个用Java语言编写的优秀开源桌面搜索工具,该工具支持的文档格式有PDF、Word、PowerPoint等。作者对DocFetcher进行了剪裁,编写了创建索引和检索索引程序。e划通是用Visual C++开发的,为了在e划通中集成DocFetcher,就需要采用C语言调用Java的技术(Java Native Interface,简称JNI)来实现。文中首先介绍了JNI,接着对该桌面搜索工具JNI中C部分的程序进行了说明,分为三部分,即创建Java虚拟机、创建索引、检索索引,文中列出了主要的程序代码,并且进行了详细说明。现在,该桌面搜索工具应用在e划通2.5完全版中,功能使用正确,运行稳定。采用JNI作为数据交换的桥梁,会给软件的实现带来极大的灵活性。C语言可以在完全体现自身优势的情况下,整合Java语言开发的软件,更大范围地实现了软件重用。 展开更多
关键词 Java虚拟机发 JAVA本地接口 桌面搜索
下载PDF
基于日志的泛在个人数据同步方法研究 被引量:2
20
作者 何远标 +3 位作者 袁国华 许丽媛 管仲 周强 《现代图书情报技术》 CSSCI 北大核心 2013年第10期8-14,共7页
泛在环境下个人数据通常分散在不同的应用环境(如桌面、移动终端、服务器)中,如何对其进行一体化管理是应用中的现实需求。数据同步是实现这一过程的关键环节,探讨采用交换操作日志实现个人数据同步的方法,阐述其实现原理、技术思路及... 泛在环境下个人数据通常分散在不同的应用环境(如桌面、移动终端、服务器)中,如何对其进行一体化管理是应用中的现实需求。数据同步是实现这一过程的关键环节,探讨采用交换操作日志实现个人数据同步的方法,阐述其实现原理、技术思路及基本流程。目前该方法已在e划通系统得到验证。 展开更多
关键词 数据同步 操作日志 数据冲突处理
原文传递
上一页 1 2 下一页 到第
使用帮助 返回顶部