期刊文献+
共找到16篇文章
< 1 >
每页显示 20 50 100
一种并行化的启发式流程挖掘算法 被引量:15
1
作者 鲁法明 曾庆田 +2 位作者 段华 程久军 包云霞 《软件学报》 EI CSCD 北大核心 2015年第3期533-549,共17页
启发式流程挖掘算法在日志噪音与不完备日志的处理方面优势显著,但是现有算法对长距离依赖关系以及2-循环特殊结构的处理存在不足,而且算法未进行并行化处理.针对上述问题,基于执行任务集将流程模型划分为多个案例模型,结合改进的启发... 启发式流程挖掘算法在日志噪音与不完备日志的处理方面优势显著,但是现有算法对长距离依赖关系以及2-循环特殊结构的处理存在不足,而且算法未进行并行化处理.针对上述问题,基于执行任务集将流程模型划分为多个案例模型,结合改进的启发式算法并行挖掘各个案例模型所对应的C-net模型;再将上述模型集成得到完整流程对应的C-net.同时,将长距离依赖关系扩展为决策点处两个任务子集之间的非局部依赖关系,给出了更为准确的长距离依赖关系度量指标和挖掘算法.上述改进措施使得该算法更为精确、高效. 展开更多
关键词 流程挖掘 启发式挖掘算法 长距离依赖关系 案例模型 案例簇
下载PDF
一种体现长距离依赖关系的语言模型 被引量:4
2
作者 李春生 《科技视界》 2014年第5期55-56,共2页
基于N-gram的语言模型广泛应用于语音识别、机器翻译等众多自然语言处理相关领域,捕获的主要是词之间的局部依赖关系,但其本身存在一定的局限性。依存句法树能够反映出句子中各成分之间的语义修饰关系,显式地对词之间的长距离搭配关系... 基于N-gram的语言模型广泛应用于语音识别、机器翻译等众多自然语言处理相关领域,捕获的主要是词之间的局部依赖关系,但其本身存在一定的局限性。依存句法树能够反映出句子中各成分之间的语义修饰关系,显式地对词之间的长距离搭配关系进行建模。本文利用最大熵方法整合句子的局部依赖关系和长距离搭配关系,构建一种包含长距离依赖关系的语言模型。 展开更多
关键词 语言模型 长距离依赖 依存句法树 最大熵方法
下载PDF
基于句法依存卷积神经网络的句子相似度计算 被引量:2
3
作者 铉静 吴琼 +1 位作者 魏从悦 伍星 《重庆大学学报(自然科学版)》 EI CAS CSCD 北大核心 2020年第9期41-53,共13页
句子相似度计算是自然语言处理的一项基础任务,其准确性直接影响机器翻译、问题回答等下游任务的性能。传统机器学习方法主要依靠词形、词序及结构等浅层特征计算句子相似度,而深度学习方法能够融入深层语义特征,从而取得了更好效果。... 句子相似度计算是自然语言处理的一项基础任务,其准确性直接影响机器翻译、问题回答等下游任务的性能。传统机器学习方法主要依靠词形、词序及结构等浅层特征计算句子相似度,而深度学习方法能够融入深层语义特征,从而取得了更好效果。深度学习方法如卷积神经网络在提取文本特征时存在提取句子语义特征较浅、长距离依赖信息不足的缺点。因此设计了DCNN(dependency convolutional neural network)模型,该模型利用词语之间的依存关系来解决该不足。DCNN模型首先通过依存句法分析得到句子中词语之间的依存关系,而后根据与当前词存在一跳或者两跳关系的词语形成二元和三元的词语组合,再将这两部分信息作为原句信息的补充,输入到卷积神经网络中,以此来获取词语之间长距离依赖信息。实验结果表明,加入依存句法信息得到的长距离依赖能有效提升模型性能。在MSRP(microsoft research paraphrase corpus)数据集上,模型准确度和F1值分别为80.33%和85.91,在SICK(sentences involving compositional knowledge)数据集上模型的皮尔森相关系数能达到87.5,在MSRvid(microsoft video paraphrase corpus)数据集上模型的皮尔森相关系数能达到92.2。 展开更多
关键词 句子相似度 依存句法树 长距离依赖
下载PDF
语法和语义结合的代码补全方法
4
作者 付善庆 李征 +1 位作者 赵瑞莲 郭俊霞 《软件学报》 EI CSCD 北大核心 2022年第11期3930-3943,共14页
在软件工程领域,代码补全是集成开发环境(integrated development environment,IDE)中最有用的技术之一,提高了软件开发效率,成为了加速现代软件开发的重要技术.通过代码补全技术进行类名、方法名、关键字等预测,在一定程度上提高了代... 在软件工程领域,代码补全是集成开发环境(integrated development environment,IDE)中最有用的技术之一,提高了软件开发效率,成为了加速现代软件开发的重要技术.通过代码补全技术进行类名、方法名、关键字等预测,在一定程度上提高了代码规范,降低了编程人员的工作强度.近年来,人工智能技术的发展促进了代码补全技术的发展.总体来说,智能代码补全技术利用源代码训练深度学习网络,从语料库学习代码特征,根据待补全位置的上下文代码特征进行推荐和预测.现有的代码特征表征方式大多基于程序语法,没有反映出程序的语义信息.同时,目前使用到的网络结构在面对长代码序列时,解决长距离依赖问题的能力依旧不足.因此,提出了基于程序控制依赖关系和语法信息结合共同表征代码的方法,并将代码补全问题作为一个基于时间卷积网络(time convolution network,TCN)的抽象语法树(abstract grammar tree,AST)节点预测问题,使得网络模型可以更好地学习程序的语法和语义信息,并且可以捕获更长范围的依赖关系.实验结果表明,该方法比现有方法的准确率提高了约2.8%. 展开更多
关键词 代码补全 程序语法特征 程序语义特征 特征结合 长距离依赖 深度学习
下载PDF
基于集成学习和二维关联边条件随机场的Web数据语义标注方法 被引量:6
5
作者 丁艳辉 李庆忠 +1 位作者 董永权 彭朝晖 《计算机学报》 EI CSCD 北大核心 2010年第2期267-278,共12页
大规模Web信息抽取需要准确、自动地从众多相关网站上抽取Web数据对象.现有的Web信息抽取方法主要针对单个网站进行处理,无法适应大规模Web信息抽取的需要.调查研究表明,有效地实现Web数据语义自动标注,结合现有的包装器生成技术,可以... 大规模Web信息抽取需要准确、自动地从众多相关网站上抽取Web数据对象.现有的Web信息抽取方法主要针对单个网站进行处理,无法适应大规模Web信息抽取的需要.调查研究表明,有效地实现Web数据语义自动标注,结合现有的包装器生成技术,可以满足大规模Web信息抽取的要求.文中提出一种基于集成学习和二维关联边条件随机场的Web数据语义自动标注方法,首先,利用已抽取的信息和目标网站训练页面中呈现的特征构造多个分类器,使用Dempster合成法则合并分类器结果,区分训练页面中的属性标签和数据元素;然后,利用二维关联边条件随机场模型对Web数据元素间的长距离依赖联系和短距离依赖联系进行建模,实现数据元素的自动语义标注.通过在多个领域真实数据集上的实验结果表明,所提出的方法可以高效地解决Web数据语义自动标注问题,满足大规模Web信息抽取的需要. 展开更多
关键词 WEB信息抽取 语义标注 集成学习 条件随机场 长距离依赖
下载PDF
基于用户行为和上下文语义的分层ST-LSTM位置预测
6
作者 彭薇 江昊 +2 位作者 刘卉芳 彭诗雅 廖娟 《无线电工程》 2024年第1期32-40,共9页
当前的位置预测方法大多没有考虑到用户行为信息,由于用户的访问时间、行为模式等能够在很大程度上反映所处位置,因此在对位置潜在向量进行预训练时有必要使用该信息。进行位置预测时,采样粒度较细的序列长度较长,难以捕获长距离依赖。... 当前的位置预测方法大多没有考虑到用户行为信息,由于用户的访问时间、行为模式等能够在很大程度上反映所处位置,因此在对位置潜在向量进行预训练时有必要使用该信息。进行位置预测时,采样粒度较细的序列长度较长,难以捕获长距离依赖。针对这2个问题,提出了基于用户行为和上下文语义的分层时空长短期记忆网络(Hierarchical Spatiotemporal Long Short-Term Memory Based on User Behavior and Contextual Semantics,CHST-LSTM)模型。该模型通过Transformer编码层处理轨迹数据,将用户相关行为信息考虑在内,融合位置的上下文语义信息,通过预训练得到位置的嵌入表征。根据用户的行为状态分割轨迹阶段,采用编码器-解码器方式对ST-LSTM进行分段分层扩展,利用BiLSTM对全局信息建模,同时处理轨迹的长短期变化,解决长序列的长距离依赖问题。对外卖员用户群体的真实移动轨迹数据进行分析和实验,通过聚类发现其特有的工作模式,在预训练时加入工作模式信息与到访时间信息,得到位置的特征向量并用于预测模型。结果表明CHST-LSTM模型在预测用户下一位置时精度更高。 展开更多
关键词 位置预测 位置嵌入 行为模式 长距离依赖 时空轨迹
下载PDF
基于自注意力和长短期记忆网络的管制信息抽取模型
7
作者 王雪川 王煊 +2 位作者 杨涛 雷宁 王磊 《电气自动化》 2023年第4期76-78,共3页
管制指令的正确理解对飞行安全具有重要意义,从指令中提取管制信息有助于管制员的理解。为实现管制信息的自动提取,提出了一种新的管制信息抽取模型。模型基于自注意力和长短期记忆网络,将管制指令转换成标签序列,并学习标签之间的长距... 管制指令的正确理解对飞行安全具有重要意义,从指令中提取管制信息有助于管制员的理解。为实现管制信息的自动提取,提出了一种新的管制信息抽取模型。模型基于自注意力和长短期记忆网络,将管制指令转换成标签序列,并学习标签之间的长距离依赖性,实现管制信息的精确抽取。通过试验可知,新模型对管制信息的抽取精度不低于97%。由此可见,新模型可赋予计算机对管制信息的自动提取能力,辅助管制员工作,保障飞行安全。 展开更多
关键词 管制指令 信息抽取 长距离依赖性 自注意力网络 长短期记忆网络
下载PDF
强化文本关联语义和多特征提取的重复缺陷报告检测模型
8
作者 周文杰 谢琪 崔梦天 《重庆大学学报》 CAS CSCD 北大核心 2023年第7期53-62,共10页
针对重复缺陷报告检测研究中存在语义长距离依赖以及缺陷报告特征的单一性问题,提出一种强化文本关联语义和多特征提取的重复缺陷报告检测模型。引入自注意力机制捕获缺陷报告文本序列内部的语义关联性,从而动态计算上下文语义向量进行... 针对重复缺陷报告检测研究中存在语义长距离依赖以及缺陷报告特征的单一性问题,提出一种强化文本关联语义和多特征提取的重复缺陷报告检测模型。引入自注意力机制捕获缺陷报告文本序列内部的语义关联性,从而动态计算上下文语义向量进行语义分析,解决长距离依赖问题;利用隐含狄利克雷分布算法捕获缺陷报告文本的主题特征,同时针对缺陷报告的类别信息,构建一种特征提取网络计算类别差异特征;最后基于3类特征向量进行综合检测。实验结果表明,该模型实现了更优的检测性能。 展开更多
关键词 重复缺陷报告检测 长距离依赖 自注意力机制 语义分析 多特征提取
下载PDF
基于依存树库的朝鲜语依存距离研究
9
作者 华英楠 毕玉德 《外语学刊》 CSSCI 北大核心 2022年第6期55-65,共11页
依存语法框架下的依存距离是衡量句法分析难度的重要指标。本文基于SUD-Korean依存树库对朝鲜语依存距离的分布及影响朝鲜语依存距离均值的因素进行分析研究。研究发现,朝鲜语依存距离分布符合幂律分布和指数分布的混合模型;句长、长距... 依存语法框架下的依存距离是衡量句法分析难度的重要指标。本文基于SUD-Korean依存树库对朝鲜语依存距离的分布及影响朝鲜语依存距离均值的因素进行分析研究。研究发现,朝鲜语依存距离分布符合幂律分布和指数分布的混合模型;句长、长距离依存关系、依存方向均能对依存距离均值产生重要影响。该研究结果有助于从依存语法的角度揭示朝鲜语的句法特点和规律,为提出更科学合理的依存句法分析算法提供语言学支撑。 展开更多
关键词 朝鲜语 依存树库 依存距离 长距离依存关系 依存方向
原文传递
基于双路信息时空图卷积网络的交通预测模型 被引量:3
10
作者 康雁 谢思宇 +4 位作者 王飞 寇勇奇 徐玉龙 吴志伟 李浩 《计算机科学》 CSCD 北大核心 2021年第S02期46-51,62,共7页
随着深度学习的发展,神经网络在各个领域都有着大量的应用,智慧交通系统也不例外。交通流预测是智慧交通系统的基石,是整个交通预测的核心所在。近年来,图卷积神经网络的利用有效地提高了交通预测的性能,如何进一步提高对图的时空特征... 随着深度学习的发展,神经网络在各个领域都有着大量的应用,智慧交通系统也不例外。交通流预测是智慧交通系统的基石,是整个交通预测的核心所在。近年来,图卷积神经网络的利用有效地提高了交通预测的性能,如何进一步提高对图的时空特征进行捕获的能力,将会成为热点。为了提升交通预测的精度,提出了一种基于双路信息时空图卷积网络的交通预测模型。首先,针对图卷积网络的交通预测模型在长距离依赖上建模有所不足,并且没有完全挖掘时空图信息之间的隐藏关系以及在时空图结构上还有信息缺失,提出了一种三重池化注意力机制来建模全局上下文信息。通过对图卷积层和时间卷积层各增加并行的三重池化注意力路径,构造了一个双路信息时空卷积层,提升了卷积层的泛化能力及模型捕获长距离依赖的能力,同时让时空卷积层能够很好地捕获时空图结构上的空间和时间特征,从而有效地提升了交通预测性能。在两个公共交通数据集(METR-LA和PEMS-BAY)上的实验结果表明,该模型具有较好的性能。 展开更多
关键词 交通预测 图卷积神经网络 全局上下文建模 长距离依赖
下载PDF
NLTV:非局部数字全变差滤波算法 被引量:2
11
作者 肖亮 韦志辉 吴慧中 《中国图象图形学报》 CSCD 北大核心 2010年第9期1318-1325,共8页
在图像平滑处理过程中,如何设计保持图像边缘和纹理细节的数字图像去噪滤波器一直是人们关注的热点问题。本文在统一描述数字全变差滤波算法(DTV)和数字双边全变差算法(DBTV)的滤波机制的基础上,利用图像像素间的近-远程相关性,分别定... 在图像平滑处理过程中,如何设计保持图像边缘和纹理细节的数字图像去噪滤波器一直是人们关注的热点问题。本文在统一描述数字全变差滤波算法(DTV)和数字双边全变差算法(DBTV)的滤波机制的基础上,利用图像像素间的近-远程相关性,分别定义近程相关性和远程相关性两个度量,建立了一种非局部图像滤波自适应双边加权机制,提出一种同时适合高斯噪声和脉冲噪声的非局部数字全变差滤波算法(NLTV)。实验验证了新算法在抑制噪声的同时具有较好的边缘细节和纹理保持性能。 展开更多
关键词 图像去噪 近程相关 远程相关 非局部滤波 全变差
原文传递
2D Correlative-Chain Conditional Random Fields for Semantic Annotation of Web Objects
12
作者 丁艳辉 李庆忠 +1 位作者 董永权 彭朝晖 《Journal of Computer Science & Technology》 SCIE EI CSCD 2010年第4期761-770,共10页
Semantic annotation of Web objects is a key problem for Web information extraction. The Web contains an abundance of useful semi-structured information about real world objects, and the empirical study shows that stro... Semantic annotation of Web objects is a key problem for Web information extraction. The Web contains an abundance of useful semi-structured information about real world objects, and the empirical study shows that strong two-dimensional sequence characteristics and correlative characteristics exist for Web information about objects of the same type across different Web sites. Conditional Random Fields (CRFs) are the state-of-the-art approaches taking the sequence characteristics to do better labeling. However, as the appearance of correlative characteristics between Web object elements, previous CRFs have their limitations for semantic annotation of Web objects and cannot deal with the long distance dependencies between Web object elements efficiently. To better incorporate the long distance dependencies, on one hand, this paper describes long distance dependencies by correlative edges, which are built by making good use of structured information and the characteristics of records from external databases; and on the other hand, this paper presents a two-dimensional Correlative-Chain Conditional Random Fields (2DCC-CRFs) to do semantic annotation of Web objects. This approach extends a classic model, two-dimensional Conditional Random Fields (2DCRFs), by adding correlative edges. Experimental results using a large number of real-world data collected from diverse domains show that the proposed approach can significantly improve the semantic annotation accuracy of Web objects. 展开更多
关键词 Web information extraction semantic annotation conditional random fields long distance dependencies
原文传递
融合多源数据输入具有自注意力机制的LSTM股票价格预测 被引量:4
13
作者 康瑞雪 牛保宁 +1 位作者 李显 苗雨欣 《小型微型计算机系统》 CSCD 北大核心 2023年第2期326-333,共8页
股票价格预测是金融和计算机学科交叉领域的经典问题,由于股票市场的复杂性和高波动性等特征,及时预测股票价格被认为是最具挑战性的问题之一.长短期记忆(LSTM)神经网络在时间序列预测问题中表现出良好的性能.然而,该模型及其改进模型... 股票价格预测是金融和计算机学科交叉领域的经典问题,由于股票市场的复杂性和高波动性等特征,及时预测股票价格被认为是最具挑战性的问题之一.长短期记忆(LSTM)神经网络在时间序列预测问题中表现出良好的性能.然而,该模型及其改进模型专注于顺序捕获序列信息,在学习输入数据之间非序列性的内部关联方面没有优势.此外,模型在输入数据的融合方面往往并不全面.针对上述问题,提出了融合多源数据、具有自注意力机制的长短期记忆神经网络(SA-LSTM)股票价格预测模型.SA-LSTM模型具有自注意力单元,在学习序列特征时能够快速捕获长距离依赖关系,有效学习数据之间的相关性.在多源数据的融合方面,同时融合与目标股票直接间接相关的数据,解决输入数据不全面的问题.通过对股票次日收盘价预测的实验表明,与其他基准预测模型相比,该模型取得了最佳性能,在不同数据集上均具有最小预测误差. 展开更多
关键词 股票价格预测 长短期记忆神经网络 自注意力机制 多源数据 长距离依赖
下载PDF
采用长距离依赖和多尺度表达的轻量化车辆检测 被引量:2
14
作者 荆修平 田莹 《光学精密工程》 EI CAS CSCD 北大核心 2023年第6期950-961,共12页
基于深度学习的车辆检测在众多领域发挥着至关重要的作用,是近年来计算机视觉的一个重要发展方向。车辆轻量化检测包含了对网络结构和计算效率的探索,并在智慧交通等诸多领域都得以广泛应用。然而在诸多场景下存在相机中车辆目标尺度变... 基于深度学习的车辆检测在众多领域发挥着至关重要的作用,是近年来计算机视觉的一个重要发展方向。车辆轻量化检测包含了对网络结构和计算效率的探索,并在智慧交通等诸多领域都得以广泛应用。然而在诸多场景下存在相机中车辆目标尺度变化大、车辆相互遮挡等问题,这些情况会影响到网络检测车辆的精度。针对上述问题,提出改进Yolov5s的车辆检测方法。首先通过视觉注意力网络捕获长距离依赖,对原有特征图施加新的权重,增强自适应性,提升网络的抗遮挡能力;接着在残差模块内部再次构造水平方向残差,在一个模块内部构建相同数量、不同大小感受野的特征图,丰富网络的多尺度表达能力。实验结果表明:改进后的网络在Pascal VOC车辆数据集上提供2.1%mAP性能提升,在MS COCO车辆数据集上提供1.7%mAP性能提升。改进后网络的多尺度表达能力更加出色,且抗遮挡能力更强,与原始网络相比检测结果更具有竞争力。 展开更多
关键词 计算机视觉 车辆检测 轻量化网络 长距离依赖 多尺度表达
下载PDF
用于道路提取的结构特征优化方法
15
作者 廖婧琳 何青 《现代计算机》 2024年第5期31-36,43,共7页
针对以往的遥感道路提取研究中大多忽略了整个输入图像的道路结构特性,对于较为复杂、多道路区域的情况,难以产生完整道路网的问题。首先,设计了一个带状池化模块SPM,用于有效地扩大接收领域的骨干。具体来说,SPM侧重于沿着水平或垂直... 针对以往的遥感道路提取研究中大多忽略了整个输入图像的道路结构特性,对于较为复杂、多道路区域的情况,难以产生完整道路网的问题。首先,设计了一个带状池化模块SPM,用于有效地扩大接收领域的骨干。具体来说,SPM侧重于沿着水平或垂直空间维度编码长距离上下文,并对汇集的映射中的每个空间位置的全局水平和垂直信息进行编码,实现了捕获长距离空间依赖性和利用通道间依赖性的能力的提升。考虑到道路尺度的多样性,提出级联的多尺度注意增强模块(CMSAE),利用多尺度特征上的空间注意剩余块来捕获长距离依赖,并引入信道注意层来优化多尺度特征融合,目的是解决现有方法中道路提取不连续和锯齿状边界识别的问题,并聚合连续道路的空间细节和语义信息。经实验验证和多种算法进行比较,所提方法相较于U-Net网络在Precision、Recall、IoU、ACC四个指标上分别提升了3.05、2.12、3.43、1.85个百分点,均优于对比算法,证明了该方法在改善道路提取任务中不连续问题的有效性。 展开更多
关键词 道路提取 带状池化 多尺度特征 长距离依赖 U-Net
下载PDF
基于上下文特征融合的代码漏洞检测方法 被引量:2
16
作者 徐泽鑫 段立娟 +1 位作者 王文健 恩擎 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2022年第11期2260-2270,共11页
针对现有代码漏洞检测方法误报率和漏报率较高的问题,提出基于上下文特征融合的代码漏洞检测方法.该方法将代码特征解耦分为代码块局部特征和上下文全局特征.代码块局部特征关注代码块中关键词的语义及其短距离依赖关系.将局部特征融合... 针对现有代码漏洞检测方法误报率和漏报率较高的问题,提出基于上下文特征融合的代码漏洞检测方法.该方法将代码特征解耦分为代码块局部特征和上下文全局特征.代码块局部特征关注代码块中关键词的语义及其短距离依赖关系.将局部特征融合得到上下文全局特征从而捕捉代码行上下文长距离依赖关系.该方法通过局部信息与全局信息协同学习,提升了模型的特征学习能力.模型精确地挖掘出代码漏洞的编程模式,增加了代码漏洞对比映射模块,拉大了正负样本在嵌入空间中的距离,促使对正负样本进行准确地区分.实验结果表明,在9个软件源代码混合的真实数据集上的精确率最大提升了29%,召回率最大提升了16%. 展开更多
关键词 代码漏洞检测 代码块局部特征提取 上下文全局特征融合 短距离依赖 长距离依赖
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部