期刊文献+
共找到33篇文章
< 1 2 >
每页显示 20 50 100
基于频域信息的深度伪造检测算法
1
作者 蒲文博 胡靖 《成都信息工程大学学报》 2022年第5期508-514,共7页
深度伪造技术作为人脸窜改技术的一种,由它合成的换脸视频已经对隐私安全带来了巨大的隐患。现存的深度伪造检测方法通常基于传统的卷积神经网络提取合成视频中空间域的不连续信息,以判断是否为深度伪造视频。随着深度伪造技术的迭代,... 深度伪造技术作为人脸窜改技术的一种,由它合成的换脸视频已经对隐私安全带来了巨大的隐患。现存的深度伪造检测方法通常基于传统的卷积神经网络提取合成视频中空间域的不连续信息,以判断是否为深度伪造视频。随着深度伪造技术的迭代,传统检测方法精度难以取得显著提升。与传统方法不同,文本将合成视频帧进行离散余弦变换,获得视频帧图像的频域表示,使用残差卷积网络学习频域特征,并通过双向LSTM提取帧间不连续信息,从而检测视频帧是否伪造。此外,针对深度伪造数据提出了一种新的数据增强方法Xray-blur,降低换脸视频的空间域不连续性,从而提升训练难度,加强模型对不连续信息的捕获能力。实验表明,该方法在公开数据集Celeb-DF和FaceForensics++上取得了优秀的准确率(ACC)和ROC曲线下面积(AUC),且在面对低质量视频时,具有更好的鲁棒性。 展开更多
关键词 深度伪造检测 频域学习 时序学习
下载PDF
基于多维时空层递的交通信号分布式强化学习方法
2
作者 王福建 范诚睿 +2 位作者 周斌 封春房 马东方 《中国公路学报》 EI CAS CSCD 北大核心 2024年第7期250-263,共14页
信号控制是智能交通系统的重要组成部分,融合人工智能等新技术的信号优化逐渐成为研究热点,具体策略可分为集中式和分布式2类。分布式控制的轻量化状态空间可以有效避免深度强化学习中的维度灾难问题,近年来愈发受到研究者关注。现有的... 信号控制是智能交通系统的重要组成部分,融合人工智能等新技术的信号优化逐渐成为研究热点,具体策略可分为集中式和分布式2类。分布式控制的轻量化状态空间可以有效避免深度强化学习中的维度灾难问题,近年来愈发受到研究者关注。现有的分布式协同控制策略多以图卷积网络或图注意力网络为基础挖掘路口的耦合关系,但对路口状态之间的时空关联性随时变交通流的动态变化特征考虑不足。为此,首先基于门控循环神经网络建立时变交通流特征的提取方法,确定多路口时空关联度;其次采用图注意力机制搭建区域时空特征的层递融合算法,以路口重要度为指标实现状态空间重构;再次,采用全连接理念面向自适应相位相序结构构造路口通行权切换决策模型。最后,基于实际路网仿真测试了模型控制效果。结果表明:相比于传统分布式强化学习算法,该模型在低、中、高3种流量下的车辆平均排队长度分别降低了13.74%、5.03%、6.30%以上,表明了新方法的潜在应用价值。 展开更多
关键词 交通工程 智能交通 深度强化学习 信号控制 多角度时空学习 层递学习
原文传递
平均报酬模型的多步强化学习算法 被引量:4
3
作者 胡光华 吴沧浦 《控制理论与应用》 EI CAS CSCD 北大核心 2000年第5期660-664,共5页
讨论模型未知的平均报酬强化学习算法 .通过结合即时差分学习与R学习算法 ,将折扣问题中的一些方法推广到了平均准则问题中 ,提出了两类算法 :R(λ)学习与截断即时差分TTD(λ)学习 .现有的R学习可视为R(λ)学习和TTD(λ)学习当λ=0时的... 讨论模型未知的平均报酬强化学习算法 .通过结合即时差分学习与R学习算法 ,将折扣问题中的一些方法推广到了平均准则问题中 ,提出了两类算法 :R(λ)学习与截断即时差分TTD(λ)学习 .现有的R学习可视为R(λ)学习和TTD(λ)学习当λ=0时的一个特例 .仿真结果表明 ,λ取中间值的R(λ)和TTD(λ)学习比现有的方法在可靠性与收敛速度上均有提高 . 展开更多
关键词 R学习 强化学习算法 平均报酬模型 机器学习
下载PDF
基于过完备字典稀疏表示的多通道脑电信号压缩感知联合重构 被引量:11
4
作者 吴建宁 徐海东 王珏 《电子与信息学报》 EI CSCD 北大核心 2016年第7期1666-1673,共8页
该文基于多通道脑电信号时空特性构建非正交变换过完备字典,准确稀疏表示蕴含时空相关性信息的多通道脑电信号,提高基于时空稀疏贝叶斯学习模型的多通道脑电信号压缩感知联合重构算法性能。实验选用eegmmidb脑电数据库的多通道脑电信号... 该文基于多通道脑电信号时空特性构建非正交变换过完备字典,准确稀疏表示蕴含时空相关性信息的多通道脑电信号,提高基于时空稀疏贝叶斯学习模型的多通道脑电信号压缩感知联合重构算法性能。实验选用eegmmidb脑电数据库的多通道脑电信号验证所提算法有效性。结果表明,基于过完备字典稀疏表示的多通道脑电信号,能够为多通道脑电信号压缩感知重构算法提供更多的时空相关性信息,比传统多通道脑电信号压缩感知重构算法所得的信噪比值提高近12 d B,重构时间减少0.75 s,显著提高多通道脑电信号联合重构性能。 展开更多
关键词 脑电信号稀疏表示 过完备字典 联合重构 时空稀疏贝叶斯学习 压缩感知
下载PDF
An Adaptive Strategy via Reinforcement Learning for the Prisoner's Dilemma Game 被引量:8
5
作者 Lei Xue Changyin Sun +2 位作者 Donald Wunsch Yingjiang Zhou Fang Yu 《IEEE/CAA Journal of Automatica Sinica》 SCIE EI CSCD 2018年第1期301-310,共10页
The iterated prisoner's dilemma(IPD) is an ideal model for analyzing interactions between agents in complex networks. It has attracted wide interest in the development of novel strategies since the success of tit-... The iterated prisoner's dilemma(IPD) is an ideal model for analyzing interactions between agents in complex networks. It has attracted wide interest in the development of novel strategies since the success of tit-for-tat in Axelrod's tournament. This paper studies a new adaptive strategy of IPD in different complex networks, where agents can learn and adapt their strategies through reinforcement learning method. A temporal difference learning method is applied for designing the adaptive strategy to optimize the decision making process of the agents. Previous studies indicated that mutual cooperation is hard to emerge in the IPD. Therefore, three examples which based on square lattice network and scale-free network are provided to show two features of the adaptive strategy. First, the mutual cooperation can be achieved by the group with adaptive agents under scale-free network, and once evolution has converged mutual cooperation, it is unlikely to shift. Secondly, the adaptive strategy can earn a better payoff compared with other strategies in the square network. The analytical properties are discussed for verifying evolutionary stability of the adaptive strategy. 展开更多
关键词 Complex network prisoner’s dilemma reinforcement learning temporal differences learning
下载PDF
基于SARSA(λ)的实时交通信号控制模型 被引量:8
6
作者 戈军 周莲英 《计算机工程与应用》 CSCD 北大核心 2015年第24期244-248,共5页
针对现有交通灯控制器缺乏过去经验的学习能力,导致其无法适应实际交通环境的动态变化,提出了一种基于SARSA(λ)的实时交通信号控制模型,并给出了一种交通信号优化模型及算法,该模型采用强化学习算法,得出交通控制的最优调度策略。仿真... 针对现有交通灯控制器缺乏过去经验的学习能力,导致其无法适应实际交通环境的动态变化,提出了一种基于SARSA(λ)的实时交通信号控制模型,并给出了一种交通信号优化模型及算法,该模型采用强化学习算法,得出交通控制的最优调度策略。仿真实验结果表明,所提模型优于现有交通控制模型,能更好地促进实时动态交通控制实现。 展开更多
关键词 状态-动作-回报-状态-动作 实时交通信号控制 强化学习 交通评价指标 时序差分学习
下载PDF
跨视图时序对比学习的自监督视频表征算法
7
作者 王露露 徐增敏 +2 位作者 张雪莲 蒙儒省 卢涛 《计算机工程与应用》 CSCD 北大核心 2024年第18期158-166,共9页
现有的自监督表征算法主要关注视频帧之间的短期运动特性,但是帧间动作序列的变化幅度较小,而且单视图数据因语义受限影响深度特征表达能力,视频动作中丰富的多视图信息未被充分利用。为此提出基于跨视图语义一致性的时序对比学习算法,... 现有的自监督表征算法主要关注视频帧之间的短期运动特性,但是帧间动作序列的变化幅度较小,而且单视图数据因语义受限影响深度特征表达能力,视频动作中丰富的多视图信息未被充分利用。为此提出基于跨视图语义一致性的时序对比学习算法,自监督学习RGB帧和光流场两种数据中蕴含的动作时序变化特性,主要思路为:设计局部时序对比学习方法,采用不同正负样本划分策略,挖掘同一实例不重叠片段之间的时序相关性和判别可分性,增强细粒度特征表达能力;研究全局对比学习方法,通过跨视图语义协同训练来增加正样本,学习多实例不同视图的语义一致性,提高模型的泛化能力。通过两个下游任务对模型效果进行评估,在UCF101和HMDB51数据集的实验结果表明,所提方法在动作识别和视频检索任务上,较前沿主流方法平均提升了2~3.5个百分点。 展开更多
关键词 自监督学习 视频表征学习 时序对比学习 局部对比学习 跨视图协同
下载PDF
基于强化学习的车辆路径规划问题研究 被引量:7
8
作者 刘虹庆 王世民 《计算机应用与软件》 北大核心 2021年第8期303-308,共6页
从机器学习的角度理解,车辆路径规划问题(VRP)可转化为单代理有限状态空间的强化学习问题进行研究。针对小规模VRP问题,提出时间差分模型,使用Sarsa和Q-learning算法进行优化。针对大规模VRP问题,构建环境模型,通过蒙特卡洛法优化代理... 从机器学习的角度理解,车辆路径规划问题(VRP)可转化为单代理有限状态空间的强化学习问题进行研究。针对小规模VRP问题,提出时间差分模型,使用Sarsa和Q-learning算法进行优化。针对大规模VRP问题,构建环境模型,通过蒙特卡洛法优化代理策略和值函数。在公开数据集上的实验结果表明,强化学习能有效求解小规模VRP问题,并在大规模VRP问题上超过一般的启发式算法。 展开更多
关键词 车辆路径规划 强化学习 时间差分法 蒙特卡洛法 启发式算法
下载PDF
ST-WaveMLP:面向交通流量预测的时空全局感知网络模型
9
作者 包锴楠 张钧波 +1 位作者 宋礼 李天瑞 《计算机科学》 CSCD 北大核心 2024年第5期27-34,共8页
交通流量预测在智能交通系统中起着至关重要的作用。精准的交通流量预测不仅能帮助城市管理者进行更好的交通管理,也能帮助人们制定合适的出行计划。然而精准预测交通流量颇具挑战性,主要难点在于如何捕获交通流量数据中复杂的时空依赖... 交通流量预测在智能交通系统中起着至关重要的作用。精准的交通流量预测不仅能帮助城市管理者进行更好的交通管理,也能帮助人们制定合适的出行计划。然而精准预测交通流量颇具挑战性,主要难点在于如何捕获交通流量数据中复杂的时空依赖性。近年来,深度学习方法已被成功应用于网格交通流量预测,主要采用深度卷积神经网络来捕获时空依赖性。但是卷积神经网络主要关注数据中空间特征的提取与整合,难以充分挖掘其中复杂的时空依赖性,而且单层卷积网络只能捕获局部空间依赖,因此,要想捕获全局空间依赖就需要对超多层的卷积网络进行堆叠,这将使整个网络模型训练收敛速度变慢。为了解决些问题,提出了一种面向交通流量预测的全局感知时空网络模型ST-WaveMLP,主要使用以多层感知机(MLP)为基础的可重复结构ST-WaveBlock来捕获相关的时空依赖。ST-WaveBlock中包含了捕获全局空间依赖和局部时间依赖的模块(SGAC),以及用于捕获局部空间依赖和全局时间依赖的模块(SLAC)。ST-WaveBlock具有较强的时空表征学习能力,通常仅用2~4个ST-WaveBlock堆叠就能有效捕获数据中的时空依赖性。最后,在4个实际交通流量数据集上进行实验验证,结果表明ST-WaveMLP具有更好的收敛性以及更高的预测精度,相较于之前最好的方法,所提方法预测精度的提升最高可达9.57%,模型收敛速度的提升最高可达30.6%。 展开更多
关键词 交通流量预测 时空依赖性 时空深度学习 时空数据挖掘
下载PDF
基于时空层级查询的指代视频目标分割
10
作者 兰猛 张乐飞 +1 位作者 杜博 张良培 《中国科学:信息科学》 CSCD 北大核心 2024年第3期674-691,共18页
本文针对当前指代视频目标分割方法缺乏目标时空一致性建模和目标时空表征学习不足等问题,进行了深入的研究,提出了基于时空层级查询的指代视频目标分割方法(STHQ).本文将指代视频目标分割看作基于查询的序列预测问题,并提出两级查询机... 本文针对当前指代视频目标分割方法缺乏目标时空一致性建模和目标时空表征学习不足等问题,进行了深入的研究,提出了基于时空层级查询的指代视频目标分割方法(STHQ).本文将指代视频目标分割看作基于查询的序列预测问题,并提出两级查询机制进行目标的时空一致性建模和时空特征学习.在第1阶段,本文提出了帧级空间信息提取模块,该模块使用语言特征作为查询独立地和视频序列中的每一帧在空间维度进行信息交互,生成包含目标空间信息的实例嵌入;在第2阶段,本文提出时空信息聚合模块,该模块使用视频级的可学习查询嵌入和第1阶段生成的实例嵌入在时空维度进行信息交互,生成具有时空表征信息的视频级实例嵌入;最后,视频级实例嵌入线性变换为条件卷积参数,并和视频序列中的每一帧进行卷积操作,生成目标的掩码预测序列.在该领域的3个基准数据集上的实验结果表明,本文提出的STHQ方法超越了现有的方法,实现了最佳的性能. 展开更多
关键词 指代视频目标分割 时空一致性建模 时空特征学习 跨模态特征交互 TRANSFORMER
原文传递
神经元动态规划综述 被引量:2
11
作者 金辉宇 于海斌 《信息与控制》 CSCD 北大核心 2001年第4期343-347,351,共6页
神经元动态规划是近年发展起来的一种优化方法 .它采用计算机仿真和函数近似 ,简化对状态空间的搜索 ,可以有效克服“维数危机” ,有广阔的应用前景 .本文对神经元动态规划作一综述 。
关键词 动态规划 神经元动态规划 计算机仿真
下载PDF
基于时空特征自适应融合网络的加密流量分类方法
12
作者 陈拓 石浩 +1 位作者 李翔杰 吴能光 《中南民族大学学报(自然科学版)》 CAS 2024年第3期384-392,共9页
加密流量数据包之间具有明显的时序特征,现有方法很难提取出流量数据中隐含的时序特征,未能将时序特征与空间特征有效地融合,公开数据集大都存在类间样本不平衡的问题,给加密流量的准确分类带来巨大挑战.针对上述问题,提出了一种包含时... 加密流量数据包之间具有明显的时序特征,现有方法很难提取出流量数据中隐含的时序特征,未能将时序特征与空间特征有效地融合,公开数据集大都存在类间样本不平衡的问题,给加密流量的准确分类带来巨大挑战.针对上述问题,提出了一种包含时空特征提取模块和难样本学习模块的卷积神经网络模型.时空特征提取模块先利用不同维度的卷积核来同步学习流量数据包序列中的时序和空间特征,再利用自适应加权融合策略将提取到的时空特征进行有效融合;难样本学习模块使用焦点函数让模型在训练过程中更偏向对困难样本的学习,进一步均衡不同类别的分类效果.实验结果表明:上述方法在ISCX VPN-nonVPN2016数据集和USTC-TFC2016数据集上的分类准确率分别达到了99.38%和99.46%,对不同类别流量分类结果的F1评价指标分别为99.04%和99.31%,与当前同类方法相比具有更优秀的识别性能. 展开更多
关键词 网络安全 加密流量分类 时空特征学习 融合策略
下载PDF
STCTN:一种基于时域偏倚校正与空域因果传递的时空因果表示学习方法 被引量:1
13
作者 邓攀 刘俊廷 +4 位作者 王晓 贾晓丰 赵宇 汪慕澜 戴星原 《计算机学报》 EI CAS CSCD 北大核心 2023年第12期2535-2550,共16页
从时空数据中有效地提取特征表示是时空数据挖掘的基础.现有时空表示学习方法过于关注时空序列中的统计相关性,易受虚假相关性的影响,难以提取无偏、鲁棒的特征表示.本文基于结构因果模型建模时空数据的生成过程,分析观测数据中虚假相... 从时空数据中有效地提取特征表示是时空数据挖掘的基础.现有时空表示学习方法过于关注时空序列中的统计相关性,易受虚假相关性的影响,难以提取无偏、鲁棒的特征表示.本文基于结构因果模型建模时空数据的生成过程,分析观测数据中虚假相关性的成因,提出了一种基于时域偏倚校正与空域因果传递的时空因果表示学习方法.首先基于后门调整消除时域的虚假相关性,然后构建因果传递网络消除空域的虚假相关性,最后利用下游特征解码器将因果特征表示应用于下游任务中.在两个真实数据集上的实验表明,本文所提时空表示学习方法有效避免了虚假相关性的干扰,增强了模型的稳定性,使其在两个下游预测任务中对数据稀疏节点的预测误差分别降低了3%和10%. 展开更多
关键词 时空表示学习 结构因果模型 虚假相关性 后门调整 因果关系
下载PDF
时空域上下文学习的视频多帧质量增强方法 被引量:4
14
作者 佟骏超 吴熙林 丁丹丹 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2019年第12期2506-2513,共8页
卷积神经网络(CNN)在视频增强方向取得了巨大的成功。现有的视频增强方法主要在空域探索图像内像素的相关性,忽略了连续帧之间的时域相似性。针对上述问题,提出一种基于时空域上下文学习的多帧质量增强方法(STMVE),即利用当前帧以及相... 卷积神经网络(CNN)在视频增强方向取得了巨大的成功。现有的视频增强方法主要在空域探索图像内像素的相关性,忽略了连续帧之间的时域相似性。针对上述问题,提出一种基于时空域上下文学习的多帧质量增强方法(STMVE),即利用当前帧以及相邻多帧图像共同增强当前帧的质量。首先根据时域多帧图像直接预测得到当前帧的预测帧,然后利用预测帧对当前帧进行增强。其中,预测帧通过自适应可分离的卷积神经网络(ASCNN)得到;在后续增强中,设计了一种多帧卷积神经网络(MFCNN),利用早期融合架构来挖掘当前帧及其预测帧的时空域相关性,最终得到增强的当前帧。实验结果表明,所提出的STMVE方法在量化参数值37、32、27、22上,相对于H.265/HEVC,分别获得0.47、0.43、0.38、0.28 dB的性能增益;与多帧质量增强(MFQE)方法相比,平均获得0.17 dB的增益。 展开更多
关键词 时空域上下文学习 多帧质量增强(MFQE) 卷积神经网络(CNN) 残差学习 预测帧
下载PDF
类型增强的时态知识图谱表示学习模型
15
作者 何鹏 周刚 +2 位作者 陈静 章梦礼 宁原隆 《计算机研究与发展》 EI CSCD 北大核心 2023年第4期916-929,共14页
知识图谱表示学习旨在将知识图谱中的元素(实体和关系)表示在低维的连续向量空间中,可以有效地实现知识图谱补全并提高计算效率,是贯穿知识图谱构建和应用全过程的重要问题.现有的知识图谱表示学习模型大多基于静态的结构化三元组,忽略... 知识图谱表示学习旨在将知识图谱中的元素(实体和关系)表示在低维的连续向量空间中,可以有效地实现知识图谱补全并提高计算效率,是贯穿知识图谱构建和应用全过程的重要问题.现有的知识图谱表示学习模型大多基于静态的结构化三元组,忽略了知识的时间动态性和实体的类型特征,限制了它们在知识图谱补全和语义计算中的表现.针对这一问题,提出一种类型增强的时态知识图谱表示学习模型(type-enhanced temporal knowledge graph representation learning model,T-Temp),基于经典的张量分解技术,将不同形式的时间信息显式融合到知识图谱表示学习过程中.同时,利用实体与关系间的类型兼容性,充分挖掘隐含在实体中的类型特征,进一步提升表示学习的准确性.此外,证明T-Temp模型具有完全表达性,且与同类模型相比,具有较低的时空复杂度.在多个真实的时态知识图谱上进行的详细实验说明了T-Temp模型的有效性和先进性. 展开更多
关键词 知识图谱 时态知识图谱 知识图谱补全 时态知识图谱表示学习 知识图谱嵌入
下载PDF
面向机器博弈的即时差分学习研究 被引量:4
16
作者 徐长明 马宗民 +1 位作者 徐心和 李新星 《计算机科学》 CSCD 北大核心 2010年第8期219-223,共5页
以六子棋机器博弈为应用背景,实现了基于即时差分学习的估值函数权值调整自动化。提出了一种新的估值函数设计方案,解决了先验知识与多层神经元网络结合的问题。结合具体应用对象的特性,提出了对即时差分序列进行选择性学习的方法,在一... 以六子棋机器博弈为应用背景,实现了基于即时差分学习的估值函数权值调整自动化。提出了一种新的估值函数设计方案,解决了先验知识与多层神经元网络结合的问题。结合具体应用对象的特性,提出了对即时差分序列进行选择性学习的方法,在一定程度上避免了无用状态的干扰。经过10020盘的自学习训练,与同一个程序对弈,其胜率提高了8%左右,具有良好的效果。 展开更多
关键词 机器博弈 即时差分学习 六子棋
下载PDF
基于独立子空间分析特征学习的表情识别 被引量:3
17
作者 詹永杰 龙飞 卜轶坤 《系统仿真学报》 CAS CSCD 北大核心 2015年第10期2316-2319 2327,2327,共5页
手工设计的特征(如Gabor、LBP等)在表情识别中得到了广泛的应用。独立子空间分析是一种无监督特征学习方法,可从图像中学习出具有相位不变的特征。在表情识别应用中,由于复杂背景的影响以及人脸对齐方法的局限性,很难得到精确对齐的人... 手工设计的特征(如Gabor、LBP等)在表情识别中得到了广泛的应用。独立子空间分析是一种无监督特征学习方法,可从图像中学习出具有相位不变的特征。在表情识别应用中,由于复杂背景的影响以及人脸对齐方法的局限性,很难得到精确对齐的人脸图像序列。研究了在非精确对齐情况下,基于独立子空间分析的表情识别问题。通过分析不同子空间尺寸下的表情识别效果发现,在非精确对齐情况下,选择合适的子空间尺寸能提升学到的特征对表情识别的鲁棒性。 展开更多
关键词 表情识别 独立子空间分析 无监督特征学习 时空特征学习
下载PDF
Computational Intelligence and Games:Challenges and Opportunities 被引量:1
18
作者 Simon M.Lucas 《International Journal of Automation and computing》 EI 2008年第1期45-57,共13页
The last few decades have seen a phenomenal increase in the quality, diversity and pervasiveness of computer games. The worldwide computer games market is estimated to be worth around USD 21bn annually, and is predict... The last few decades have seen a phenomenal increase in the quality, diversity and pervasiveness of computer games. The worldwide computer games market is estimated to be worth around USD 21bn annually, and is predicted to continue to grow rapidly. This paper reviews some of the recent developments in applying computational intelligence (CI) methods to games, points out some of the potential pitfalls, and suggests some fruitful directions for future research. 展开更多
关键词 GAMES machine learning EVOLUTION temporal difference learning (TDL) neural networks n-tuple systems
下载PDF
Deep Learning for Real-Time Crime Forecasting and Its Ternarization 被引量:2
19
作者 Bao WANG Penghang YIN +3 位作者 Andrea Louise BERTOZZI P.Jeffrey BRANTINGHAM Stanley Joel OSHER Jack XIN 《Chinese Annals of Mathematics,Series B》 SCIE CSCD 2019年第6期949-966,共18页
Real-time crime forecasting is important.However,accurate prediction of when and where the next crime will happen is difficult.No known physical model provides a reasonable approximation to such a complex system.Histo... Real-time crime forecasting is important.However,accurate prediction of when and where the next crime will happen is difficult.No known physical model provides a reasonable approximation to such a complex system.Historical crime data are sparse in both space and time and the signal of interests is weak.In this work,the authors first present a proper representation of crime data.The authors then adapt the spatial temporal residual network on the well represented data to predict the distribution of crime in Los Angeles at the scale of hours in neighborhood-sized parcels.These experiments as well as comparisons with several existing approaches to prediction demonstrate the superiority of the proposed model in terms of accuracy.Finally,the authors present a ternarization technique to address the resource consumption issue for its deployment in real world.This work is an extension of our short conference proceeding paper[Wang,B.,Zhang,D.,Zhang,D.H.,et al.,Deep learning for real time Crime forecasting,2017,ar Xiv:1707.03340]. 展开更多
关键词 Crime representation Spatial-temporal deep learning Real-time forecasting Ternarization
原文传递
平均准则问题的即时差分学习算法 被引量:2
20
作者 胡光华 吴沧浦 《自动化学报》 EI CSCD 北大核心 2000年第4期533-536,共4页
考虑平均准则随机动态规划 (SDP)问题的一族在线即时差分 (TD)学习算法 .在学习中 ,平均问题的相对值函数是控制器所要学习的目标函数 .所提出的算法是已有的 TD(λ)算法及 R-学习算法的一种推广 .
关键词 即时差分学习算法 动态规划 平均准则问题
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部