期刊文献+
共找到40篇文章
< 1 2 >
每页显示 20 50 100
基于时间感知Transformer的交通流预测方法 被引量:3
1
作者 刘起东 刘超越 +4 位作者 邱紫鑫 高志敏 郭帅 刘冀钊 符明晟 《计算机科学》 CSCD 北大核心 2023年第11期88-96,共9页
作为智能交通系统的关键一环,交通流预测面临着长时预测不准的难题,其主要挑战在于交通流数据本身具有复杂的时空关联。近年来,Transformer的提出使得时序数据预测的研究取得了巨大进展,但将Transformer应用于交通流预测仍然存在以下两... 作为智能交通系统的关键一环,交通流预测面临着长时预测不准的难题,其主要挑战在于交通流数据本身具有复杂的时空关联。近年来,Transformer的提出使得时序数据预测的研究取得了巨大进展,但将Transformer应用于交通流预测仍然存在以下两个问题:1)静态的注意力机制难以捕获交通流随时间动态变化的时空依赖关系;2)采用自回归的预测方式会引发严重的误差累积现象。针对以上问题,提出了一种基于时间感知Transformer的交通流预测模型。首先,设计了一种新的时间感知注意力机制,可以根据时间特征定制注意力计算方案,从而更精准地反映时空依赖关系;其次,在Transformer的训练阶段舍弃了Teacher Forcing机制,并采用非自回归的预测方式来避免误差累积问题;最后,在两个真实交通数据集上进行实验,实验结果表明,所提方法可以有效捕获交通流的时空依赖,相比最优的基线方法,长时预测性能提升了2.09%~4.01%。 展开更多
关键词 交通流预测 时空建模 时间感知注意力机制 非自回归 TRANSFORMER
下载PDF
面向DCU的LDS访存向量化优化 被引量:1
2
作者 杨思驰 赵荣彩 +1 位作者 韩林 王洪生 《计算机工程》 CAS CSCD 北大核心 2024年第2期206-213,共8页
在深度计算器(DCU)中,本地数据共享(LDS)是相较于全局内存延迟更低、带宽更高的关键存储部件。随着异构程序对LDS的使用越来越频繁,LDS访存效率低下成为限制异构程序性能的重要因素。此外,LDS访问过程中存在bank冲突的特性,使LDS的访问... 在深度计算器(DCU)中,本地数据共享(LDS)是相较于全局内存延迟更低、带宽更高的关键存储部件。随着异构程序对LDS的使用越来越频繁,LDS访存效率低下成为限制异构程序性能的重要因素。此外,LDS访问过程中存在bank冲突的特性,使LDS的访问应遵循一定原则才能高效利用,当线程间的数据访问呈现重叠的访存特征时,访问向量化指令会因此产生延迟。针对此问题,提出面向DCU的LDS访存向量化优化方法。通过实现连续数据访问的向量化,减少LDS的访问次数,降低访存耗时,由此提高程序访存效率。在此基础上,通过设计访存特征的判断方法,提出能够有效解决数据重叠的LDS访存向量化方法,实现一种面向国产通用加速器的LDS高效访存技术,确保向量化方法对访存效率的有效提升。实验结果表明:在使用LDS的异构程序中,LDS访存向量化实现后程序性能平均提升了22.6%,验证了所提方法的有效性;同时,向量化方法能够实现LDS线程间访存数据重叠问题的优化,使异构程序得到平均30%的性能提升。 展开更多
关键词 深度计算器 本地数据共享 访存向量化 访存特征 bank冲突
下载PDF
航空母舰舰载机弹药保障作业调度优化算法 被引量:2
3
作者 张少辉 刘舜 +5 位作者 李亚飞 金钊 靳远远 王少参 赵建波 徐明亮 《航空学报》 EI CAS CSCD 北大核心 2023年第20期224-241,共18页
针对航空母舰舰载机弹药保障作业高动态、多阶段特性,将柔性流水车间调度方法和群体智能优化理论相结合,提出一种面向舰载机弹药保障作业的调度优化算法。提出将复杂的弹药保障作业调度问题抽象规约为一类考虑工件交货期的柔性流水车间... 针对航空母舰舰载机弹药保障作业高动态、多阶段特性,将柔性流水车间调度方法和群体智能优化理论相结合,提出一种面向舰载机弹药保障作业的调度优化算法。提出将复杂的弹药保障作业调度问题抽象规约为一类考虑工件交货期的柔性流水车间调度问题,引入启发式规则,构建兼顾高效性和可靠性实战要求的弹药保障作业调度数学模型ATSCA。结合弹药保障作业问题特征,设计提出一种基于双层整数编码的贪婪局部搜索遗传算法(GLSGA-DC),改进操作算子和局部搜索算法设计,以最小化弹药保障完成时间为目标对保障模型进行求解。多组仿真结果表明,相比于同类算法,GLSGA-DC算法在Benchmark基准算例和实际弹药转运实例实验中均取得优秀的效果,在求解均值(AVG)、相对偏差(RD)等指标方面均明显占优,验证了ATSCA模型和求解算法在实际弹药保障任务中的有效性和鲁棒性。 展开更多
关键词 舰载机 弹药保障作业 柔性车间调度 调度优化 仿真验证
原文传递
舰载机弹药保障作业调度的形式化建模与验证
4
作者 金钊 金璐 +4 位作者 张博闻 吴庆顺 冯朔 李冠峰 徐明亮 《软件学报》 EI CSCD 北大核心 2024年第9期4100-4122,共23页
航母舰载机弹药保障作业的智能规划作为一种高效能航保作业调度方法,是助推航母工程先进技术建设发展的重要途径之一.高安全攸关属性下作业规划方案的正确性保证已经逐渐成为制约其实际应用部署安全的关键技术瓶颈.针对方案正确性验证... 航母舰载机弹药保障作业的智能规划作为一种高效能航保作业调度方法,是助推航母工程先进技术建设发展的重要途径之一.高安全攸关属性下作业规划方案的正确性保证已经逐渐成为制约其实际应用部署安全的关键技术瓶颈.针对方案正确性验证中存在的弹药保障系统难建模、作业执行行为难描述、形式验证工具难实现等挑战,基于分离逻辑的思想,提出一种弹药保障系统的行为模型,并利用定理证明器Coq对作业规划方案进行形式化验证.首先提出一个符合弹药保障作业特征的序列化双层资源堆模型;基于该模型,构造一套可用于描述作业执行行为的建模语言及其操作语义;最后在Coq中实现一种证明辅助工具.通过几个典型弹药保障作业规划方案的交互式证明实例,验证工具的可用性与工程实用性. 展开更多
关键词 舰载机弹药保障作业 形式化验证 分离逻辑 操作语义 COQ
下载PDF
基于矩阵乘积态的有限纠缠量子傅里叶变换模拟
5
作者 刘晓楠 廉德萌 +1 位作者 杜帅岐 刘正煜 《计算机科学》 CSCD 北大核心 2024年第9期80-86,共7页
与经典计算不同,在量子计算中量子比特可以处于叠加态,多个量子比特之间还可以形成纠缠态。表示n个量子比特组成的量子态需要存储2^(n)个振幅,这种指数级的存储开销使得大规模的量子模拟难以进行。然而当量子态的纠缠程度有限时,使用矩... 与经典计算不同,在量子计算中量子比特可以处于叠加态,多个量子比特之间还可以形成纠缠态。表示n个量子比特组成的量子态需要存储2^(n)个振幅,这种指数级的存储开销使得大规模的量子模拟难以进行。然而当量子态的纠缠程度有限时,使用矩阵乘积态表示量子态仅需要线性的空间复杂度,可以扩大模拟的规模。使用HIP-Clang语言,基于CPU+DCU的异构编程模型,使用矩阵乘积态表示量子态,对量子傅里叶变换进行模拟。结合矩阵乘积态的特点,对量子傅里叶变换线路进行分析,减少模拟实现时不必要的张量缩并运算与正交化构建。对模拟过程中的张量缩并进行分析,使用TTGT算法完成张量缩并运算,同时利用DCU的并行处理能力来提高效率。对模拟结果进行分析,分别通过振幅误差与半经典Draper量子加法器的结果验证了模拟的正确性。对模拟规模进行分析,当量子态的纠缠熵最大时,使用16 GB的内存空间最多只能模拟24位的量子态,而当量子态内部纠缠程度较低时,可以对上百位的量子态进行量子傅里叶变换模拟。 展开更多
关键词 量子模拟 量子傅里叶变换 矩阵乘积态 异构计算 DCU HIP-Clang
下载PDF
基于分阶段自编码器与注意力机制的舰载机着舰航迹实时预测模型
6
作者 李哲 刘奕阳 +3 位作者 王可 杨杰 李亚飞 徐明亮 《计算机科学》 CSCD 北大核心 2024年第9期273-282,共10页
航空母舰舰载机着舰过程中应沿相对固定的航迹下滑,以保证触舰点位于舰艉拦阻系统所在的区域,因此舰载机航迹是着舰信号官进行指挥决策的重要依据之一。舰载机航迹实时预测有助于着舰信号官判断着舰作业发展态势,及时形成正确的航迹纠... 航空母舰舰载机着舰过程中应沿相对固定的航迹下滑,以保证触舰点位于舰艉拦阻系统所在的区域,因此舰载机航迹是着舰信号官进行指挥决策的重要依据之一。舰载机航迹实时预测有助于着舰信号官判断着舰作业发展态势,及时形成正确的航迹纠偏引导指令。为此,提出一种基于分阶段自编码器与注意力机制的着舰航迹实时预测模型。第一阶段采用降噪自编码器对历史航迹数据进行特征提取;第二阶段基于长短期记忆网络构建时序自编码器,同时引入注意力机制对不同时刻的编码器输出分配不同的权重,自适应学习其对最终预测结果的影响强度。通过仿真实验将所提模型与6种基线模型进行对比,结果表明,所提模型的综合性能优于基线模型,能够满足着舰航迹实时准确预测的应用需求。 展开更多
关键词 舰载机着舰 航迹预测 长短期记忆网络 自编码器 注意力机制
下载PDF
基于类注意力的眼睛凝视估计网络
7
作者 徐金龙 董明瑞 +2 位作者 李颖颖 刘艳青 韩林 《计算机科学》 CSCD 北大核心 2024年第10期295-301,共7页
近年来,眼睛凝视估计引起广泛关注。基于RGB外观的凝视估计方法使用普通摄像机和深度学习来进行凝视估计,避免了像商用眼动仪一样使用昂贵的红外设备,为更准确和成本更低的眼睛凝视估计提供了可能。然而,RGB外观图像中包含如光照强度、... 近年来,眼睛凝视估计引起广泛关注。基于RGB外观的凝视估计方法使用普通摄像机和深度学习来进行凝视估计,避免了像商用眼动仪一样使用昂贵的红外设备,为更准确和成本更低的眼睛凝视估计提供了可能。然而,RGB外观图像中包含如光照强度、肤色等多种与凝视无关的特征,这些无关特征会在深度学习回归的过程中产生干扰,进而影响凝视估计的精度。针对以上问题,提出了一种名为类注意力网络(CA-Net)的新架构,它包含通道、尺度、眼睛3种不同的类注意力模块,通过这些类注意力模块可以提取和融合不同种类的注意力编码,从而降低与凝视无关特征所占的权重。在GazeCapture数据集上的大量实验表明,在基于RGB外观的凝视估计方法中,相比现有的最先进方法,CA-Net在手机和平板上分别能够提高约0.6%和7.4%的凝视估计精度。 展开更多
关键词 类注意力 轻压缩激励 自注意力 多尺度 眼睛凝视估计
下载PDF
面向国产超算平台的通用能源管网仿真计算模型
8
作者 韩璞 商建东 +3 位作者 薛飞 谢景明 王洪生 王海 《计算机应用研究》 CSCD 北大核心 2024年第3期866-872,共7页
为实现城市能源管网仿真软件的自主可控,基于国产异构高性能计算机“嵩山”超级计算平台,提出一种通用的城市能源管网仿真计算模型。通过优化管网中“非管”组件模型,提高了计算模型对国产异构并行计算机系统的适配性;将不同管网组件的... 为实现城市能源管网仿真软件的自主可控,基于国产异构高性能计算机“嵩山”超级计算平台,提出一种通用的城市能源管网仿真计算模型。通过优化管网中“非管”组件模型,提高了计算模型对国产异构并行计算机系统的适配性;将不同管网组件的计算过程进行封装,弱化了网络组件在仿真计算过程的依赖性,提升模型在工程实现上的可并行性。供水、燃气和热力三种场景的并行仿真实验,证明了计算模型在解决城市能源供给网络的仿真计算上具有一定的普适性;通过管网实测数据与仿真模型中模拟数据对比结果表明仿真管网压力的误差率在4%以下,其温度的误差率低于2%,同时也说明了提出的管网仿真计算模型在国产超算平台上具有良好的计算通用性。 展开更多
关键词 异构计算 能源管网 仿真模型 流体网络 并行计算
下载PDF
面向FT-M7002的Sobel边缘检测算法优化实现 被引量:5
9
作者 范明亮 郭子涵 +1 位作者 柴晓楠 商建东 《计算机工程》 CAS CSCD 北大核心 2022年第6期193-199,共7页
边缘检测是图像处理与计算机视觉领域中一种重要的图像分析方法,Sobel算子常用于粗精度的边缘提取,在图像边缘检测中被广泛应用。随着国产飞腾(FT)系列高性能数字信号处理器的发展,图像处理领域对FT平台的需求日益提高,同时急需实现面... 边缘检测是图像处理与计算机视觉领域中一种重要的图像分析方法,Sobel算子常用于粗精度的边缘提取,在图像边缘检测中被广泛应用。随着国产飞腾(FT)系列高性能数字信号处理器的发展,图像处理领域对FT平台的需求日益提高,同时急需实现面向FT平台的高性能图像处理算法。针对上述问题,在FT-M7002平台上对Sobel边缘检测算法进行向量并行优化,使用FT-M7002处理器内嵌SIMD指令,挖掘Sobel边缘检测算法中的数据级并行性,同时设计并实现一种字符型与整型数据间的并行化转换接口,使用循环展开优化方法提升指令节拍数,通过DMA矩阵转置解决数据访存不连续的问题。采用双缓冲技术实现数据传输与内核计算的并行,从而隐藏数据传输与计算之间的时间间隙。对比分析多种卷积核大小及图片规模下原Sobel算法与优化算法的性能,结果表明,与原始算法相比,该优化算法能取得1.66~3.14倍的加速比,此外,相较TMS320C6678处理器上的运行结果,在FT-M7002平台上优化算法可达到1.87~2.08倍的加速效果。 展开更多
关键词 边缘检测 SOBEL算子 高性能数字信号处理器 向量并行 循环展开
下载PDF
基于RDU-Net网络的肺部CT分割算法研究
10
作者 陈亚浩 韩林 +1 位作者 刘艳青 张悦 《计算机应用与软件》 北大核心 2024年第7期177-183,共7页
提出RDU-Net网络进行肺结节的分割工作。该网络以U-Net网络为基础,针对网络训练过程中经常出现的梯度消失现象,引入残差单元对基础网络进行改进,该操作很好地解决了网络模型训练过程中出现的梯度消失问题;为了提高网络的泛化能力,在网... 提出RDU-Net网络进行肺结节的分割工作。该网络以U-Net网络为基础,针对网络训练过程中经常出现的梯度消失现象,引入残差单元对基础网络进行改进,该操作很好地解决了网络模型训练过程中出现的梯度消失问题;为了提高网络的泛化能力,在网络中增加了Dropout层,以避免网络在训练过程中过拟合现象,进一步提高分割精度。该网络在LIDC-IDRI数据集上进行实验,其AUC和Dice分别达到了0.89和0.76,相较于基础网络其分割精度和分割效果都有一定的提高。 展开更多
关键词 深度学习 U-Net 肺片分割 肺结节
下载PDF
Grover量子搜索算法在“嵩山”超级计算机系统中的模拟
11
作者 杜帅岐 刘晓楠 +1 位作者 廉德萌 刘正煜 《计算机科学》 CSCD 北大核心 2024年第9期96-102,共7页
量子计算凭借其叠加性和纠缠性,具有强大的并行计算能力。然而,目前的量子计算机不能在保证大规模量子比特处于稳定叠加态的同时,进行干涉、纠缠等量子操作。因此,当前研究和推动量子计算的有效途径是使用经典计算机模拟量子计算。Grove... 量子计算凭借其叠加性和纠缠性,具有强大的并行计算能力。然而,目前的量子计算机不能在保证大规模量子比特处于稳定叠加态的同时,进行干涉、纠缠等量子操作。因此,当前研究和推动量子计算的有效途径是使用经典计算机模拟量子计算。Grover量子搜索算法针对无序数据库搜索问题设计,将搜索的时间复杂度加速至开平方级,能加速机器学习中的主成分分析。因此,研究和模拟Grover算法,可以促进量子计算与机器学习结合领域的发展,为Grover量子搜索算法的应用以及量子机器学习在“嵩山”超级计算机系统中的模拟奠定基础。通过研究Grover量子搜索算法,模拟出了算法的量子线路。使用Toffoli量子门优化该量子线路,在减少了两个辅助量子比特的同时,提出了Grover算法的通用量子线路。实验基于“嵩山”超级计算机系统的CPU+DCU异构体系,使用了MPI多进程+HIP多线程的两级并行策略。通过调整辅助比特在量子线路中的位置,减少了MPI进程间的通信;使用分片的方式传输数据依赖的量子态。对比串行版本,并行化的模拟算法取得了最高560.33倍的加速,首次实现了31qubits规模的Grover量子搜索算法。 展开更多
关键词 GROVER量子搜索算法 异构体系 MPI HIP 分片传输
下载PDF
面向DCU非一致控制流的编译优化 被引量:2
12
作者 杨小艺 赵荣彩 +2 位作者 王洪生 韩林 徐坤坤 《计算机应用》 CSCD 北大核心 2023年第10期3170-3177,共8页
国产DCU采用单指令多线程(SIMT)的并行执行模型,在程序执行时核函数内会产生非一致控制流,导致线程束中的线程部分只能串行执行,即线程束分化。针对核函数的性能因线程束分化受到严重制约的问题,提出一种减少线程束分化时间的编译优化... 国产DCU采用单指令多线程(SIMT)的并行执行模型,在程序执行时核函数内会产生非一致控制流,导致线程束中的线程部分只能串行执行,即线程束分化。针对核函数的性能因线程束分化受到严重制约的问题,提出一种减少线程束分化时间的编译优化方法——部分控制流合并(PCFM)。首先,通过散度分析找到同构且含有大量相同指令和相似指令的可融合发散区域;其次,统计合并后节省的指令周期百分比,从而评估可融合发散区域的融合盈利;最后,查找对齐序列,并合并有收益的可融合发散区域。在DCU上使用PCFM测试从图形处理器(GPU)基准测试套件Rodinia和经典的排序算法中选择的测试用例,实验结果表明,PCFM对测试用例能够取得1.146的平均加速比,与分支融合+尾合并方法相比,使用PCFM的加速比平均提高了5.72%。可见,所提方法减少线程束分化的效果更好。 展开更多
关键词 DCU 单指令多线程 线程束分化 复杂控制流 编译优化
下载PDF
面向FT-M6678的对称矩阵特征值求解算法实现与优化
13
作者 于立 韩林 +1 位作者 罗有才 商建东 《计算机工程》 CAS CSCD 北大核心 2024年第2期51-58,共8页
目前国产自主可控FT-M6678平台上没有对称矩阵特征值求解相关的实现,且平台上现有数学计算库不能很好地满足类似问题求解的需求。面向国产FT-M6678处理器,对对称矩阵特征值求解(SYEV)算法进行实现与优化,完善FT-M6678平台的线性代数计... 目前国产自主可控FT-M6678平台上没有对称矩阵特征值求解相关的实现,且平台上现有数学计算库不能很好地满足类似问题求解的需求。面向国产FT-M6678处理器,对对称矩阵特征值求解(SYEV)算法进行实现与优化,完善FT-M6678平台的线性代数计算库。通过对SYEV算法的实现过程以及运行热点的分析,基于FT-M6678平台进行编译优化、访存优化以及向量并行化优化,其中:编译优化是根据不同的编译选项指导编译器对程序优化以达到加速效果;访存优化包括缓存优化以及数据段与程序段的分配优化,用于提高矩阵数据的访存效率;向量并行化优化包括循环展开以及适配FT-M6678平台的单指令多数据流(SIMD)指令并行优化,用于提升程序的计算效率。在FT-M6678平台上对所实现并优化的算法进行正确性验证与优化性能分析,结果表明,算法能够正确通过LAPACK官方测试集测试,并且在FT-M6678平台上的加速效果可达到58.346倍,对比TMS320C6678平台速度可提升2.053倍。 展开更多
关键词 对称矩阵特征值 FT-M6678平台 热点分析 缓存优化 向量并行
下载PDF
智能集群系统的强化学习方法综述 被引量:1
14
作者 李璐璐 朱睿杰 +3 位作者 隋璐瑶 李亚飞 徐明亮 樊会涛 《计算机学报》 EI CAS CSCD 北大核心 2023年第12期2573-2596,共24页
智能集群系统是人工智能的重要分支,所涌现出的智能形态被称为集群智能,具有个体激发时的自组织性和群体汇聚时的强鲁棒性等特征.智能集群系统的协同决策过程是融合人-机-物,覆盖多元空间,囊括感知-决策-反馈-优化的复杂非线性问题,具... 智能集群系统是人工智能的重要分支,所涌现出的智能形态被称为集群智能,具有个体激发时的自组织性和群体汇聚时的强鲁棒性等特征.智能集群系统的协同决策过程是融合人-机-物,覆盖多元空间,囊括感知-决策-反馈-优化的复杂非线性问题,具有开放的决策模型和庞大的解空间.然而,传统的算法依赖大量的知识与经验,使其难以支持系统的持续演化.强化学习是一类兼具感知决策的端到端方法,其通过试错的方式不断迭代优化,具有强大的自主学习能力.近些年来,受生物群体和人工智能的启发,强化学习算法已由求解个体的决策问题,向优化集群的联合协同问题演进,为增强集群智能的汇聚和涌现注入了新动能.但是,强化学习在处理集群任务时面临感知环境时空敏感、群内个体高度自治、群间关系复杂多变、任务目标多维等挑战.本文立足于智能集群系统的协同决策过程与强化学习运行机理,从联合通信、协同决策、奖励反馈与策略优化四个方面梳理了强化学习算法应对挑战的方法,论述了面向智能集群系统的强化学习算法的典型应用,列举了相关开源平台及其适用算法.最后,从实际需求出发,讨论总结了今后的研究方向. 展开更多
关键词 智能集群系统 集群智能 群体智能 强化学习 感知决策
下载PDF
铁-铜双金属负载催化剂应用于非均相芬顿水处理研究发展
15
作者 侯玉玮 高徐奕 +2 位作者 蒿琳静 张杰 蒋苏毓 《应用化工》 CAS CSCD 北大核心 2023年第8期2370-2376,共7页
综述了近年来非均相芬顿工艺中负载型Fe-Cu双金属催化剂的研究进展,概述了在非均相芬顿水处理中适用于Fe-Cu双金属的各种载体材料(如氧化物或介孔材料、大分子物质和其他材料),并对Fe-Cu双金属催化剂对污染物的降解性能进行了批判性评... 综述了近年来非均相芬顿工艺中负载型Fe-Cu双金属催化剂的研究进展,概述了在非均相芬顿水处理中适用于Fe-Cu双金属的各种载体材料(如氧化物或介孔材料、大分子物质和其他材料),并对Fe-Cu双金属催化剂对污染物的降解性能进行了批判性评价。分析表明,相比于单独的Fe、Cu金属负载催化剂,Fe-Cu双金属负载催化剂对于污染物的降解能够表现出更好的性能。基于金属催化剂在芬顿工艺反应机理,为进一步开发催化剂向更有效的非均相芬顿反应及其在实际水处理中的应用提出了研究前景。 展开更多
关键词 芬顿反应 铁铜双金属 水处理 高级氧化
下载PDF
基于高性能安全存储芯片的SATA通路验证 被引量:1
16
作者 常琳琳 于哲 +1 位作者 周舜民 韩林 《计算机系统应用》 2023年第5期338-343,共6页
本文基于UVM验证方法学对自研高性能安全存储SoC芯片系统中SATA通路进行验证,文中对高性能安全存储SoC芯片架构及SATA通路系统工作原理进行说明,以SATA DMA数据传输方式为例介绍了SATA协议链路通信建立及数据传输过程.搭建UVM系统验证平... 本文基于UVM验证方法学对自研高性能安全存储SoC芯片系统中SATA通路进行验证,文中对高性能安全存储SoC芯片架构及SATA通路系统工作原理进行说明,以SATA DMA数据传输方式为例介绍了SATA协议链路通信建立及数据传输过程.搭建UVM系统验证平台,文中对SATA协议进行分析,设计规划系统层面测试用例,编写加载至系统中运行的C固件测试程序,实现对系统应用层面关注的PIO、DMA、NCQ等SATA命令方式数据传输通路的验证.结合具体波形分析,结果表明,SATA通路相关集成设计是合理、满足芯片对SATA数据通路应用需求的,实现了对高性能安全存储SoC芯片系统SATA通路的验证. 展开更多
关键词 UVM SOC SATA数据传输协议 SATA通路 C固件
下载PDF
舰载机保障作业人机协同决策方法
17
作者 李亚飞 高磊 +3 位作者 蒿宏杰 靳远远 王可 徐明亮 《中国科学:信息科学》 CSCD 北大核心 2023年第12期2493-2510,共18页
舰载机保障作业是航空母舰航空保障系统的重要组成部分,其调度效率不仅影响舰载机出动架次率,而且严重制约航空母舰作战效能发挥.在多舰载机保障的动态甲板作业环境下,安全高效地为舰载机分配保障资源,最大限度地减少舰载机因资源分配... 舰载机保障作业是航空母舰航空保障系统的重要组成部分,其调度效率不仅影响舰载机出动架次率,而且严重制约航空母舰作战效能发挥.在多舰载机保障的动态甲板作业环境下,安全高效地为舰载机分配保障资源,最大限度地减少舰载机因资源分配冲突产生的时间开销,是提高舰载机保障作业调度效率的关键途经.现有基于启发式、机器学习等方法舰载机保障作业调度策略,存在计算量大、鲁棒性差、训练效率低等问题.为此,本文将舰载机保障作业调度问题建模为分布式多智能体协同控制的顺序决策问题,构建了一种新颖的基于人机协同的多智能体作业调度决策框架HCMTPF(human-machine collaborative multi-agent task planning framework),有效地提高了保障作业调度决策模型的学习效率.在此基础上,提出了一种基于人类行为可信度的自适应作业分配方法,进一步提高了智能体自主探索能力和人类指导经验利用率.经大量仿真实验验证,本文提出的舰载机保障作业人机协同决策方法比其他方法在计算性能和学习效率方面具有明显优势. 展开更多
关键词 舰载机 人机协同 深度强化学习 任务分配 资源分配
原文传递
面向国产平台的LLVM自动向量化移植与优化 被引量:2
18
作者 李嘉楠 韩林 柴赟达 《计算机工程》 CAS CSCD 北大核心 2022年第1期142-148,共7页
作为SIMD扩展部件向量化的重要手段,自动向量化已在LLVM编译器中得到实现,但向量长度以及指令集功能的差异,导致国产平台在自动向量化过程中容易错失向量化机会以及向量化后产生倒加速的问题。为使SIMD得到充分应用,结合国产平台的指令... 作为SIMD扩展部件向量化的重要手段,自动向量化已在LLVM编译器中得到实现,但向量长度以及指令集功能的差异,导致国产平台在自动向量化过程中容易错失向量化机会以及向量化后产生倒加速的问题。为使SIMD得到充分应用,结合国产平台的指令集特征完善指令代价信息以提高收益分析精准度,使其在自动向量化后生成后端支持且简洁高效的向量指令。在此基础上,提出一种改进的控制流向量化方法,通过添加指令代价信息提高自动向量化的适配能力,从而形成一套面向国产平台的LLVM自动向量化系统。实验结果表明,相比自动向量化移植前,通过该方法进行移植优化后,SPEC测试的整体性能提升10.8%,TSVC测试集中的加速比提升16%,精准代价指导下的加速比提升42%,控制流向量化下的加速比提升51%。 展开更多
关键词 自动向量化 向量化收益 移植 LLVM编译器 国产平台
下载PDF
基于Faster R-CNN的肺炎目标检测 被引量:4
19
作者 宋雯琦 赵荣彩 +1 位作者 姜旭 刘艳青 《计算机工程与设计》 北大核心 2023年第7期2087-2092,共6页
针对肺炎图像中病灶组织与正常组织难以区分,导致的肺炎检测准确率低的问题,提出一种基于改进Faster R-CNN的肺炎目标检测算法。通过CRP-CLAHELS的流程在增强图像对比度的同时提取图像的边缘特征,提出IN-ResNet50网络作为特征提取主干网... 针对肺炎图像中病灶组织与正常组织难以区分,导致的肺炎检测准确率低的问题,提出一种基于改进Faster R-CNN的肺炎目标检测算法。通过CRP-CLAHELS的流程在增强图像对比度的同时提取图像的边缘特征,提出IN-ResNet50网络作为特征提取主干网络,提取更丰富的图像特征。在此基础上,引入Soft-NMS改进候选框合并策略,提高网络在多个目标肺炎区域下的检测准确率。在RSNA数据集上的实验结果表明,该算法相比Faster R-CNN平均精度均值提高7.26%,与其它目标检测主流算法SSD、YOLOv3相比平均精度均值分别提高8.83%、7.02%,验证了其有效性。 展开更多
关键词 深度学习 肺炎检测 快速区域卷积神经网络 医学图像处理 限制对比度自适应直方图均衡化 目标检测 非极大值抑制
下载PDF
分布式高性能自组网节点技术研究 被引量:1
20
作者 于哲 周舜民 +4 位作者 王彬 孙艺铭 陈方 赵子龙 李贝贝 《现代电子技术》 北大核心 2024年第5期1-7,共7页
针对当前主流Mesh自组网技术节点传输带宽不足百兆,级跳数小于10的问题,提出采用多处理器构建实现分布式多跳、高带宽低时延的无线跳频的高性能自组网节点,对节点自动化组网连接、多信道选择避让、漫游切换及低时延高带宽网络多跳实现... 针对当前主流Mesh自组网技术节点传输带宽不足百兆,级跳数小于10的问题,提出采用多处理器构建实现分布式多跳、高带宽低时延的无线跳频的高性能自组网节点,对节点自动化组网连接、多信道选择避让、漫游切换及低时延高带宽网络多跳实现等关键技术进行研究实现。由测试结果分析可知,在20级跳内,文中节点组网带宽损失在30%以内且带宽保持在200 Mb/s以上,时延控制在100 ms内,可以满足现实应急场景下多终端智能硬件实时进行图像、视频等大数据量信息交互对高带宽低时延网络通信的需求。 展开更多
关键词 多处理器 自组网连接 多级跳 高带宽 低时延 信息交互
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部