基于广域网中使用MPTCP协议进行数据传输时,由于短流的传输数据量小,每条子流的拥塞窗口在其生命周期内保持很小的状态,这使得1个数据包的丢失也可能导致超时现象发生,从而增大数据流的完成时间,为此,提出一种根据MPTCP数据流特性进行MP...基于广域网中使用MPTCP协议进行数据传输时,由于短流的传输数据量小,每条子流的拥塞窗口在其生命周期内保持很小的状态,这使得1个数据包的丢失也可能导致超时现象发生,从而增大数据流的完成时间,为此,提出一种根据MPTCP数据流特性进行MPTCP数据流调度的算法MPTCP-FSFSm(multi-path TCP flow scheduling based on flow size)。首先,MPTCP-FSFS算法根据MPTCP数据流需要发送的数据量将MPTCP数据流分类;然后,发送端根据当前每条路径往返时延进行MPTCP数据流调度:对于短流,选择往返时延最小的若干条路径进行数据流传输;对于长流,使用所有的路径进行数据流传输。研究结果表明:与MPTCP相比,MPTCP-FSFS在保证长流吞吐率的基础上,能够明显降低短流的数据流完成时间,同时提高数据流平均吞吐率。展开更多
针对可分离卷积神经网络在星载飞机目标型号分类应用中存在的速度瓶颈以及功耗限制等问题,提出了一种基于现场可编程门阵列(FPGA)数据流调度的浮点深度分离卷积神经网络加速方法,对通用MobileNet的图像分类模型进行加速。采用基于乘法...针对可分离卷积神经网络在星载飞机目标型号分类应用中存在的速度瓶颈以及功耗限制等问题,提出了一种基于现场可编程门阵列(FPGA)数据流调度的浮点深度分离卷积神经网络加速方法,对通用MobileNet的图像分类模型进行加速。采用基于乘法矩阵与前向加法树的深度分离卷积计算阵列设计,解决了深度分离卷积浮点加速的线速吞吐瓶颈。实验结果表明,基于FPGA的目标分类速度为633 FPS,功耗为22.226 W,运算性能为236.04 GFLOPS,计算速度达到了Titan Xp GPU的1.10~2.61倍,计算效能是Titan Xp GPU的7.44~18.66倍。在同类基于FPGA的浮点卷积加速方案中,该方法在运算性能及能效比上达到了最优。同时,该方法提供了与原模型一致性的图像分类准确率,解耦合了软硬件协同开发流程,降低了应用开发人员使用FPGA加速计算的门槛。展开更多
文摘基于广域网中使用MPTCP协议进行数据传输时,由于短流的传输数据量小,每条子流的拥塞窗口在其生命周期内保持很小的状态,这使得1个数据包的丢失也可能导致超时现象发生,从而增大数据流的完成时间,为此,提出一种根据MPTCP数据流特性进行MPTCP数据流调度的算法MPTCP-FSFSm(multi-path TCP flow scheduling based on flow size)。首先,MPTCP-FSFS算法根据MPTCP数据流需要发送的数据量将MPTCP数据流分类;然后,发送端根据当前每条路径往返时延进行MPTCP数据流调度:对于短流,选择往返时延最小的若干条路径进行数据流传输;对于长流,使用所有的路径进行数据流传输。研究结果表明:与MPTCP相比,MPTCP-FSFS在保证长流吞吐率的基础上,能够明显降低短流的数据流完成时间,同时提高数据流平均吞吐率。
文摘针对可分离卷积神经网络在星载飞机目标型号分类应用中存在的速度瓶颈以及功耗限制等问题,提出了一种基于现场可编程门阵列(FPGA)数据流调度的浮点深度分离卷积神经网络加速方法,对通用MobileNet的图像分类模型进行加速。采用基于乘法矩阵与前向加法树的深度分离卷积计算阵列设计,解决了深度分离卷积浮点加速的线速吞吐瓶颈。实验结果表明,基于FPGA的目标分类速度为633 FPS,功耗为22.226 W,运算性能为236.04 GFLOPS,计算速度达到了Titan Xp GPU的1.10~2.61倍,计算效能是Titan Xp GPU的7.44~18.66倍。在同类基于FPGA的浮点卷积加速方案中,该方法在运算性能及能效比上达到了最优。同时,该方法提供了与原模型一致性的图像分类准确率,解耦合了软硬件协同开发流程,降低了应用开发人员使用FPGA加速计算的门槛。