期刊文献+
共找到52篇文章
< 1 2 3 >
每页显示 20 50 100
基于“承影”GPGPU的张量处理器设计
1
作者 师雨洁 杨轲翔 +1 位作者 刘旭东 何虎 《微电子学与计算机》 2024年第5期109-116,共8页
针对神经网络对算力和通用性的需求进一步扩大,基于开源项目“承影”GPGPU,设计了张量处理器,可以对卷积、通用矩阵乘进行加速。首先,分析现有张量处理器设计方案及其对应算法,与直接进行卷积计算进行对比,分析性能差异。然后,提出基于... 针对神经网络对算力和通用性的需求进一步扩大,基于开源项目“承影”GPGPU,设计了张量处理器,可以对卷积、通用矩阵乘进行加速。首先,分析现有张量处理器设计方案及其对应算法,与直接进行卷积计算进行对比,分析性能差异。然后,提出基于三维乘法树结构的张量处理器设计,将其部署在Xilinx VCU128开发板上。在VCU128开发板上,张量处理器的工作频率为222 MHz。同时,开发了指数运算单元,辅助完成神经网络运算。在VCU128开发板上的工作频率为159 MHz。最后,利用编写汇编程序的方法,验证张量处理器的功能正确性。引入张量处理器后,预期运行时间明显减少。 展开更多
关键词 通用图形处理器 张量处理 卷积 通用矩阵乘 指数运算
下载PDF
基于GPGPU的JPEG2000图像压缩方法 被引量:5
2
作者 李玉峰 吴蔚 +1 位作者 王恺 崔迎炜 《电子器件》 CAS 北大核心 2013年第2期163-168,共6页
为了进一步加快JPEG2000的压缩速度,对JPEG2000压缩标准进行研究,分析得出JPEG2000核心算法离散小波变换(DWT)部分数据之间的独立性适合并行化处理。NVIDIA最新推出的CUDA(计算统一设备架构)是非常适合大规模数据并行计算的软硬件开发... 为了进一步加快JPEG2000的压缩速度,对JPEG2000压缩标准进行研究,分析得出JPEG2000核心算法离散小波变换(DWT)部分数据之间的独立性适合并行化处理。NVIDIA最新推出的CUDA(计算统一设备架构)是非常适合大规模数据并行计算的软硬件开发平台。在通用计算图形处理器(General Purpose Graphic Process Unit,GPGPU)上使用CUDA技术实现DWT并行化加速,并针对GPGPU存储空间的特点进行优化。得出的实验结果表明,经过CUDA并行优化的方法能够有效地提高离散小波变换DWT的计算速度。 展开更多
关键词 JPEG2000 离散小波变换 通用图形处理器 并行计算 CUDA
下载PDF
基于通用图形处理器的GRAPES长波辐射并行方案 被引量:5
3
作者 郭妙 金之雁 周斌 《应用气象学报》 CSCD 北大核心 2012年第3期348-354,共7页
随着通用图形处理器(GPGPU)计算技术的快速发展,通过大规模增加处理系统的并发度来提升性能成为计算机高性能计算的最新趋势。目前,通用图形处理器已经被应用到科学计算的诸多领域。长波辐射作为GRAPES模式中极为重要的物理过程,其巨大... 随着通用图形处理器(GPGPU)计算技术的快速发展,通过大规模增加处理系统的并发度来提升性能成为计算机高性能计算的最新趋势。目前,通用图形处理器已经被应用到科学计算的诸多领域。长波辐射作为GRAPES模式中极为重要的物理过程,其巨大的计算量对整个GRAPES模式的运行效率有重要影响。该文依托NVIDIA公司计算统一设备架构(CUDA)技术平台,以GRAPES全球模式中长波辐射传输方案为例,对其进行了大规模并发设计和优化,在保持系统结果一致的前提下,对比单颗高端CPU,Tesla C1060 GPGPU具有11倍的加速效果,明显提升了GRAPES全球模式的执行速度和预报时效。研究表明:使用通用图形处理器技术提升数值预报模式的执行速度非常有潜力。 展开更多
关键词 通用图形处理器 数值天气预报模式 长波辐射
下载PDF
基于GPGPU的生物序列快速比对 被引量:5
4
作者 马海晨 韦刚 吴百峰 《计算机工程》 CAS CSCD 2012年第4期241-244,共4页
在CPU-GPU异构平台下,提出一种高效的生物序列比对方案。该方案利用GPU的并行处理能力,通过对读延迟、写延迟、重组函数及数据传输进行优化,在OpenCL框架下重构Smith-Waterman算法,加快生物序列比对速度。实验结果证明,与CPU上传统的串... 在CPU-GPU异构平台下,提出一种高效的生物序列比对方案。该方案利用GPU的并行处理能力,通过对读延迟、写延迟、重组函数及数据传输进行优化,在OpenCL框架下重构Smith-Waterman算法,加快生物序列比对速度。实验结果证明,与CPU上传统的串行算法相比,该算法最高可获得约100倍的性能提升。 展开更多
关键词 生物信息学 序列比对 通用图形处理器 SMITH-WATERMAN算法 OpenCL框架
下载PDF
基于图形处理器的增强现实自然特征注册算法 被引量:5
5
作者 赵新灿 张燕 《南京理工大学学报》 EI CAS CSCD 北大核心 2011年第4期448-452,共5页
传统的基于中央处理器(CPU)的计算架构已无法满足增强现实(AR)三维注册技术实时运行要求。针对该问题,该文提出采用现代多核异构、大规模并行处理功能的通用图形处理器(GPGPU)来加速和优化AR三维注册算法,研究了在GPU上实现类似特征提... 传统的基于中央处理器(CPU)的计算架构已无法满足增强现实(AR)三维注册技术实时运行要求。针对该问题,该文提出采用现代多核异构、大规模并行处理功能的通用图形处理器(GPGPU)来加速和优化AR三维注册算法,研究了在GPU上实现类似特征提取和匹配等AR三维注册核心技术的基础理论、方法和实验。结果表明,通过模块划分和优化后的图像特征提取SIFT算法、随机采样等,能够充分挖掘AR三维注册算法的并行运算潜力,对于640*480像素的图像序列,注册算法能够达到15帧/秒,有效地提高运算实时性。 展开更多
关键词 增强现实 三维注册 通用图形处理器 自然特征
下载PDF
通用图形处理器线程调度优化方法研究综述 被引量:4
6
作者 何炎祥 张军 +3 位作者 沈凡凡 江南 李清安 刘子骏 《计算机学报》 EI CSCD 北大核心 2016年第9期1733-1749,共17页
随着通用图形处理器(GPGPU)并行计算能力的日益增强,其应用范围越来越广.然而由于不规则计算任务使得通用图形处理器资源难以得到充分利用,其性能并未达到最大化.在论述GPGPU微体系结构的基础上,该文重点讨论了多种针对GPGPU性能提升的... 随着通用图形处理器(GPGPU)并行计算能力的日益增强,其应用范围越来越广.然而由于不规则计算任务使得通用图形处理器资源难以得到充分利用,其性能并未达到最大化.在论述GPGPU微体系结构的基础上,该文重点讨论了多种针对GPGPU性能提升的线程调度优化方法,主要从针对优化分支转移提升线程级并行度、针对访存效率的提升和针对标量指令执行以提升资源利用率三方面的线程调度优化方法进行了分析和比较.另外,由于功耗问题已成为制约GPGPU发展的主要因素之一,该文还分析了影响GPGPU功耗效率的主要原因及目前提高GPGPU功耗效率的主要低功耗技术,并对目前针对GPGPU功耗优化的典型线程调度优化方法进行了分析比较.最后,该文指出了未来线程调度优化方法需要进一步探讨的一些问题. 展开更多
关键词 通用图形处理器 线程调度优化 性能 功耗
下载PDF
一种面向二维三维卷积的GPGPU cache旁路系统
7
作者 贾世伟 张玉明 +2 位作者 秦翔 孙成璐 田泽 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2023年第2期92-100,共9页
通用图形处理器作为卷积神经网络的核心加速平台,其处理二维、三维卷积的性能,决定着神经网络在实时目标识别检测领域的有效应用。然而,受其固有cache系统功能的限制,当前通用图形处理器架构无法实现二维、三维卷积的高效加速。针对此问... 通用图形处理器作为卷积神经网络的核心加速平台,其处理二维、三维卷积的性能,决定着神经网络在实时目标识别检测领域的有效应用。然而,受其固有cache系统功能的限制,当前通用图形处理器架构无法实现二维、三维卷积的高效加速。针对此问题,首先提出一种L1Dcache动态旁路设计方案。该方案定义了一组能够动态反映指令访问cache特征的数据结构,并基于此数据结构定义访存特征记录表,以记录不同访存指令在请求cache时的执行状态。其次,采用优先线程块的warp调度策略来加速访存状态的采样。最后根据访存状态得出不同PC值下访存请求对L1Dcache的旁路的判定,并动态完成部分低局域性数据请求对L1Dcache的旁路。由此将L1Dcache空间保留给高局域性的数据并降低二维、三维卷积执行时的访存阻塞周期,进而提升了二维、三维卷积在通用图形处理器上执行时的访存效率。实验结果表明,相比原架构,在面向二维、三维卷积时分别带来了约2.16%与19.79%的性能提升,体现了设计方案的有效性与实用性。 展开更多
关键词 卷积 通用图形处理器 存储系统 cache旁路
下载PDF
通用图形处理器缓存子系统性能优化方法综述 被引量:4
8
作者 张军 谢竟成 +3 位作者 沈凡凡 谭海 汪吕蒙 何炎祥 《计算机研究与发展》 EI CSCD 北大核心 2020年第6期1191-1207,共17页
随着工艺和制程技术的不断发展以及体系架构的日趋完善,通用图形处理器(general purpose graphics processing units,GPGPU)的并行计算能力得到了很大的提升,其在高性能、高吞吐量等通用计算应用场景的使用越来越广泛.GPGPU通过支持大... 随着工艺和制程技术的不断发展以及体系架构的日趋完善,通用图形处理器(general purpose graphics processing units,GPGPU)的并行计算能力得到了很大的提升,其在高性能、高吞吐量等通用计算应用场景的使用越来越广泛.GPGPU通过支持大量线程的并发执行,可以较好地隐藏长延时访存操作,从而获得高并行计算能力.然而,GPGPU在处理计算和访存不规则的应用时,其存储子系统的效率受到很大影响,尤其是片上缓存的争用情况尤为突出,难以及时提供计算操作所需的数据,使得GPGPU的高并行计算能力不能得到充分发挥.解决片上缓存的争用问题、优化缓存子系统的性能,是优化GPGPU性能的主要解决方案之一,也是目前研究GPGPU性能优化的主要热点之一.目前,针对GPGPU缓存子系统的性能优化研究主要集中在线程级并行度(thread level parallelism,TLP)调节、访存顺序调节、数据通量增强、最后一级缓存(last level cache,LLC)优化和基于非易失性存储(non-volatile memory,NVM)的GPGPU缓存新架构设计等5个方面.也从这5个方面重点分析讨论了目前主要的GPGPU缓存子系统性能优化方法,并在最后指出了未来GPGPU缓存子系统优化需要进一步探讨的问题,对GPGPU缓存子系统性能优化的研究有重要意义. 展开更多
关键词 通用图形处理器 缓存子系统 性能优化 延迟隐藏 缓存争用
下载PDF
一种针对栅栏同步的GPGPU微架构优化设计
9
作者 贾世伟 张玉明 +1 位作者 田泽 秦翔 《固体电子学研究与进展》 CAS 北大核心 2023年第1期70-77,共8页
为了降低通用图形处理器(GPGPU)中栅栏同步开销对程序性能产生的不良影响,提出了一种GPGPU微架构优化设计。该设计在线程束调度模块中,根据栅栏同步开销决定各线程束的调度顺序,确保高栅栏同步开销的线程束能够优先调度执行。在一级数... 为了降低通用图形处理器(GPGPU)中栅栏同步开销对程序性能产生的不良影响,提出了一种GPGPU微架构优化设计。该设计在线程束调度模块中,根据栅栏同步开销决定各线程束的调度顺序,确保高栅栏同步开销的线程束能够优先调度执行。在一级数据缓存模块中,结合数据缓存缺失率与栅栏同步状态来共同决定各访存请求是否需要执行旁路操作,由此在不损害数据局域性开发的前提下,降低数据缓存阻塞周期对栅栏同步产生的影响。两种子模块优化设计均能够降低栅栏同步开销。实验结果表明,相比基准GPGPU架构与当前现有的栅栏同步优化策略,本设计在栅栏同步密集类程序中分别带来了4.15%、4.13%与2.62%的每周期指令数提升,证明了优化设计的有效性与实用性。 展开更多
关键词 通用图形处理器 栅栏同步 线程束调度 一级数据缓存 缓存旁路 性能
下载PDF
使用GPU技术的数据流分位数并行计算方法 被引量:2
10
作者 周勇 王皓 程春田 《计算机应用》 CSCD 北大核心 2010年第2期543-546,共4页
数据流实时、连续、快速到达的特点决定了数据流的实时处理能力。在处理低维数据流时经常使用分位数信息来描述数据流的统计信息,利用图形处理器(GPU)的强大计算能力和高内存带宽的特性计算数据流分位数信息,提出了基于统一计算设备架构... 数据流实时、连续、快速到达的特点决定了数据流的实时处理能力。在处理低维数据流时经常使用分位数信息来描述数据流的统计信息,利用图形处理器(GPU)的强大计算能力和高内存带宽的特性计算数据流分位数信息,提出了基于统一计算设备架构(CUDA)的数据流处理模型和基于该模型的数据流分位数并行计算方法。实验证明,该方法在提供不低于纯CPU分位数算法相同精度的条件下,使数据流分位数的实时计算带宽得到了显著的提高。 展开更多
关键词 统一计算设备架构 通用图形处理器 数据流 分位数 并行计算
下载PDF
一种基于per-pixel光照的高质量体绘制算法 被引量:2
11
作者 郑杰 姬红兵 杨万海 《系统仿真学报》 EI CAS CSCD 北大核心 2007年第1期21-25,共5页
分析讨论了一种基于per-pixel光照的高质量纹理映射体绘制算法。可以精确地对任意的动态点光源进行光照计算,这主要归功于在光照计算中采用了归一化的梯度,以及在每个像素上计算光照强度。同时,还提出了一种新技术通过对梯度的实时计算... 分析讨论了一种基于per-pixel光照的高质量纹理映射体绘制算法。可以精确地对任意的动态点光源进行光照计算,这主要归功于在光照计算中采用了归一化的梯度,以及在每个像素上计算光照强度。同时,还提出了一种新技术通过对梯度的实时计算来有效的减少在传统基于纹理映射的体绘制中巨大的内存消耗,使得大规模体数据的实时绘制成为可能。充分利用了目前PC图形硬件成熟的可编程特性,特别是fragmentprogram,可以快速的载入体数据,得到可交互的绘制。最后对医学体数据进行绘制,得到了较为理想的结果。 展开更多
关键词 体绘制 三维纹理映射 光照计算 通用图形处理器
下载PDF
使用CUDA平台关于并行高斯-约当消去法的研究与比较 被引量:3
12
作者 毛飞 陈智骏 +1 位作者 梁效斐 曹奇英 《计算机应用与软件》 CSCD 2011年第9期269-271,共3页
使用CUDA平台,提出在通用图形处理器(GPGPU)上实现并行的全选主元、归一和消去等操作,加速实现并行全选主元高斯-约当消去法求解线性方程组的一种基本方法。该方法在CPU上完成解向量的恢复。根据NVIDIA公司最新Fermi架构图形处理器的特... 使用CUDA平台,提出在通用图形处理器(GPGPU)上实现并行的全选主元、归一和消去等操作,加速实现并行全选主元高斯-约当消去法求解线性方程组的一种基本方法。该方法在CPU上完成解向量的恢复。根据NVIDIA公司最新Fermi架构图形处理器的特点,通过一系列的优化设计,使通用GPGPU相对Intel最新架构CPU的加速比超过了6.5倍,比Intel上一代CPU的加速比超过了10倍。 展开更多
关键词 CUDA 并行计算 通用图形处理器 全选主元高斯-约当消去法
下载PDF
一种基于视觉无损压缩的雷达视频显示预处理方法 被引量:3
13
作者 杨东华 王志祥 邱晗 《南京理工大学学报》 EI CAS CSCD 北大核心 2019年第4期489-494,共6页
采用通用计算图形处理器实现软件化雷达视频显示处理是雷达终端重要的技术方向之一。雷达视频带宽的激增对软件化雷达视频显示处理提出了新的挑战,目前国内外对大带宽雷达视频的显示处理还未能给出有效的解决方法。该文分析该项技术的瓶... 采用通用计算图形处理器实现软件化雷达视频显示处理是雷达终端重要的技术方向之一。雷达视频带宽的激增对软件化雷达视频显示处理提出了新的挑战,目前国内外对大带宽雷达视频的显示处理还未能给出有效的解决方法。该文分析该项技术的瓶颈,创新性地提出了一种基于视觉无损压缩的雷达视频显示预处理方法,并进行了工程实现与验证。该预处理方法大幅降低了视频数据传输带宽和处理器资源占用率,提高了软件化视频显示处理的技术指标,提升了雷达终端的稳定性,为大带宽雷达视频的软件化显示处理提供了有效途径。 展开更多
关键词 软件化雷达终端 视觉无损压缩 通用图形处理器 游程长度编码
下载PDF
新的图像几何矩快速算法 被引量:2
14
作者 高月芳 冯志炜 +1 位作者 徐东风 田绪红 《小型微型计算机系统》 CSCD 北大核心 2010年第7期1448-1451,共4页
矩技术作为一种有效的图像描述方法,在图像分析方面有着重要应用,但由于涉及大量计算,在一定程度上制约其应用.提出一种新的基于GPU的快速计算方法,它首先将图像加载成纹理,然后在像素着色器中利用GPU内核同时对多个像素进行处理,快速... 矩技术作为一种有效的图像描述方法,在图像分析方面有着重要应用,但由于涉及大量计算,在一定程度上制约其应用.提出一种新的基于GPU的快速计算方法,它首先将图像加载成纹理,然后在像素着色器中利用GPU内核同时对多个像素进行处理,快速计算所需矩值.实验结果表明,与当前的直接法和对称核快速算法相比,文中提出的算法可有效节省计算时间,尤其在图像尺寸较大及所使用的矩的阶数较高的情况下,计算性能更优. 展开更多
关键词 几何矩 通用图形处理器 快速计算 图像处理
下载PDF
面向OpenCL的GPGPU微基准测试程序集的研究与实现 被引量:2
15
作者 杨海燕 史晓华 +3 位作者 孙清越 晏望龙 严鑫 金茂忠 《系统工程与电子技术》 EI CSCD 北大核心 2013年第12期2631-2642,共12页
随着通用图形处理器(general-purpose graphics processing unit,GPGPU)的广泛应用,GPGPU成为当前实现计算并行化的主要硬件平台之一。开放计算语言(open computing language,OpenCL)是一个开放的、面向异构系统平台的并行计算标准,支... 随着通用图形处理器(general-purpose graphics processing unit,GPGPU)的广泛应用,GPGPU成为当前实现计算并行化的主要硬件平台之一。开放计算语言(open computing language,OpenCL)是一个开放的、面向异构系统平台的并行计算标准,支持在包括图形处理器(graphics processing unit,GPU)在内的多种微处理器架构上开发和运行并行程序。针对OpenCL平台开发了一套较完整的GPGPU微基准测试程序集,全面测试了GPU的单精浮点运算能力、GPU体系结构中各类存储单元的读写带宽及最佳访问模式等。这些面向OpenCL的GPGPU微基准测试程序,对OpenCL及GPGPU软件架构的设计者及使用者,均具有重要的实用和参考价值。 展开更多
关键词 计算机系统结构 微基准测试程序集 通用图形处理器 开放计算语言
下载PDF
基于实时梯度计算的快速纹理映射体绘制
16
作者 郑杰 姬红兵 杨万海 《计算机科学》 CSCD 北大核心 2007年第2期230-233,共4页
本文分析讨论了一种基于实时梯度计算的纹理映射体绘制算法。在绘制过程中实时计算每个体素上的梯度,有效地减少了在传统基于纹理映射的体绘制中,对梯度预先计算的耗时操作,也降低了内存的消耗,加快了整个绘制过程。同时,采用三维Sobel... 本文分析讨论了一种基于实时梯度计算的纹理映射体绘制算法。在绘制过程中实时计算每个体素上的梯度,有效地减少了在传统基于纹理映射的体绘制中,对梯度预先计算的耗时操作,也降低了内存的消耗,加快了整个绘制过程。同时,采用三维Sobel算子对梯度进行计算,并进行归一化处理,有效地提高了绘制图像的质量。在实现中充分利用了目前PC图形硬件成熟的可编程特性,特别是fragment program,来完成梯度的实时计算。最后对医学体数据进行绘制,得到了理想的结果。 展开更多
关键词 体绘制 三维纹理映射 梯度计算 通用图形处理器
下载PDF
通用图形处理器功耗估算模型 被引量:2
17
作者 王吉军 程华 《计算机工程》 CAS CSCD 北大核心 2017年第2期92-97,104,共7页
为精准快速地获得GPU功耗数据,提出一种基于硬件性能计数事件的通用图形处理器(GPGPU)功耗估算方法。通过分析GPGPU程序运行时的功耗分布情况,选择一组与应用程序运行功耗密切相关的硬件性能计数事件集合,使用反向传播人工神经网络分析... 为精准快速地获得GPU功耗数据,提出一种基于硬件性能计数事件的通用图形处理器(GPGPU)功耗估算方法。通过分析GPGPU程序运行时的功耗分布情况,选择一组与应用程序运行功耗密切相关的硬件性能计数事件集合,使用反向传播人工神经网络分析硬件性能计数事件与实时功耗间的关系,最终建立GPGPU功耗估算模型。实验结果表明,与多元线性回归的功耗估算模型相比,该模型具有更高的估算准确性和通用性。 展开更多
关键词 通用图形处理器 硬件性能计数事件 反向传播人工神经网络 交叉验证 功耗估算
下载PDF
MATLAB环境下GPU并行计算的应用 被引量:2
18
作者 段群 王小妮 《自动化与仪器仪表》 2017年第6期172-174,共3页
为了解决在MATLAB环境下使用图像处理器(GPU)进行并行计算的问题,给出了四种常用的方法,分别是:在GPU上执行重载的MATLAB函数、在MATLAB中定义GPU内核、直接从MATLAB调用CUDA代码、利用NVMEX编译CUDA源程序。每种方法都在相关硬件及软... 为了解决在MATLAB环境下使用图像处理器(GPU)进行并行计算的问题,给出了四种常用的方法,分别是:在GPU上执行重载的MATLAB函数、在MATLAB中定义GPU内核、直接从MATLAB调用CUDA代码、利用NVMEX编译CUDA源程序。每种方法都在相关硬件及软件环境下进行了实验,并给出了具体的实现方法、步骤以及参考示例代码。总结处给出了四种方法在编译方式、编程模式、编程灵活性等方面的比较,为编程者选择有效的调用方法提供了一定的参考依据。 展开更多
关键词 通用图形处理器 MATLAB CUDA 并行计算
原文传递
GPGPU编程技术初探 被引量:2
19
作者 林茂 董玉敏 +2 位作者 邹杰 杨敏 张晋楠 《电脑编程技巧与维护》 2010年第2期15-17,23,共4页
伴随着GPGPU计算技术的不断发展,HPC高性能计算系统体系结构正在悄然发生着一场变革,这场变革为高性能计算发展提供了一个新的方向。CUDA是NIVIDIA公司提供的利用GPGPU进行并行运算应用开发的一套C语言编程平台,通过它可以利用特定显卡... 伴随着GPGPU计算技术的不断发展,HPC高性能计算系统体系结构正在悄然发生着一场变革,这场变革为高性能计算发展提供了一个新的方向。CUDA是NIVIDIA公司提供的利用GPGPU进行并行运算应用开发的一套C语言编程平台,通过它可以利用特定显卡的高性能运算能力进行一些大规模高性能计算,有效提升计算机系统的使用效率。本文主要介绍GPU发展现状以及如何利用CUDA编程技术进行并行运算软件开发。 展开更多
关键词 高性能并行计算 通用图形处理器 CUDA 并行计算 线程
下载PDF
通用图形处理器GPGPU在自动测试生成中的应用 被引量:2
20
作者 黄宇翔 《集成电路应用》 2020年第5期34-35,共2页
探索加速自动测试生产的效率,对降低集成电路测试成本、缩短设计周期有着重要意义。基于通用图形处理器GPGPU的特性,以及自动测试的运行过程,探索GPGPU对自动测试生成的加速效果。
关键词 集成电路制造 通用图形处理器 自动测试 生成 加速
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部