期刊文献+
共找到90篇文章
< 1 2 5 >
每页显示 20 50 100
面向异构融合处理器的性能分析、优化及应用综述 被引量:10
1
作者 张峰 翟季冬 +2 位作者 陈政 林甲灶 杜小勇 《软件学报》 EI CSCD 北大核心 2020年第8期2603-2624,共22页
随着异构计算技术的不断进步,CPU和GPU等设备相集成的异构融合处理器在近些年得到了充分的发展,并引起了学术界和工业界的关注.将多种设备进行集成带来了许多好处,例如,多种设备可以访问同样的内存,可以进行细粒度的交互.然而,这也带来... 随着异构计算技术的不断进步,CPU和GPU等设备相集成的异构融合处理器在近些年得到了充分的发展,并引起了学术界和工业界的关注.将多种设备进行集成带来了许多好处,例如,多种设备可以访问同样的内存,可以进行细粒度的交互.然而,这也带来了系统编程和优化方面的巨大挑战.充分发挥异构融合处理器的性能,需要充分利用集成体系结构中共享内存等特性;同时,还需结合具体应用特征对异构融合处理器上的不同设备进行优化.首先对目前涉及异构融合处理器的研究工作进行了分析,之后介绍了异构融合处理器的性能分析工作,并进一步介绍了相关优化技术,随后对异构融合处理器的应用进行了总结.最后,对异构融合处理器未来的研究方向进行展望,并进行了总结. 展开更多
关键词 cpu GPU 异构融合处理器 性能分析 性能优化
下载PDF
基于国产CPU/OS的信息系统性能测试方案研究 被引量:10
2
作者 熊婧 夏仲平 +1 位作者 林军 杨春晖 《计算机工程》 CAS CSCD 北大核心 2015年第12期82-85,90,共5页
为更准确地评价基于国产CPU/OS的信息系统性能,通过介绍国产基础软/硬件的背景,阐述信息系统性能测试原理及方法,针对商用性能测试工具LoadRunner不能真实反映用户体验时间,无法直接用于基于国产CPU/OS的信息系统的问题,考虑用户体验,... 为更准确地评价基于国产CPU/OS的信息系统性能,通过介绍国产基础软/硬件的背景,阐述信息系统性能测试原理及方法,针对商用性能测试工具LoadRunner不能真实反映用户体验时间,无法直接用于基于国产CPU/OS的信息系统的问题,考虑用户体验,分别提出基于LoadRunner和JMeter的国产信息系统性能测试方案。对2种改进方案进行实验,结果显示,JMeter测试方案的方差比LoadRunner测试方案小70.49%,表明JMeter方案的测试结果比LoadRunner方案更接近用户体验时间。 展开更多
关键词 国产基础软件 国产cpu 国产操作系统 信息系统 性能测试 LoadRunner测试工具 JMeter测试工具
下载PDF
FTP协议的测试及分析 被引量:9
3
作者 孙韩林 金跃辉 +1 位作者 高雪松 张健 《计算机工程》 CAS CSCD 北大核心 2008年第23期133-135,138,共4页
基于实验网中的一组测试数据,分析网络背景流量、服务器CPU负载和文件大小对FTP协议性能的影响。实验结果显示,网络带宽、背景流量从根本上限制了FTP协议的性能,CPU负载在较高水平时才会影响FTP协议性能,文件大小与占用的网络、服务器... 基于实验网中的一组测试数据,分析网络背景流量、服务器CPU负载和文件大小对FTP协议性能的影响。实验结果显示,网络带宽、背景流量从根本上限制了FTP协议的性能,CPU负载在较高水平时才会影响FTP协议性能,文件大小与占用的网络、服务器资源有关,也会影响FTP协议性能。 展开更多
关键词 FTP协议 性能测试 时延 cpu负载
下载PDF
基于Nginx的Web响应加速优化研究 被引量:9
4
作者 毛正雄 赵志宇 孙北宁 《自动化与仪器仪表》 2018年第4期31-34,38,共5页
针对当前互联网时代下不同网站访问量的增加,如何提高系统运行访问的性能,提高页面响应的速度,是当前软件工作者思考研究的重点。但是传统web加速主要是通过压缩文件大小,或者对网络层SDN等进行加速,进而提高web网站的相应速度。但单纯... 针对当前互联网时代下不同网站访问量的增加,如何提高系统运行访问的性能,提高页面响应的速度,是当前软件工作者思考研究的重点。但是传统web加速主要是通过压缩文件大小,或者对网络层SDN等进行加速,进而提高web网站的相应速度。但单纯的依靠这些方式对系统访问进行加速还不能满足日益增长的访问量。对此,结合上述的需求和问题,本文首先对Nginx服务器进行了简单的介绍,并给出了Nginx服务器的优势。然后根据本文的思路,提出在Nginx服务器中引入一种负载均衡策略,具体则是将集群服务器看成是不同的节点,选取节点中的CPU性能、内存性能、磁盘IO性能以及网络带宽性能等作为评价性能的好坏标准。然后结合不同节点的资源效率情况,以标准差作为阈值对服务器性能进行评价,如超过该阈值,则分配到其他服务器,并实时更新节点冗余参数。最后通过搭建Nginx服务器测试环境,对上述的方案进行测试,结果表明其响应速度要明显高于传统的响应方案,验证了本策略的效果。 展开更多
关键词 Nginx服务器 Web响应 负载均衡 cpu性能 响应速度
原文传递
主成分线性回归模型分析应用程序性能 被引量:6
5
作者 李胜梅 程步奇 +2 位作者 高兴誉 乔林 汤志忠 《计算机研究与发展》 EI CSCD 北大核心 2009年第11期1949-1955,共7页
应用程序的性能分析能够给体系架构设计者和性能优化者提供有效的参考和指导.采用主成分线性回归模型分析了SPEC CPU2006的整型程序性能.模型选取性能监测单元采样到的事件为自变量,每条指令的时钟周期数(CPI)作为因变量.模型中采用主... 应用程序的性能分析能够给体系架构设计者和性能优化者提供有效的参考和指导.采用主成分线性回归模型分析了SPEC CPU2006的整型程序性能.模型选取性能监测单元采样到的事件为自变量,每条指令的时钟周期数(CPI)作为因变量.模型中采用主成分分析法消除了性能事件之间的相关性.实验结果表明,模型的拟合优度在90%以上,对性能进行预测的平均相对误差为15%.模型从量化上分析了L1,L2高速缓存缺失作为影响性能的关键因素是怎样影响程序性能的. 展开更多
关键词 性能分析 cache缺失 主成分分析 线性回归 SPEC cpu2006
下载PDF
高性能计算机系统中可视化负载信息的获取及性能分析工具:THPTii 被引量:5
6
作者 时培植 李三立 孟杰 《小型微型计算机系统》 CSCD 北大核心 2002年第8期902-906,共5页
由于并行应用程序的运行效率往往很低 ,如何帮助程序员提高性能就成为高性能计算中的重要问题 .本文介绍了一个基于 MPI的性能评价工具 ,它可以在应用程序运行的同时收集系统负载信息 ,跟踪程序流程 ,根据硬件资源情况对处理机进行分组 ... 由于并行应用程序的运行效率往往很低 ,如何帮助程序员提高性能就成为高性能计算中的重要问题 .本文介绍了一个基于 MPI的性能评价工具 ,它可以在应用程序运行的同时收集系统负载信息 ,跟踪程序流程 ,根据硬件资源情况对处理机进行分组 ,并将负载信息和程序流程同时以图形方式展示 .程序员可以藉此对并行应用程序运行情况进行监测 ,分析算法执行过程和系统负载的关系 ,找出性能瓶颈 ,发掘应用程序的潜力 ,最终提高应用程序的性能 . 展开更多
关键词 高性能计算机系统 可视化负载信息 性能分析工具 THPTii cpu
下载PDF
网格环境中节点CPU负载的分形预测 被引量:3
7
作者 张飞 曾国荪 《计算机科学》 CSCD 北大核心 2006年第8期61-63,79,共4页
网格环境下,常常需要知道网格资源在未来某一时刻具有什么样的性能,比如,调度器需要该性能估测以便进行高效的资源调度、提供满足要求的QoS以及保证整个网格系统的负载平衡。正如在其他任何计算环境中一样,计算能力是所有网格资源中最... 网格环境下,常常需要知道网格资源在未来某一时刻具有什么样的性能,比如,调度器需要该性能估测以便进行高效的资源调度、提供满足要求的QoS以及保证整个网格系统的负载平衡。正如在其他任何计算环境中一样,计算能力是所有网格资源中最为重要的资源,通常用CPU负载来刻画节点主机的忙碌程度、衡量节点所能提供的计算能力。已有的研究表明CPU负载具有自相似性和长相关性,这启发我们使用本文介绍的分形的方法进行CPU负载的预测。实验结果证明该方法具有较高的预测精度,因而具有较好的实用价值。 展开更多
关键词 网格 资源性能 cpu负载 分形 预测
下载PDF
体系结构模拟器在处理器设计过程中的作用 被引量:5
8
作者 张乾龙 侯锐 +2 位作者 杨思博 赵博彦 张立新 《计算机研究与发展》 EI CSCD 北大核心 2019年第12期2702-2719,共18页
随着摩尔定律趋于终结,处理器性能的提升越来越依赖于处理器微体系结构的优化改良,而处理器微体系结构的优化改良离不开体系结构模拟器的辅助,因此体系结构模拟器在现代和未来的高性能处理器设计中的作用越来越重要.具体地,体系结构模... 随着摩尔定律趋于终结,处理器性能的提升越来越依赖于处理器微体系结构的优化改良,而处理器微体系结构的优化改良离不开体系结构模拟器的辅助,因此体系结构模拟器在现代和未来的高性能处理器设计中的作用越来越重要.具体地,体系结构模拟器可以辅助进行处理器微结构探索、芯片逻辑验证、硅后验证环境搭建、系统软件开发等工作.首先,介绍了开源模拟器与处理器设计的关系,并指出开源模拟器在辅助进行处理器设计方面的不足,同时对处理器厂商使用模拟器辅助进行处理器设计的方法和经验进行了分析总结.其次,对用于处理器微结构优化和改进的性能模拟器的校准方法进行了总结,然后对模拟器的纵向和横向优化方法进行了总结.最后,对新型异构模拟器进行了总结,并对未来模拟器的发展和基于模拟器进行处理器设计的方法进行了总结和展望. 展开更多
关键词 处理器设计 模拟器 性能评估 性能建模 高性能计算 异构模拟器 模拟器校准 量化分析
下载PDF
基于CPU微架构人工智能任务性能优化的策略研究
9
作者 王逸之 《软件》 2024年第9期121-123,共3页
本文针对人工智能相关任务的需求,提出对CPU微架构的优化方案。通过对CPU流水线的优化,避免了分支预测可能失败的情况,提高了计算人工智能相关任务中需CPU执行部分的执行效率。
关键词 cpu微架构 人工智能 性能优化
下载PDF
ANSYS和Abaqus软件GPU加速性能典型算例测试与分析 被引量:3
10
作者 王惠 郭培卿 陈小龙 《计算机工程与科学》 CSCD 北大核心 2013年第11期105-110,共6页
在高性能计算领域,CPU/GPU异构协同处理技术已经成为快速获得计算结果的有效手段之一。典型结构力学计算软件ANSYS和Abaqus最新版本中加入了CPU/GPU协同处理技术,以进一步提高问题的求解效率。利用NVIDIA公司Tesla系列M2090GPU和上海超... 在高性能计算领域,CPU/GPU异构协同处理技术已经成为快速获得计算结果的有效手段之一。典型结构力学计算软件ANSYS和Abaqus最新版本中加入了CPU/GPU协同处理技术,以进一步提高问题的求解效率。利用NVIDIA公司Tesla系列M2090GPU和上海超级计算中心"蜂鸟"超级计算平台,通过求解典型结构问题,对ANSYS和Abaqus软件在开启GPU加速功能前后对求解效率的影响进行了对比和分析。结果表明,当并行规模低于16核时,GPU加速能够不同程度地减少各类结构问题的求解时间,但加速效果随着并行规模的增加逐渐减弱,多GPU协同求解对加速性能的提高并不明显,在实际应用中,需要结合问题类型以及当前硬件架构选择合适的并行方式和协同处理模式。 展开更多
关键词 cpu GPU 协同处理 加速性能 高性能计算
下载PDF
一种基于收敛策略的国产CPU性能测试模型 被引量:3
11
作者 马跃 柴安颖 +3 位作者 尹震宇 李明时 王春晓 李锁 《小型微型计算机系统》 CSCD 北大核心 2020年第1期92-97,共6页
测试国产高性能处理器,充分掌握国产处理器性能,对发挥国产CPU在我国重要工控领域的核心作用具有极其重要的作用.本文依托"核高基"国家科技重大专项,针对当前国产CPU软件库支持欠缺,各类基准测试集无法对国产处理器实现更为... 测试国产高性能处理器,充分掌握国产处理器性能,对发挥国产CPU在我国重要工控领域的核心作用具有极其重要的作用.本文依托"核高基"国家科技重大专项,针对当前国产CPU软件库支持欠缺,各类基准测试集无法对国产处理器实现更为精准的性能评估的问题,提出一种基于收敛策略的国产CPU性能测试模型,设计起始运算规模评估模块,并采用三种模块综合评估处理器浮点运算性能,提高测试指标的准确性,运用模型良好的可移植性与测试方法的收敛性,在不同指令集架构的国产处理器下,实现CPU浮点运算、整数运算等多种性能的综合评估.本文选取龙芯2H1000和北大众志PKUnity-3-HD65分别进行模型验证,实验结果表明,该模型在评估国产CPU性能方面具备全面性与高效性,尤其在浮点性能评估方面优势明显,测试结果能够客观反映两款处理器性能,确保了嵌入式处理器在项目应用中的可预测性,对于数控及工控装置国产化具有重要意义. 展开更多
关键词 cpu 测试模型 运算规模 收敛性 性能测试
下载PDF
电机控制系统核心芯片的比较 被引量:2
12
作者 汤晓燕 《沙洲职业工学院学报》 2008年第1期8-11,共4页
介绍了高性能电机控制策略的发展趋势,针对电机控制策略的要求,对IRMCF341控制系统、TMS320LF2407控制系统、dSPASE控制系统等三种CPU类型的高性能电机控制系统分别介绍并进行了对比,为电机控制系统的设计提供了参考。
关键词 电机控制系统 cpu 高性能
下载PDF
基于龙芯2号处理器的SPEC 2000测试程序的分析与应用 被引量:3
13
作者 王全胜 《现代电子技术》 2010年第17期202-204,共3页
为了对我国自主研发的龙芯2号处理器的性能进行评价,获取龙芯2号处理器性能的客观数据。提出一种针对龙芯2号处理器的采用由国际标准性能评测组织开发的、专门用于评价CPU性能的SPEC CPU2000测试程序的测试和分析的方法。该方法包括在Li... 为了对我国自主研发的龙芯2号处理器的性能进行评价,获取龙芯2号处理器性能的客观数据。提出一种针对龙芯2号处理器的采用由国际标准性能评测组织开发的、专门用于评价CPU性能的SPEC CPU2000测试程序的测试和分析的方法。该方法包括在Linux操作系统下安装和配置SPEC 2000程序的要点和使用SPEC 2000程序对龙芯2E处理器进行性能测试的具体流程,还包括对SPEC 2000程序运行结果的分析。目前该方法已经应用,效果良好。 展开更多
关键词 龙芯2号 处理器 SPEC 2000 性能测试
下载PDF
CK·CORE嵌入式CPU调试器设计 被引量:3
14
作者 任彧 孙康 周旭 《微电子学与计算机》 CSCD 北大核心 2004年第12期38-41,45,共5页
调试嵌入式系统的软件是在系统开发中最为耗时的工作,软件占的比例也逐渐增加,已逐渐成为嵌入式系统产品上市时间重要因素,功能强大的调试器能缩短上市时间,保证开发产品质量。本文提出了一种基于片上仿真方式的调试器,为避免扫描链方... 调试嵌入式系统的软件是在系统开发中最为耗时的工作,软件占的比例也逐渐增加,已逐渐成为嵌入式系统产品上市时间重要因素,功能强大的调试器能缩短上市时间,保证开发产品质量。本文提出了一种基于片上仿真方式的调试器,为避免扫描链方法的问题,采用映像寄存器方式实现,增加了灵活性和可移植性,采用了一种远程代理结构,对自主知识产权的32位高性能嵌入式芯片CK·CORE的设计进行调试,并给出了与其它调试方式相比较的实验结果。 展开更多
关键词 嵌入式处理器 调试器 高性能 扫描链 代理服务器
下载PDF
BESⅢ离线软件的性能研究 被引量:1
15
作者 张晓梅 孙功星 《核电子学与探测技术》 CAS CSCD 北大核心 2011年第3期297-301,共5页
BESⅢ离线软件系统的性能监测和分析,对优化BESⅢ离线软件,提高CPU和内存利用率具有重要的意义。基于Gaudi框架提出并实现了一套切实可行的性能监测服务,并利用该服务对BESⅢ的模拟和重建过程进行了性能检测和分析。
关键词 BESⅢ 软件性能 cpu 内存TP 319
下载PDF
AMD Athlon X2 5000开核特性研究 被引量:1
16
作者 蒋国松 吴功才 《计算机时代》 2010年第6期42-45,共4页
AMD部分CPU可以开核是近来计算机硬件界的热门话题。文章以AMD Athlon X2 5000 CPU为例,对AMD CPU开核特性进行研究。实测表明,AMD Athlon X2 5000开核后各项性能比开核前大幅提高,开四核效果明显。该研究结果对当前计算机用户选购和使... AMD部分CPU可以开核是近来计算机硬件界的热门话题。文章以AMD Athlon X2 5000 CPU为例,对AMD CPU开核特性进行研究。实测表明,AMD Athlon X2 5000开核后各项性能比开核前大幅提高,开四核效果明显。该研究结果对当前计算机用户选购和使用AMD CPU具有指导意义。 展开更多
关键词 AMD ATHLON X2 5000 开核 cpu 性能测试
下载PDF
计算机硬件前沿技术综述 被引量:1
17
作者 李炳臻 孙涛 姜文志 《计算机时代》 2019年第12期15-18,共4页
文章以目前市场上处理速度最快的CPU、存取速度最快的存储设备以及四类人工智能芯片为研究对象,分析其性能指标、架构特点以及四类AI芯片的发展历程和优缺点,并指出了下一阶段计算机硬件技术的发展趋势。
关键词 cpu 存储设备 AI芯片 性能指标
下载PDF
基于HP集群地震处理软件调优技术研究 被引量:1
18
作者 付喜春 王景德 +2 位作者 吴显凤 李雪岩 陈建宁 《石油管材与仪器》 2020年第3期15-17,共3页
随着地震处理方法的创新和技术进步,需要更多的计算机资源,更强的集群运算能力,和更高的CPU利用率与之相匹配。针对Intel处理器平台运行地震处理并行作业运算效率低、集群节点网络带宽瓶颈等问题,科学制订了集群处理软件集成安装方案,... 随着地震处理方法的创新和技术进步,需要更多的计算机资源,更强的集群运算能力,和更高的CPU利用率与之相匹配。针对Intel处理器平台运行地震处理并行作业运算效率低、集群节点网络带宽瓶颈等问题,科学制订了集群处理软件集成安装方案,并在此基础上,对集群节点网络升级、并行队列配置调优,大幅度提升了并行作业运算效率,保证有限的计算机资源得到充分的利用,对提高集群利用率和地震资料处理软件工作效率具有一定借鉴意义。 展开更多
关键词 内存访问效率 cpu利用率 并行队列 性能调优
下载PDF
并行计算性能的“双流”分析 被引量:1
19
作者 乔香珍 《计算机科学》 CSCD 北大核心 2001年第10期7-12,共6页
The generalized speed-up is estimated according to the "double-stream" analyses. The term"decreasing ratio" is used to describe the influence of the hierarchical memory and the characteristics of p... The generalized speed-up is estimated according to the "double-stream" analyses. The term"decreasing ratio" is used to describe the influence of the hierarchical memory and the characteristics of parallel application on the performance. The optimization principles for parallel computation are also given. 展开更多
关键词 并行计算机 并行计算性能 双流分析 cpu
下载PDF
浅谈HPUX日常维护经验
20
作者 程斌华 《铁路计算机应用》 2011年第10期56-57,共2页
简要介绍了小型机系统可靠、安全、稳定运行所需的日常维护内容及方法,通过对实际工作经验的总结,对小型机HPUX操作系统下日志文件、文件系统占用率、CPU和内存、I/O输入输出等进行分析和阐述。对小型机系统的日常维护有一定的参考借鉴... 简要介绍了小型机系统可靠、安全、稳定运行所需的日常维护内容及方法,通过对实际工作经验的总结,对小型机HPUX操作系统下日志文件、文件系统占用率、CPU和内存、I/O输入输出等进行分析和阐述。对小型机系统的日常维护有一定的参考借鉴作用。 展开更多
关键词 小型机 cpu 内存 性能
下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部