期刊文献+
共找到290篇文章
< 1 2 15 >
每页显示 20 50 100
气体裂变产物^(88)Kr的放化分离方法 被引量:9
1
作者 杨志红 张生栋 +3 位作者 杨磊 丁有钱 孙宏清 马鹏 《核化学与放射化学》 CAS CSCD 北大核心 2012年第5期269-274,共6页
为了制备满足88Kr核参数测量的样品,本工作研究了88Kr的放化分离方法。以85Kr、125Xe为放射性示踪剂研究了活性炭柱对Kr和Xe的吸附分离条件。结果显示,在0℃下Xe能被活性炭柱快速吸附而Kr不吸附。研制了一套适用于短寿命气体裂变产物分... 为了制备满足88Kr核参数测量的样品,本工作研究了88Kr的放化分离方法。以85Kr、125Xe为放射性示踪剂研究了活性炭柱对Kr和Xe的吸附分离条件。结果显示,在0℃下Xe能被活性炭柱快速吸附而Kr不吸附。研制了一套适用于短寿命气体裂变产物分离的装置系统,使用辐照的铀靶进行了88Kr样品的分离。Kr的收率大于90%,Xe及I的去污因子大于1×104,整个操作过程可在5min内完成。 展开更多
关键词 88Kr 活性炭 分离
下载PDF
科学计算应用程序单核指令级优化研究 被引量:4
2
作者 罗红兵 张晓霞 +1 位作者 王伟 武林平 《计算机研究与发展》 EI CSCD 北大核心 2014年第6期1263-1269,共7页
尽管高性能计算机性能提升越来越快,但科学计算应用程序获得同步的性能提升是很困难的.提高科学计算应用程序的执行性能,需要依照高性能计算机体系结构的特点进行针对性的优化,其中单核指令级优化是科学计算应用程序性能优化的重要方面... 尽管高性能计算机性能提升越来越快,但科学计算应用程序获得同步的性能提升是很困难的.提高科学计算应用程序的执行性能,需要依照高性能计算机体系结构的特点进行针对性的优化,其中单核指令级优化是科学计算应用程序性能优化的重要方面之一.以基于JASMIN(J adaptive structured meshes applications infrastructure)框架实现的Euler程序为例,探讨了科学计算应用程序在Intel Xeon微处理器平台上的具体性能问题和指令级并行性能优化方法,并较大幅度地优化了Euler程序的单核性能.程序优化后,二维和三维两个物理模型计算的总运行时间比优化前减少了21%~34%,核心模块Gas1dapproxy的执行时间缩短了50%以上.性能优化实验表明:流水线效率已成为影响科学计算类实际应用程序计算效率的重要因素,需要通过降低计算语句的依赖度、减少长延迟计算数量等方法予以改进. 展开更多
关键词 性能分析 性能优化 xeon 指令级优化 科学计算程序
下载PDF
自洽场方法在Xeon Phi上的并行实现 被引量:1
3
作者 万波 魏帆 金钟 《科研信息化技术与应用》 2014年第2期34-42,共9页
量子化学中,随着分子体系或所用基组的增大,计算量将显著增长。如何提高量子化学计算中的计算效率一直是研究的热点。随着计算机科学的发展,发挥计算机的多核优势提高量子化学的计算效率成为当前量子化学软件的通用方法。本文实现了自... 量子化学中,随着分子体系或所用基组的增大,计算量将显著增长。如何提高量子化学计算中的计算效率一直是研究的热点。随着计算机科学的发展,发挥计算机的多核优势提高量子化学的计算效率成为当前量子化学软件的通用方法。本文实现了自洽场方法 (Self-Consistent Field method,SCF)的单点能计算的OpenMP并行,并探索实现了在Intel Xeon Phi协处理器上的OpenMP并行方法。 展开更多
关键词 量子化学 SCF 单点能 OPENMP xeon PHI 并行
原文传递
Memory Efficient Two-Pass 3D FFT Algorithm for Intel~ Xeon Phi^(TM) Coprocessor 被引量:2
4
作者 刘益群 李焱 +1 位作者 张云泉 张先轶 《Journal of Computer Science & Technology》 SCIE EI CSCD 2014年第6期989-1002,共14页
Equipped with 512-bit wide SIMD inst d large numbers of computing cores, the emerging x86-based Intel(R) Many Integrated Core (MIC) Architecture ot only high floating-point performance, but also substantial ... Equipped with 512-bit wide SIMD inst d large numbers of computing cores, the emerging x86-based Intel(R) Many Integrated Core (MIC) Architecture ot only high floating-point performance, but also substantial off-chip memory bandwidth. The 3D FFT (three-di fast Fourier transform) is a widely-studied algorithm; however, the conventional algorithm needs to traverse the three times. In each pass, it computes multiple 1D FFTs along one of three dimensions, giving rise to plenty of rided memory accesses. In this paper, we propose a two-pass 3D FFT algorithm, which mainly aims to reduce of explicit data transfer between the memory and the on-chip cache. The main idea is to split one dimension into ensions, and then combine the transform along each sub-dimension with one of the rest dimensions respectively erence in amount of TLB misses resulting from decomposition along different dimensions is analyzed in detail. el parallelism is leveraged on the many-core system for a high degree of parallelism and better data reuse of loc On top of this, a number of optimization techniques, such as memory padding, loop transformation and vectoriz employed in our implementation to further enhance the performance. We evaluate the algorithm on the Intel(R) PhiTM coprocessor 7110P, and achieve a maximum performance of 136 Gflops with 240 threads in offload mode, which ts the vendor-specific Intel(R)MKL library by a factor of up to 2.22X. 展开更多
关键词 3D-FFT memory efficie many-core Many Integrated Core Intel(R) xeon PhiTM
原文传递
基于Intel Xeon Phi的稀疏矩阵向量乘性能优化 被引量:1
5
作者 张爱民 安虹 +3 位作者 姚文军 梁伟浩 江霞 李丰 《小型微型计算机系统》 CSCD 北大核心 2016年第4期818-823,共6页
稀疏矩阵向量乘(Sp MV)是线性求解系统等科学计算中重要的计算核心.鉴于传统的稀疏矩阵向量乘算法在Intel Xeon Phi众核集成架构上存在SIM D利用率低,不规则访存开销高及负载不均衡的问题,难以发挥其运算能力.本文针对Intel Xeon Phi的... 稀疏矩阵向量乘(Sp MV)是线性求解系统等科学计算中重要的计算核心.鉴于传统的稀疏矩阵向量乘算法在Intel Xeon Phi众核集成架构上存在SIM D利用率低,不规则访存开销高及负载不均衡的问题,难以发挥其运算能力.本文针对Intel Xeon Phi的体系结构特点,提出了一种通用的分块压缩存储表示的稀疏矩阵向量乘并行算法:(1)在ELLPACK存储格式基础上按列分块及压缩矩阵,增加非零元的密度,提高SIMD利用率;(2)通过精心的数据重排,保留矩阵非零元本身的局部性,从而提高数据重用率,降低访存开销;(3)将矩阵压缩后划分成近似等大的矩阵块并静态等量分配到不同核上计算,使各核负载均衡.实验结果表明,与Intel Xeon Phi上已有的MKL数学库中的CSR算法相比,本算法获得了更高的计算访存比,性能比M KL的CSR算法平均快2.05倍. 展开更多
关键词 稀疏矩阵向量乘 数据布局重组 INTEL xeon PHI 分块压缩存储
下载PDF
利用Stencil建模及评估Intel IMCI vgather指令 被引量:1
6
作者 林新华 王一超 +3 位作者 秦强 李硕 文敏华 松岡聡 《计算机工程与科学》 CSCD 北大核心 2016年第9期1741-1747,共7页
Intel Xeon Phi协处理器的指令集IMCI引入了硬件实现的vgather指令,旨在帮助512位SIMD寄存器访问非连续内存地址上的数据。然而实验结果显示,vgather很有可能成为应用在Xeon Phi协处理器上关键的性能瓶颈之一。基于以上结论,针对vgathe... Intel Xeon Phi协处理器的指令集IMCI引入了硬件实现的vgather指令,旨在帮助512位SIMD寄存器访问非连续内存地址上的数据。然而实验结果显示,vgather很有可能成为应用在Xeon Phi协处理器上关键的性能瓶颈之一。基于以上结论,针对vgather的性能建模可以帮助用户深入地掌握和理解Xeon Phi协处理器的性能特性。在实验方法上,本文方法与现存的通过程序段内嵌入汇编代码进行数据统计不同,使用PAPI等性能分析工具直接收集硬件计数器的统计结果,作为模型的实验数据。本文的性能模型基于AGI事件次数和根据VPU_DATA_READ次数估算得出的vgather所导致的平均延迟构建而成。该模型能够对Xeon Phi应用代码中由vgather所导致的总延迟进行预测。最终,为了验证模型预测的准确性,将该模型应用在三维7点stencil应用代码上,预测结果显示,vgather耗时占计算总耗时的约40%。再将该结果与利用intrinsics指令去除vgather后的计算耗时进行了对比验证,结果显示模型预测准确。基于上述结论,采用硬件计数器的统计结果在Xeon Phi协处理器上针对vgather构建了性能模型。同时,通过与其他平台的vgather对比,认为该模型也可以应用在同样具备vgather的Intel CPU处理器平台上。 展开更多
关键词 性能建模 vgather xeon PHI 硬件计数器
下载PDF
共轭梯度法在GPU及Xeon Phi下的并行优化及比较 被引量:1
7
作者 黄敏 丁萍 罗海飚 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2015年第11期35-46,53,共13页
为了充分利用多核处理器的强大计算能力并满足具有高并行度应用的需求,提出一种基于大规模稀疏矩阵特征问题求解的并行共轭梯度算法.对图形处理器(GPU)上的计算,有效利用GPU多层次的存储器体系,采用线程与矩阵映射、数据合并访问、数据... 为了充分利用多核处理器的强大计算能力并满足具有高并行度应用的需求,提出一种基于大规模稀疏矩阵特征问题求解的并行共轭梯度算法.对图形处理器(GPU)上的计算,有效利用GPU多层次的存储器体系,采用线程与矩阵映射、数据合并访问、数据复用等优化手段,并通过高效的线程调度来隐藏全局存储器的高延迟访问;对Xeon Phi处理器上的计算,有效利用Xeon Phi的高并行度计算对数据通信/传递、减少数据依赖、向量化、异步计算等进行优化,并通过高效的线程调度来隐藏全局存储器的高延迟访问.文中还通过实验验证了算法的可行性和正确性,并对比了不同方式下的运行效率,发现共轭梯度法在GPU下比在Xeon Phi下的加速效果更好. 展开更多
关键词 共轭梯度法 图形处理器 xeon PHI 并行优化 稀疏矩阵向量乘
下载PDF
Xeon Phi平台上基于模板优化的3D GVF场计算加速 被引量:1
8
作者 齐金 李宽 +1 位作者 杨灿群 杜云飞 《计算机工程与科学》 CSCD 北大核心 2014年第8期1435-1440,共6页
3D梯度向量流场(3DGVF field)广泛应用于多种3D图像分析算法中,其计算需要多次迭代,计算量大,如何提高其计算速度具有重要的研究意义。面向Intel Xeon Phi众核集成架构,首次进行了3DGVF场计算的加速优化。首先,挖掘3D图像像素点间存在... 3D梯度向量流场(3DGVF field)广泛应用于多种3D图像分析算法中,其计算需要多次迭代,计算量大,如何提高其计算速度具有重要的研究意义。面向Intel Xeon Phi众核集成架构,首次进行了3DGVF场计算的加速优化。首先,挖掘3D图像像素点间存在的天然并行性,发挥众核架构优势,尝试线程级并行(多核)和数据级并行(SIMD)。其次,3DGVF场的计算过程是一种典型的3D-7点模板运算,结合Xeon Phi架构的L2缓存规格,提出一种高效的数据分块策略,充分挖掘数据的时/空局部性,有效缓解模板计算引起的缓存缺失,提升了计算性能。实验结果表明,引入模板优化技术能显著提升3D GVF场的计算速度,在图像维度为5123时,所提方法在57核Xeon Phi平台上的性能相比在2.6GHz 8核16线程的Intel Xeon E5-2670CPU上的性能,加速比可达2.77。 展开更多
关键词 3D梯度向量流场 xeon PHI 模板优化 缓存分块
下载PDF
基于Intel Xeon Phi的激光等离子体粒子模拟研究 被引量:1
9
作者 姚文科 杜云飞 +1 位作者 吴强 杨灿群 《计算机工程与科学》 CSCD 北大核心 2014年第5期809-813,共5页
激光等离子体粒子模拟广泛用于探索极端物质状态下的科学问题。将一种基于粒子云网格方法的三维等离子体粒子模拟程序LARED-P移植到Intel Xeon Phi协处理器上。在移植的过程中,综合运用了Native和Offload两种编程模式:首先运用Native模... 激光等离子体粒子模拟广泛用于探索极端物质状态下的科学问题。将一种基于粒子云网格方法的三维等离子体粒子模拟程序LARED-P移植到Intel Xeon Phi协处理器上。在移植的过程中,综合运用了Native和Offload两种编程模式:首先运用Native模式对LARED-P程序中热点计算任务进行优化研究,通过采用SIMD扩展指令使该计算任务获得了4.61倍的加速;然后运用Offload模式将程序移植到CPU-Intel Xeon Phi异构系统上,并通过使用异步数据传输和双缓冲技术分别提升了程序性能9.8%和21.8%。 展开更多
关键词 LARED-P INTEL xeon PHI Native模式 Offload模式 512位SIMD扩展指令 异步数据传输 双缓冲
下载PDF
Java虚拟机在Intel众核架构下的动态数据预取研究与优化 被引量:1
10
作者 余炀 臧斌宇 《小型微型计算机系统》 CSCD 北大核心 2016年第11期2391-2396,共6页
Intel Xeon Phi协处理器作为现阶段极具代表性的众核产品之一,为应用程序提供了强大的硬件环境和计算资源.然而,Xeon Phi所采用的内存设计存在高访问延迟的问题,因此非常依赖于缓存数据预取技术以提升访存性能.而Java作为一门具有自动... Intel Xeon Phi协处理器作为现阶段极具代表性的众核产品之一,为应用程序提供了强大的硬件环境和计算资源.然而,Xeon Phi所采用的内存设计存在高访问延迟的问题,因此非常依赖于缓存数据预取技术以提升访存性能.而Java作为一门具有自动内存管理且被广泛使用的语言,现有设计并未针对于Xeon Phi架构采取访存相关的优化.本文详细地研究了Xeon Phi上的缓存预取机制,并在Hot Spot虚拟机内部设计实现了一套动态的运行时缓存预取解决方案,该方案相比传统的静态方法和现有动态预取方案更适合于Xeon Phi众核架构及Java动态语言环境.本文通过实验表明,该动态预取方案在Xeon Phi众核平台上可以带来平均2.5倍的单线程加速比以及40%的多线程最优性能提升. 展开更多
关键词 xeon Phi众核架构 JAVA虚拟机 数据预取
下载PDF
基于Intel Xeon 5410处理器的刀片服务器概述
11
作者 孙杰 《电子技术(上海)》 2012年第6期48-49,44,共3页
刀片服务器是目前服务器发展的趋势,具有众多优势。文章分析了一种基于Inter Xeon 5410处理器的刀片服务器组成,并重点对刀片服务器的硬件组成、计算刀片构架、硬件互联网络、软件监控管理、数据库管理等关键内容进行了介绍。
关键词 INTER xeon 5410处理器 刀片服务器
原文传递
基于Xeon Phi平台的波动方程叠前深度偏移
12
作者 杨祥森 金君 +2 位作者 王鹏 马召贵 亢永敢 《计算机工程与科学》 CSCD 北大核心 2015年第5期907-913,共7页
波动方程叠前深度偏移适用于强横向变速介质,是一种高精度成像方法,但其巨大的计算量阻碍了该技术的应用。Xeon Phi是一种全新的高性能计算设备,为波动方程叠前深度偏移方法的推广应用提供了新的技术支持。以裂步傅里叶算子为例,介绍了... 波动方程叠前深度偏移适用于强横向变速介质,是一种高精度成像方法,但其巨大的计算量阻碍了该技术的应用。Xeon Phi是一种全新的高性能计算设备,为波动方程叠前深度偏移方法的推广应用提供了新的技术支持。以裂步傅里叶算子为例,介绍了面向Xeon Phi平台的偏移算法移植和优化方法,即采用offload模式将计算核函数加载到Xeon Phi设备上,在Xeon Phi协处理器上采用多线程方式,并且调整程序结构,充分利用SIMD矢量引擎提高向量化处理效率。扩展负载动态均衡的并行框架,形成了一套适用于大规模异构系统、基于Xeon Phi平台的波动方程叠前深度偏移软件。实际数据测试表明Xeon Phi平台可以极大地提高地震偏移处理效率,具有良好的可扩展性。 展开更多
关键词 xeon Phi平台 波动方程叠前深度偏移 裂步傅里叶算子 并行框架 offload模式
下载PDF
Intel Pentium Ⅲ Xeon Coppermine曝光
13
作者 小玩子 《电脑硬件(现代电子技术)》 2000年第1期15-16,共2页
关键词 微处理器 INTEL PentiumⅢ xeon COPPERMINE
下载PDF
企业动向
14
《工业控制计算机》 2006年第5期85-87,共3页
风河公司宣布支持Intel Xeon LV 2.0GHz双内核处理器;罗克韦尔自动化在上海设立工业控制开关业务全球总部;
关键词 罗克韦尔自动化 企业 INTEL 风河公司 xeon 控制开关 研华科技 处理器 双内核 PAC
下载PDF
巧建企业级核心应用
15
作者 e刀客 《中国计算机用户》 2003年第37期15-19,共5页
随着英特尔32位服务器CPU策略向至强偏移,目前声场上IA32服务器基本上已是至强的天下。至强处理器有双路和多路之分,也即XEON DP和XEON MP。在众多至强服务器中,4路至强服务器又占着重要的地位,因为它的性能足以胜任企业级用户和行业用... 随着英特尔32位服务器CPU策略向至强偏移,目前声场上IA32服务器基本上已是至强的天下。至强处理器有双路和多路之分,也即XEON DP和XEON MP。在众多至强服务器中,4路至强服务器又占着重要的地位,因为它的性能足以胜任企业级用户和行业用户的关键应用。 展开更多
关键词 至强服务器 xeon 至强处理器 企业级用户 CPU 英特尔 DP 行业用户 市场 策略
下载PDF
每月新技术之星
16
作者 台风 《个人电脑》 2005年第11期174-179,共6页
关键词 IT技术 CACHE技术 嵌入式处理器 XSCALE 移动平台 微处理器 启动速度 加速系统 技术革新 xeon
下载PDF
透视掌上设备的大脑 走进“另类处理器”的世界
17
作者 韩思维 《微型计算机》 北大核心 2006年第12期162-166,共5页
如果眼前出现“处理器”这三个字,你会想到什么呢?许多朋友本能地会在及海中闪过Xeon、Pentium又或者是Operton、Athion 64等等。
关键词 处理器 掌上设备 PENTIUM xeon 电脑
下载PDF
每月新技术之星
18
作者 罗强 《个人电脑》 2006年第1期228-230,共3页
关键词 PENTIUM 市场竞争力 AMD公司 产品优势 xeon 英特尔 处理器 产品线
下载PDF
PhiBench 2.0: characterizing data analytics workloads on Intel Knights Landing
19
作者 Xie Biwei Zhan Jianfeng +1 位作者 Wang Lei Zhang Lixin 《High Technology Letters》 EI CAS 2019年第2期121-128,共8页
With high computational capacity, e.g. many-core and wide floating point SIMD units, Intel Xeon Phi shows promising prospect to accelerate high-performance computing(HPC) applications. But the application of Intel Xeo... With high computational capacity, e.g. many-core and wide floating point SIMD units, Intel Xeon Phi shows promising prospect to accelerate high-performance computing(HPC) applications. But the application of Intel Xeon Phi on data analytics workloads in data center is still an open question. Phibench 2.0 is built for the latest generation of Intel Xeon Phi(KNL, Knights Landing), based on the prior work PhiBench(also named BigDataBench-Phi), which is designed for the former generation of Intel Xeon Phi(KNC, Knights Corner). Workloads of PhiBench 2.0 are delicately chosen based on BigdataBench 4.0 and PhiBench 1.0. Other than that, these workloads are well optimized on KNL, and run on real-world datasets to evaluate their performance and scalability. Further, the microarchitecture-level characteristics including CPI, cache behavior, vectorization intensity, and branch prediction efficiency are analyzed and the impact of affinity and scheduling policy on performance are investigated. It is believed that the observations would help other researchers working on Intel Xeon Phi and data analytics workloads. 展开更多
关键词 Intel xeon Phi data analytics workloads characterization Knights Landing(KNL) many core x86 processors
下载PDF
服务器期待双核
20
作者 张越 《个人电脑》 2005年第12期103-110,112,114-116,118-121,共16页
对于服务器的应用、采购以及技术特点,我们已经在上期的文章中有所阐述。本期的服务器专题将以介绍产品以及测试成绩为主。在本月的服务器专题测试中,我们共收到9款服务器产品,其中3款为塔式服务器,其它6款均为机架服务器。这些产品中... 对于服务器的应用、采购以及技术特点,我们已经在上期的文章中有所阐述。本期的服务器专题将以介绍产品以及测试成绩为主。在本月的服务器专题测试中,我们共收到9款服务器产品,其中3款为塔式服务器,其它6款均为机架服务器。这些产品中包括了基于IntelPentium4的低端服务器,也包括了采用IntelXeon双核、IntelXeon、AMDOperon处理器的中高端服务器。 展开更多
关键词 高端服务器 双核技术 INTEL xeon N处理器 硬盘 稳定性
下载PDF
上一页 1 2 15 下一页 到第
使用帮助 返回顶部