期刊文献+
共找到39篇文章
< 1 2 >
每页显示 20 50 100
自主可控计算机设计与实现 被引量:11
1
作者 纪静 屈涛 +2 位作者 金达 吴金哲 王巍 《计算机工程与应用》 CSCD 2013年第15期36-40,55,共6页
在基于国产高性能龙芯3A CPU芯片进行主板研制并成功实现的技术基础上,通过全面总结自主可控主板的软硬件及整机的实现过程,对自我研制主板的各主要功能电路及关键技术进行了详细阐述,对基于国产固件、操作系统进行整机系统的实现以及... 在基于国产高性能龙芯3A CPU芯片进行主板研制并成功实现的技术基础上,通过全面总结自主可控主板的软硬件及整机的实现过程,对自我研制主板的各主要功能电路及关键技术进行了详细阐述,对基于国产固件、操作系统进行整机系统的实现以及针对整机进行的性能测试进行了介绍说明,为国产自主可控计算机的发展提供技术借鉴。 展开更多
关键词 龙芯3A 自主可控 国产化计算机
下载PDF
基于龙芯3A+2H的火控计算机系统设计 被引量:5
2
作者 齐劲松 郭江宇 +1 位作者 吴玉生 王玮冬 《测控技术》 CSCD 北大核心 2014年第7期85-87,101,共4页
结合国产化工程实践需要,介绍了一种新型的基于龙芯3A+2H的火控计算机系统的设计思路与方法,该计算机主要应用于火力控制系统。详述了计算机系统的硬件组成,对高速信号进行了完整性分析,介绍了PMON的启动流程、国产麒麟Linux操作系统内... 结合国产化工程实践需要,介绍了一种新型的基于龙芯3A+2H的火控计算机系统的设计思路与方法,该计算机主要应用于火力控制系统。详述了计算机系统的硬件组成,对高速信号进行了完整性分析,介绍了PMON的启动流程、国产麒麟Linux操作系统内核的移植。经实验证明该系统能满足军用系统的高安全性和可靠性,并且有良好的实时性和实用性的特点。 展开更多
关键词 loongson 3A loongson 2H 麒麟Linux
下载PDF
多核龙芯3A上二级BLAS库的优化 被引量:8
3
作者 李毅 何颂颂 李恺 《计算机系统应用》 2011年第1期163-167,共5页
针对龙芯3A体系结构以及二级BLAS库函数的特点,在指令级、存储级和线程级抽取并行方案,总结了一些合适的优化方法,并对其进行了定量的分析。实验表明,这些优化可以将二级BLAS函数单线程的性能提升20%以上,多线程下也可以得到2.5倍左右... 针对龙芯3A体系结构以及二级BLAS库函数的特点,在指令级、存储级和线程级抽取并行方案,总结了一些合适的优化方法,并对其进行了定量的分析。实验表明,这些优化可以将二级BLAS函数单线程的性能提升20%以上,多线程下也可以得到2.5倍左右的加速比,这对今后多核龙芯上的系统软件优化工作有着一定的帮助。 展开更多
关键词 龙芯3A BLAS 优化 Gemv GER 访存 多线程
下载PDF
龙芯3A平台Vxworks移植的研究和实现 被引量:6
4
作者 王雷 樊晓桠 王党辉 《微电子学与计算机》 CSCD 北大核心 2012年第2期86-90,共5页
龙芯3A处理器具有高性能低功耗的优点,在高性能计算、个人桌面应用、工业控制、高性能嵌入式等领域都有广阔的应用前景.目前龙芯系列平台大都是基于Linux系统,但在工业控制、高性能嵌入式等领域,高实时性和高可靠性的VxWorks才是比较理... 龙芯3A处理器具有高性能低功耗的优点,在高性能计算、个人桌面应用、工业控制、高性能嵌入式等领域都有广阔的应用前景.目前龙芯系列平台大都是基于Linux系统,但在工业控制、高性能嵌入式等领域,高实时性和高可靠性的VxWorks才是比较理想的选择.在分析了VxWorks移植的主要内容基础上,详细研究了龙芯3A的VxWorks移植方法.针对具体工业应用,设计了一种基于龙芯3A的工控平台,并实现了对该平台的VxWorks移植.经过在龙芯3A开发板上的验证是可行的. 展开更多
关键词 龙芯3A VXWORKS系统 板级支持包BSP 系统移植
下载PDF
龙芯3A处理器上FFT的高效实现 被引量:6
5
作者 郭利财 刘燕君 《小型微型计算机系统》 CSCD 北大核心 2012年第3期594-597,共4页
FFT(Fast Fourier transform,快速傅立叶变换)是工程应用中的一个基本算法,优化其性能对于推广龙芯系列处理器的应用具有重要意义.本文充分挖掘龙芯3A处理器的硬件特性,对运算量和调整位序的过程作了优化并使用128位访存来减少访存指令... FFT(Fast Fourier transform,快速傅立叶变换)是工程应用中的一个基本算法,优化其性能对于推广龙芯系列处理器的应用具有重要意义.本文充分挖掘龙芯3A处理器的硬件特性,对运算量和调整位序的过程作了优化并使用128位访存来减少访存指令的比例,从而实现了高效的FFT算法.实验结果表明,在825M龙芯3A处理器上经过优化后的一维FFT的速度是FF-TW库的2.5倍左右,而二维FFT的速度则是FFTW的3倍左右. 展开更多
关键词 龙芯3A FFT 性能优化 KD-60
下载PDF
基于ACPI标准的龙芯3A平台系统功耗分析 被引量:5
6
作者 顾丽红 吴少刚 《计算机工程与设计》 北大核心 2016年第9期2400-2404,共5页
为从整机系统的角度分析基于自主龙芯CPU的国产计算机功耗水平,对照ACPI标准剖析龙芯3A系统的功耗控制模式,在龙芯平台软件上实现对ACPI的支持,基于龙芯3A便携式计算机系统进行实验测试,分析整机系统在不同节能状态下的功耗数据,实验结... 为从整机系统的角度分析基于自主龙芯CPU的国产计算机功耗水平,对照ACPI标准剖析龙芯3A系统的功耗控制模式,在龙芯平台软件上实现对ACPI的支持,基于龙芯3A便携式计算机系统进行实验测试,分析整机系统在不同节能状态下的功耗数据,实验结果表明,龙芯3A计算机系统的耗能符合国家计算机节能标准,为龙芯计算机系统的热设计和国产自主计算机的节能设计提供了参考。 展开更多
关键词 龙芯3A 高级配置与电源接口 系统功耗 电源管理 节能设计
下载PDF
基于龙芯SIMD技术的H.264视频解码优化 被引量:5
7
作者 顾丽红 王锐 +1 位作者 陈华才 吴少刚 《计算机工程与设计》 北大核心 2017年第12期3361-3367,3373,共8页
为提高龙芯平台的多媒体处理能力,分析龙芯处理器核GS464/GS464E的LoongSIMD指令系统,提出SIMD指令级优化方法。通过分析FFmpeg的开源H.264解码器的并行特征,结合龙芯处理器的结构并行特点,利用龙芯特有的性能计数器,解析影响性能的热... 为提高龙芯平台的多媒体处理能力,分析龙芯处理器核GS464/GS464E的LoongSIMD指令系统,提出SIMD指令级优化方法。通过分析FFmpeg的开源H.264解码器的并行特征,结合龙芯处理器的结构并行特点,利用龙芯特有的性能计数器,解析影响性能的热点函数,采用手工嵌入龙芯SIMD和访存扩展等汇编指令的方式进行细粒度优化。实验结果表明,该方法使平均性能提高了50%,工作成果已推送到龙芯开源社区,增强了基于龙芯3A处理器的国产计算机在桌面多媒体应用领域的用户体验。 展开更多
关键词 单指令流多数据流 龙芯3A GS464 GS464E微架构 FFmpeg多媒体库 H.264解码优化
下载PDF
VxWorks下龙芯3A中断控制技术的研究 被引量:5
8
作者 徐骞 《现代电子技术》 北大核心 2017年第14期36-39,共4页
中断控制是嵌入式操作系统VxWorks正常运行的基础,是其具有高实时性的保障。针对VxWorks系统下中断控制驱动开发难度大、应用广等特点,首次提出了VxWorks系统中断控制驱动分层模型。基于该模型提出了VxWorks下中断控制驱动软件的设计方... 中断控制是嵌入式操作系统VxWorks正常运行的基础,是其具有高实时性的保障。针对VxWorks系统下中断控制驱动开发难度大、应用广等特点,首次提出了VxWorks系统中断控制驱动分层模型。基于该模型提出了VxWorks下中断控制驱动软件的设计方法,并基于该方法实现了VxWorks下国产龙芯3A处理器中断控制驱动软件的开发。最后提出一种优化龙芯3A中断控制性能的方法,大大缩短了中断响应时间,提高了系统的性能。 展开更多
关键词 中断控制 VXWORKS 龙芯3A 驱动软件
下载PDF
VxWorks系统下CAN驱动的设计与优化 被引量:3
9
作者 尹加豹 朱涛 崔凯华 《计算机工程》 CAS CSCD 北大核心 2020年第3期192-197,共6页
为在VxWorks系统下实现龙芯3A3000主板的控制器局域网(CAN)总线通信,采用SJA1000T设计基于PCI总线的8通道CAN通信板,并提出相应的驱动设计和优化方案。对龙芯3A3000处理器的驱动进行优化,在发送数据时禁用CAN而使用查询方式发送,在接收... 为在VxWorks系统下实现龙芯3A3000主板的控制器局域网(CAN)总线通信,采用SJA1000T设计基于PCI总线的8通道CAN通信板,并提出相应的驱动设计和优化方案。对龙芯3A3000处理器的驱动进行优化,在发送数据时禁用CAN而使用查询方式发送,在接收数据时中断服务程序对所有通道进行遍历查询,以提高中断利用率,在创建设备函数时根据PCI总线信息识别每个CAN通信板,以确保系统中不同CAN通道拥有唯一的通道号。实验结果表明,该驱动方案运行稳定,数据传输安全可靠,经优化后能够有效降低CAN通信板的中断次数,提高CAN总线的通信速率,避免多板环境下故障板卡干扰正常板卡,提高了系统的健壮性。 展开更多
关键词 VXWORKS系统 控制器局域网总线 SJA1000T控制器 龙芯3A 驱动设计
下载PDF
龙芯3A平台上Linux应用程序本地开发环境的实现 被引量:2
10
作者 石扬 杨升春 欧中红 《计算机与数字工程》 2012年第1期135-136,139,共3页
应用于高性能计算和服务器的龙芯3ACPU拥有丰富的资源和优秀的性能。与交叉开发环境相比,在龙芯3A平台上使用本地开发环境进行应用程序的开发会更方便、更高效。基于模拟器Qemu和Debian for MIPS操作系统,在"龙芯3A"平台上成... 应用于高性能计算和服务器的龙芯3ACPU拥有丰富的资源和优秀的性能。与交叉开发环境相比,在龙芯3A平台上使用本地开发环境进行应用程序的开发会更方便、更高效。基于模拟器Qemu和Debian for MIPS操作系统,在"龙芯3A"平台上成功创建了本地开发环境,给出了详细的创建方法与步骤。 展开更多
关键词 龙芯3A 本地开发环境 QEMU DEBIAN
下载PDF
基于MIPS架构的异构内存虚拟化方法研究 被引量:2
11
作者 蔡万伟 台运方 +2 位作者 刘奇 张晓辉 张戈 《高技术通讯》 CAS CSCD 北大核心 2013年第9期908-913,共6页
针对传统的同构内存虚拟化方法缺乏平台扩展性,在非X86处理器平台上性能较差的问题,研究了影响虚拟机内存性能的几个因素,并基于MIPS架构处理器提出了异构内存虚拟化方法,在不增加软件复杂度的前提下,提高了内存虚拟化性能。该方... 针对传统的同构内存虚拟化方法缺乏平台扩展性,在非X86处理器平台上性能较差的问题,研究了影响虚拟机内存性能的几个因素,并基于MIPS架构处理器提出了异构内存虚拟化方法,在不增加软件复杂度的前提下,提高了内存虚拟化性能。该方法基于对同构内存虚拟化的性能瓶颈的分析,通过修改虚拟机内存管理单元(MMU)降低软件维护开销;采用宿主机与客户机共享页表的方法提升访存的异常处理速度。该方法在龙芯3号处理器的系统虚拟机KVM-LOONGSON上得到实现。测试结果表明,该方法可以显著提升各类应用程序的性能,相比同构内存虚拟化方法,性能可以提升50%到700%,达到本地执行性能的71%~97%。 展开更多
关键词 系统虚拟化 内存虚拟化 KVM MIPS 龙芯3号处理器
下载PDF
自主可控便携式计算机设计与实现 被引量:2
12
作者 王巍 吴金哲 +1 位作者 屈涛 纪静 《计算机与现代化》 2014年第4期172-177,共6页
在基于自主可控处理器、固件、操作系统等自主关键软硬件技术成果进行便携式计算机研制并成功实现的技术基础上,全面论述软硬件及整机的设计实现过程,对系统架构、主要功能电路进行详细阐述,对结构的内部布局、减重和加固设计进行介绍,... 在基于自主可控处理器、固件、操作系统等自主关键软硬件技术成果进行便携式计算机研制并成功实现的技术基础上,全面论述软硬件及整机的设计实现过程,对系统架构、主要功能电路进行详细阐述,对结构的内部布局、减重和加固设计进行介绍,并对智能电源管理技术、软硬件适配、散热等关键技术进行重点论述,最后对原理样机的整型和浮点计算性能、系统响应时间、多任务数据交互能力和处理器综合处理能力进行测试验证。 展开更多
关键词 智能电源 龙芯3A 适配 散热设计
下载PDF
基于龙芯3A处理器的加固服务器设计与实现 被引量:2
13
作者 王巍 《工业控制计算机》 2014年第12期69-70,共2页
该加固服务器采用VPX架构,利用双龙芯3A处理器实现NUMA架构服务节点,利用单龙芯3A处理器和双FPGA实现异构计算节点,结合高速交换模块、电源模块、数据装载模块、机箱等共同构建。依据模块化设计思想,该加固服务器模块可根据应用需求扩... 该加固服务器采用VPX架构,利用双龙芯3A处理器实现NUMA架构服务节点,利用单龙芯3A处理器和双FPGA实现异构计算节点,结合高速交换模块、电源模块、数据装载模块、机箱等共同构建。依据模块化设计思想,该加固服务器模块可根据应用需求扩展配置,支持国产中标麒麟操作系统。 展开更多
关键词 龙芯3A 加固服务器 VPX 单一映像
下载PDF
龙芯3A上三个自适应FFT包的对比与分析
14
作者 赵美超 张云泉 +2 位作者 刘益群 李焱 颜深根 《计算机科学》 CSCD 北大核心 2012年第12期281-285,共5页
FFT算法在计算机科学中具有广泛的应用,自适应FFT软件包以其良好的可移植性而备受研究人员和用户的青睐,龙芯3A是中科院计算所自主研发的四核CPU,采用RISC架构,兼容MIPS指令。主要对FFTW,UHFFT,SPIRAL这3类FFT自适应软件包进行研究。首... FFT算法在计算机科学中具有广泛的应用,自适应FFT软件包以其良好的可移植性而备受研究人员和用户的青睐,龙芯3A是中科院计算所自主研发的四核CPU,采用RISC架构,兼容MIPS指令。主要对FFTW,UHFFT,SPIRAL这3类FFT自适应软件包进行研究。首先从搜索框架和代码产生器两方面总结了FFTW和UHFFT的异同,接着阐述了SPIRAL自动产生优化代码的三层架构实现原理,之后在国产CPU龙芯3A上对这3个软件包进行了性能测试,并结合龙芯的体系结构特点对结果作了分析对比。在最后总结了目前自适应FFT软件包的一般方法,为下一步开发自适应FFT软件包提供了思路。 展开更多
关键词 FFTW UHFFT SPIRAL loongson 3A FFT
下载PDF
龙芯3A体系架构下WiFi模块的设计与实现 被引量:1
15
作者 张鹏 《计算机测量与控制》 北大核心 2014年第7期2266-2269,2276,共5页
为提高军用国产计算机的移动计算能力,提出一种在龙芯3A体系架构下WiFi模块的软硬件设计方法;在硬件设计部分,该WiFi模块围绕AR9285芯片展开设计,通过PCI-E总线与北桥进行连接;在软件设计部分,通过在PMON中添加WiFi模块驱动,实现初始化... 为提高军用国产计算机的移动计算能力,提出一种在龙芯3A体系架构下WiFi模块的软硬件设计方法;在硬件设计部分,该WiFi模块围绕AR9285芯片展开设计,通过PCI-E总线与北桥进行连接;在软件设计部分,通过在PMON中添加WiFi模块驱动,实现初始化、数据发送和接收等功能;验证结果表明,移动计算机能够通过WiFi模块远程加载操作系统内核,无线网络数据响应时间约为1.5ms。 展开更多
关键词 移动计算 龙芯3A WI FI 802 11 PMON
下载PDF
NUMA架构的龙芯3A板级设计及工程化技术研究 被引量:1
16
作者 赵东阳 刘瑞 孟英谦 《计算机工程与应用》 CSCD 北大核心 2017年第8期260-266,共7页
针对关键应用对信息处理能力提出的性能要求以及国产化需求,在分析龙芯3A处理器架构特点的基础上,设计了基于NUMA并行处理架构的龙芯3A高性能处理模块,并对抗恶劣环境的关键问题进行了分析和设计,解决了散热、电源监控及供电优化、启动... 针对关键应用对信息处理能力提出的性能要求以及国产化需求,在分析龙芯3A处理器架构特点的基础上,设计了基于NUMA并行处理架构的龙芯3A高性能处理模块,并对抗恶劣环境的关键问题进行了分析和设计,解决了散热、电源监控及供电优化、启动速度等问题。通过测试验证,性能可以满足关键应用对信息处理能力的要求,从而有效解决了龙芯3A访存能力有限的问题。同时对SMP和NUMA架构下,龙芯3A处理器CPU数量的增加对访存性能的提升的关系进行了探讨。 展开更多
关键词 非统一内存访问架构(NUMA) 龙芯3A VPX COTS
下载PDF
LAPACK线性方程求解函数在龙芯3A上的并行化 被引量:1
17
作者 刘斌斌 顾乃杰 +1 位作者 任开新 张杰 《小型微型计算机系统》 CSCD 北大核心 2014年第5期1085-1089,共5页
针对龙芯3A体系结构,该文通过变量代换或消除、简化依赖关系、增加热点数据副本、并行流水等方法对BLAS函数和LAPACK函数做并行化,基于原LAPACK库的结构层次实现了线性方程求解函数的并行化版本,用户只需设定核数重新编译出LAPACK的多... 针对龙芯3A体系结构,该文通过变量代换或消除、简化依赖关系、增加热点数据副本、并行流水等方法对BLAS函数和LAPACK函数做并行化,基于原LAPACK库的结构层次实现了线性方程求解函数的并行化版本,用户只需设定核数重新编译出LAPACK的多核库便可使用.通过LAPACK自带的性能测试程序进行测试,实验结果表明,在四核模式下,大多数函数加速比达到2以上,部分函数加速比超过了3,所有线性方程求解类函数加速比的算术平均值达到2.04. 展开更多
关键词 LAPACK BLAS 龙芯3A 多核
下载PDF
基于龙芯3A2000处理器的网络安全平台设计与应用 被引量:1
18
作者 胡钢 《机电工程技术》 2020年第2期120-122,143,共4页
基于龙芯3A2000国产处理器平台,通过硬件、散热、结构等方案设计和基于国产硬件平台的软件移植,包括系统引导和内核移植,应用层软件移植,硬件接口规范,设计了工业服务器网络安全平台,支持运行中标麒麟国产操作系统和昆仑固件,支持达梦/... 基于龙芯3A2000国产处理器平台,通过硬件、散热、结构等方案设计和基于国产硬件平台的软件移植,包括系统引导和内核移植,应用层软件移植,硬件接口规范,设计了工业服务器网络安全平台,支持运行中标麒麟国产操作系统和昆仑固件,支持达梦/金仓数据库,满足电子政务、电子商务以及工业自动化、智能制造、安防监控、检测、IT通信等国民经济重要领域工控系统的应用。 展开更多
关键词 龙芯3A 软件移植 软硬件适配
下载PDF
面向龙芯3A体系结构的Libjpeg库优化
19
作者 何颂颂 彭飞 +1 位作者 林传文 陶剑文 《计算机应用与软件》 北大核心 2022年第9期28-32,49,共6页
基于龙芯处理器的体系结构和指令系统,提出代码级和指令级优化方案,提升龙芯系列计算机的图像编码和解码速度。分析Libjpeg编解码算法的并行特性,重复使用龙芯处理器的SIMD加速硬件资源进行数据级并行优化。实验结果表明,JPEG编码速率提... 基于龙芯处理器的体系结构和指令系统,提出代码级和指令级优化方案,提升龙芯系列计算机的图像编码和解码速度。分析Libjpeg编解码算法的并行特性,重复使用龙芯处理器的SIMD加速硬件资源进行数据级并行优化。实验结果表明,JPEG编码速率提高70%左右,解码速率提高200%以上。工作成果已经提交到Libjpeg-turbo的主分支,极大改善了国产龙芯系列计算机中多媒体相关应用的用户体验。 展开更多
关键词 Libjpeg 龙芯3A 代码优化 SIMD
下载PDF
排序算法在龙芯3A上的优化实现
20
作者 翁玉萍 顾乃杰 +1 位作者 李恺 陈强 《计算机工程》 CAS CSCD 北大核心 2011年第20期255-257,270,共4页
分析归并排序算法和快速排序算法,根据国产CPU龙芯3A的体系结构特性,提出2种优化算法并进行实现。综合利用访存特性,引入拷贝优化、循环展开、交换操作优化和不同基本排序混用等优化技术。测试结果表明,在不影响排序稳定性的前提下,与Gl... 分析归并排序算法和快速排序算法,根据国产CPU龙芯3A的体系结构特性,提出2种优化算法并进行实现。综合利用访存特性,引入拷贝优化、循环展开、交换操作优化和不同基本排序混用等优化技术。测试结果表明,在不影响排序稳定性的前提下,与Glibc 2.11库中的排序函数相比,2种优化算法均能提升16.9%~90.5%的排序性能。 展开更多
关键词 龙芯3A 归并排序 快速排序 优化算法 循环展开
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部