期刊文献+
共找到10篇文章
< 1 >
每页显示 20 50 100
基于GPU的卫星通信基带处理高吞吐率并行算法
1
作者 李荣春 周鑫 +1 位作者 王庆林 梅松竹 《计算机工程与科学》 CSCD 北大核心 2023年第10期1720-1730,共11页
卫星通信被广泛应用于加密通信、应急通信等领域中,其基带处理算法较为复杂,需要很强的算力支持。传统的FPGA和DSP等平台开发周期过长,基于GPU的软件无线电方案开发便捷,性能优越。提出了一种基于GPU的卫星通信基带算法群,实现了卫星通... 卫星通信被广泛应用于加密通信、应急通信等领域中,其基带处理算法较为复杂,需要很强的算力支持。传统的FPGA和DSP等平台开发周期过长,基于GPU的软件无线电方案开发便捷,性能优越。提出了一种基于GPU的卫星通信基带算法群,实现了卫星通信下行链路的高速处理。实验结果表明,基于GPU的卫星通信链路达到了最低延迟要求,基带最高处理速度达到978 Mbps。 展开更多
关键词 5G 卫星通信 LDPC VITERBI RS
下载PDF
An Improved High Fan-in Domino Circuit for High Performance Microprocessors
2
作者 冯超超 陈迅 +1 位作者 衣晓飞 张民选 《Journal of Semiconductors》 EI CAS CSCD 北大核心 2008年第9期1740-1744,共5页
An improved high fan-in domino circuit is proposed. The nMOS pull-down network of the circuit is divided into several blocks to reduce the capacitance of the dynamic node and each block only needs a small keeper trans... An improved high fan-in domino circuit is proposed. The nMOS pull-down network of the circuit is divided into several blocks to reduce the capacitance of the dynamic node and each block only needs a small keeper transistor to maintain the noise margin. Because we omit the footer transistor, the circuit has better performance than the standard domino circuit. A 64-input OR-gate implemented with the structure is simulated using HSPICE under typical conditions of 0.13μm CMOS technology. The average delay of the circuit is 63.9ps, the average power dissipation is 32.4μW, and the area is l15μm^2. Compared to compound domino logic, the proposed circuit can reduce delay and power dissipation by 55% and 38%, respectively. 展开更多
关键词 high fan-in domino logic high performance keeper transistor
下载PDF
多核处理器Cache一致性协议关键技术研究 被引量:5
3
作者 黄安文 张民选 《计算机工程与科学》 CSCD 北大核心 2009年第A01期104-108,共5页
多核处理器规模的不断扩大和核间通信机制的日益复杂,使得Cache一致性维护变得更加困难。本文从多核处理器Cache一致性问题的产生背景出发,分析监听协议、目录协议、Token协议和Hammer协议的实现机制以及在多核环境中的优缺点,分别从一... 多核处理器规模的不断扩大和核间通信机制的日益复杂,使得Cache一致性维护变得更加困难。本文从多核处理器Cache一致性问题的产生背景出发,分析监听协议、目录协议、Token协议和Hammer协议的实现机制以及在多核环境中的优缺点,分别从一致性协议与片上互连结构协同设计、面向低功耗应用的协议优化策略、Cache一致性协议验证及容错机制等角度考虑,对未来多核处理器Cache一致性协议设计的发展趋势和技术挑战进行详细分析与讨论。 展开更多
关键词 CACHE一致性 片上互连 低功耗 验证 容错
下载PDF
移动群体感知技术研究 被引量:8
4
作者 熊英 史殿习 +1 位作者 丁博 邓璐 《计算机科学》 CSCD 北大核心 2014年第4期1-8,共8页
移动互联网的不断成熟以及搭载各种传感器的智能终端的广泛应用和普及催生了全新的研究领域,即移动群体感知技术领域。移动群体感知是以人为中心的感知,人在感知过程中扮演着重要的角色,发挥着重要的作用。移动群体感知概念自提出以来,... 移动互联网的不断成熟以及搭载各种传感器的智能终端的广泛应用和普及催生了全新的研究领域,即移动群体感知技术领域。移动群体感知是以人为中心的感知,人在感知过程中扮演着重要的角色,发挥着重要的作用。移动群体感知概念自提出以来,受到了学术界和工业界的广泛关注,移动群体感知技术广泛应用于交通、医疗健康等各个领域以及人们日常生活中的各个方面。首先从移动群体感知概念、感知模式、感知规模及其特性的角度阐述了移动群体感知的内涵;在此基础上,对群体感知技术的应用进行了分类,并且对现有典型的移动群体感知研究项目进行了分析、总结和比较;进而描述了移动群体感知技术向规模化、系统化发展的趋势及面向服务的"端+云"的移动群体感知体系架构;最后重点阐述了移动群体感知在大规模环境下所面临的全新挑战及应对策略。 展开更多
关键词 移动群体感知 感知模式 上下文感知 大数据融合
下载PDF
分布式深度学习通信架构的性能分析 被引量:3
5
作者 张立志 冉浙江 +1 位作者 赖志权 刘锋 《计算机工程与科学》 CSCD 北大核心 2021年第3期416-425,共10页
近年来,深度学习技术的进步推动人工智能进入了一个新的发展时期。但是,海量的训练数据、超大规模的模型给深度学习带来了日益严峻的挑战,分布式深度学习应运而生,逐渐成为应对这一挑战的有效手段,而高效的参数通信架构是保证分布式深... 近年来,深度学习技术的进步推动人工智能进入了一个新的发展时期。但是,海量的训练数据、超大规模的模型给深度学习带来了日益严峻的挑战,分布式深度学习应运而生,逐渐成为应对这一挑战的有效手段,而高效的参数通信架构是保证分布式深度学习性能的关键。针对传统分布式深度学习模型同步架构在大规模节点上并行训练的问题,首先,分析了集中式的Parameter Server和去中心化的Ring Allreduce这2种主流的参数通信架构的原理和性能。然后,在天河高性能GPU集群上基于TensorFlow构建了2种分布式训练架构的对比测试环境。最后,以Parameter Server架构为基准线,测试了Ring Allreduce架构在GPU集群环境下训练AlexNet和ResNet-50的对比性能。实验结果表明,在使用32个GPU的情况下,Ring Allreduce架构扩展效率可达97%,相比Parameter Server架构,其分布式计算性能可提升30%,验证了Ring Allreduce架构具有更好的可扩展性。 展开更多
关键词 Ring Allreduce 参数服务器 分布式训练 深度学习 深度神经网络
下载PDF
多维数据特征融合的用户情绪识别 被引量:3
6
作者 陈茜 史殿习 杨若松 《计算机科学与探索》 CSCD 北大核心 2016年第6期751-760,共10页
针对目前基于智能手机的情绪识别研究中所用数据较为单一,不能全面反应用户行为模式,进而不能真实反应用户情绪这一问题展开研究,基于智能手机从多个维度全面收集反应用户日常行为的细粒度感知数据,采用多维数据特征融合方法,利用支持... 针对目前基于智能手机的情绪识别研究中所用数据较为单一,不能全面反应用户行为模式,进而不能真实反应用户情绪这一问题展开研究,基于智能手机从多个维度全面收集反应用户日常行为的细粒度感知数据,采用多维数据特征融合方法,利用支持向量机(support vector machine,SVM)、随机森林(random forest)等6种分类方法,基于离散情绪模型和环状情绪模型两种情绪分类模型,对12名志愿者的混合数据和个人数据分别进行情绪识别,并进行了对比实验。实验结果表明,该全面反应用户行为的多维数据特征融合方法能够很好地对用户的情绪进行识别,其中使用个人数据进行情绪识别的准确率最高可达到79.78%,而且环状情感模型分类结果明显优于离散分类模型。 展开更多
关键词 情绪识别 情绪模型 机器学习 智能手机
下载PDF
手机位置和朝向无关的活动识别技术研究 被引量:2
7
作者 吴渊 史殿习 +3 位作者 杨若松 李寒 陈茜 周荣 《计算机技术与发展》 2016年第4期1-5,共5页
文中针对基于智能手机的活动识别中如何消除手机位置和朝向的影响问题展开研究。首先,针对手机放置位置问题,提出了先识别手机位置再进行活动识别的方法,其特点是能够基于特定的手机位置选取最佳的活动识别模型,进而消除手机位置对活动... 文中针对基于智能手机的活动识别中如何消除手机位置和朝向的影响问题展开研究。首先,针对手机放置位置问题,提出了先识别手机位置再进行活动识别的方法,其特点是能够基于特定的手机位置选取最佳的活动识别模型,进而消除手机位置对活动识别的影响;其次,针对手机朝向影响问题,对传感器数据使用绝对值和简单移动平均线处理的方法,消除手机朝向对手机位置识别和活动识别的影响;最后,基于Android平台开发了一个传感器数据收集工具对传感器数据进行收集,设计了两组实验对上面提出的方法进行实验验证。结果表明,文中提出的方法能够很好地消除手机放置位置和朝向对活动识别的影响,活动识别的准确率能达到87.89%。 展开更多
关键词 手机位置 手机朝向 活动识别 智能手机
下载PDF
一种基于节点能力区分的Pareto最优网络编码组播方法
8
作者 郑力明 符永铨 李晓冬 《软件工程》 2016年第7期6-9,5,共5页
快速数据分发在突发事件响应,军事领域等具有重要的应用。针对异构用户节点群体下快速数据分发问题,提出基于能力区分的拓扑构建和速率控制的网络编码组播协议CORE。CORE利用能力区分的自适应层次化拓扑构建鼓励节点提供高的上传带宽并... 快速数据分发在突发事件响应,军事领域等具有重要的应用。针对异构用户节点群体下快速数据分发问题,提出基于能力区分的拓扑构建和速率控制的网络编码组播协议CORE。CORE利用能力区分的自适应层次化拓扑构建鼓励节点提供高的上传带宽并优化系统范围吞吐率;利用直方图的方式对基于网络编码的数据传输进行流量控制,降低冗余数据的传输;基于分布式的速率控制实现Pareto最优的下载速率分配。实验结果表明CORE具有良好的可扩展性,能够充分利用异构节点的上传能力,提供区分的下载带宽分配,较高的数据传输吞吐率、低端到端网络延迟,能够提供异构网络环境下分发时间紧迫的数据分发服务。 展开更多
关键词 数据分发 网络编码 能力区分 速率分配
下载PDF
基于伪解码的拉模式流媒体服务性能测评
9
作者 万光宇 吴吉庆 彭宇行 《计算机仿真》 CSCD 2007年第5期118-121,153,共5页
多格式媒体服务成为服务的重点,为测试系统性能,传统的方法是构建由数百台客户端组成的压力测试环境,使客户端对服务系统进行真实的用户点播来进行性能测试。由于传统的测试环境复杂和成本高,所以为了减少测试环境的复杂程度和降低成本... 多格式媒体服务成为服务的重点,为测试系统性能,传统的方法是构建由数百台客户端组成的压力测试环境,使客户端对服务系统进行真实的用户点播来进行性能测试。由于传统的测试环境复杂和成本高,所以为了减少测试环境的复杂程度和降低成本,文中提出了一种基于“伪解码”的测试方法。该方法能够在客户端不进行解码而达到播放器真实解码的效果,降低播放窗口对客户端系统资源的占用。使每个播放窗口占用很少的系统资源,模拟真实的用户请求对服务器进行施压。这样能够大量提高单客户端模拟真实用户请求的数目。使用简单的测试环境达到真实测试的效果。该方法能够使用一台或几台客户端组成的测试环境来对服务系统进行性能测试。 展开更多
关键词 流媒体服务 性能测评 伪解码
下载PDF
一种基于混合式双层拓扑的发布/订阅系统
10
作者 郑力明 孙伟东 《软件工程与应用》 2018年第1期13-23,共11页
基于内容的快速数据分发是分布式环境中资源汇聚和共享的一项关键技术。为更好的满足动态网络环境中对数据分发实时性的要求,提出一种基于混合式双层拓扑的发布/订阅系统,它包含一种基于内容的双层拓扑结构CBDLO,下层是一个非结构化的... 基于内容的快速数据分发是分布式环境中资源汇聚和共享的一项关键技术。为更好的满足动态网络环境中对数据分发实时性的要求,提出一种基于混合式双层拓扑的发布/订阅系统,它包含一种基于内容的双层拓扑结构CBDLO,下层是一个非结构化的拓扑结构,上层是多个对应不同属性的分布式平衡二叉树;一种基于内容的带踪迹路由算法CRAWL,以随机行走的方式在下层非结构化拓扑上转发数据,同时为对应数据寻找相应的上层属性拓扑的入口;一种基于属性计数的分布式匹配算法CDM,在上层的分布式平衡二叉树上并行的匹配数据的各个属性,并把匹配的数据发送到对数据感兴趣的节点上。实验结果表明,该系统能够有效支持大规模动态网络中的数据分发,降低分发开销和匹配延迟。 展开更多
关键词 数据分发 发布/订阅消息 路由 数据匹配
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部