期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
一种利用数据融合来提高局部性和减少伪共享的方法 被引量:5
1
作者 曾丽芳 杨学军 +1 位作者 夏军 陈娟 《计算机学报》 EI CSCD 北大核心 2004年第1期32-41,共10页
某些应用程序不能通过数组内元素的重排优化获得性能提高 .针对这一问题 ,该文扩展了数组之间数据重组优化方法 ,着重分析了将多个数组的数据按一定方式进行融合来提高局部性和减少伪共享优化方法的特性 .文章针对几种典型的数组关联模... 某些应用程序不能通过数组内元素的重排优化获得性能提高 .针对这一问题 ,该文扩展了数组之间数据重组优化方法 ,着重分析了将多个数组的数据按一定方式进行融合来提高局部性和减少伪共享优化方法的特性 .文章针对几种典型的数组关联模式 ,提出了相应的数据融合方法 ,并建立了一组粗略的性能代价判别规则 ,以指导编译器有选择地融合数组以提高程序的全局优化效果 .根据在多个平台上的测试结果 ,该文还分析了数据融合优化方法在不同体系结构上的性能可移植性 ,并将体系结构特征加入到性能代价判别规则中 ,使得此优化方法能适用于不同的体系结构 .测试结果表明 ,数据融合优化方法对提高某些应用程序的性能 ,尤其是其在软件DSM体系结构上的性能 。 展开更多
关键词 数据排列 数据融合 局部性 编译优化 数组 应用程序
下载PDF
面向深度学习的批处理矩阵乘法设计与实现 被引量:5
2
作者 黄春 姜浩 +3 位作者 全哲 左克 何楠 刘文超 《计算机学报》 EI CAS CSCD 北大核心 2022年第2期225-239,共15页
本文设计并实现了面向深度学习的统一框架批处理矩阵乘法.我们细致地分析了利用矩阵乘法实现卷积的过程中卷积核、输入特征图和输出特征图在NCHW和NHWC两类存储格式下的矩阵数据排列特点,指出了其和矩阵行列主序的关系.在此基础上,为了... 本文设计并实现了面向深度学习的统一框架批处理矩阵乘法.我们细致地分析了利用矩阵乘法实现卷积的过程中卷积核、输入特征图和输出特征图在NCHW和NHWC两类存储格式下的矩阵数据排列特点,指出了其和矩阵行列主序的关系.在此基础上,为了更好复用共享的卷积核数据,我们提出将批量输入特征图转化为一个矩阵整体进行计算的方法.我们设计了统一框架的批处理分块矩阵乘法,该框架计算同一矩阵和多个不同矩阵的乘法,可以处理并输出任意存储格式的矩阵数据.我们优化了分块矩阵乘法实现,根据输入参数特征规划计算顺序,利用矩阵转置技巧复用核心计算模块,没有增加额外的数据组织操作.数值试验表明:本文设计实现的批处理单精度矩阵乘法的计算速度比循环调用原始单精度矩阵乘法的计算速度在处理中小尺度矩阵时在四款不同处理器平台上性能最高分别提高4.80%、26.57%、29.27%和25.55%,平均分别提升2.37%、14.37%、9.89%和15.72%. 展开更多
关键词 批处理矩阵乘法 卷积 分块算法 深度学习 数据排列
下载PDF
《简单的数据排序和分组》教学设计
3
作者 杨俊 《科教导刊(电子版)》 2019年第1期170-171,共2页
本文以采用教法型教案的模式,简单的概括了本次的教学目标,教学过程、教学重点、难点,设计提问等环节设置,教学过程中,采用问答法,以师生间对话的形式进行教学,并总结了一些个人的教学见解与教学反思。
关键词 数据排列 数据分组 教学设计
下载PDF
基于Excel vba开发的数据对应排列程序的应用实例
4
作者 宁尚知 段磊 高宁 《山东煤炭科技》 2016年第4期205-207,共3页
数据对应排列是企业劳资人事、财务核算、生产制造等各种工作中经常遇到的问题,利用Excel vba编写程序,可以很方便的解决这个问题。
关键词 数据排列 VBA 程序代码
下载PDF
您理解统计分析的概念吗?──和基层统计同行“聊分析”(之一)
5
作者 于桂谦 《数据》 1998年第6期21-23,共2页
关键词 统计分析 基层统计 社会经济现象 第一生产力 分析研究 科学技术 分析空白 情况分析 数据排列 统计资料
下载PDF
DSPs实时视频处理中的Cache优化算法研究 被引量:2
6
作者 唐文佳 朱光喜 +1 位作者 王曜 刘瑜 《小型微型计算机系统》 CSCD 北大核心 2005年第4期680-683,共4页
在采用并行超长指令字结构的DSP芯片中,CPU处理速度与片外数据存取速度不匹配的问题,导致了CPU处理延时,限制了DSP系统性能的提升.针对这一问题,根据Cache的结构提出一种适宜于在DSPCPU上进行视频数据处理的数据排列新算法,并且将其成... 在采用并行超长指令字结构的DSP芯片中,CPU处理速度与片外数据存取速度不匹配的问题,导致了CPU处理延时,限制了DSP系统性能的提升.针对这一问题,根据Cache的结构提出一种适宜于在DSPCPU上进行视频数据处理的数据排列新算法,并且将其成功地应用到基于TrimediaPNX1301的MPEG4程序优化工作中.系统编码结果表明,该方法有效地减少了Cachemiss及片外数据存取的时间开销,在同等条件下,采用本算法后系统编码性能提高2帧/秒(CIF格式)左右. 展开更多
关键词 CACHE优化 数据排列算法 MPEG-4视频编码器 DSPs优化
下载PDF
联想记数据
7
作者 金滋良 《初中生学习技巧(初一年级)》 2005年第2期34-35,共2页
运用联想法来记忆地理数据,可以收到易记不易忘的效果。
关键词 联想法 地理数据 记忆方法 同类数据 比较法 对比法 数据顺逆排列 初中
下载PDF
压缩状态下一种新的数据码流处理方法
8
作者 赵金海 关秀芬 《中州大学学报》 2001年第1期75-76,共2页
本文针对网络上图像通信特点,对JPEG进行了改进,提出了一种新的码流排列方式。传输少量的数据即可以看到一幅清晰的图像。若用户对其感兴趣,则可以继续接收,否则,停止接收。这样既可减少等待时间又可节省传输费用,这在网络图像传... 本文针对网络上图像通信特点,对JPEG进行了改进,提出了一种新的码流排列方式。传输少量的数据即可以看到一幅清晰的图像。若用户对其感兴趣,则可以继续接收,否则,停止接收。这样既可减少等待时间又可节省传输费用,这在网络图像传输上具有重大意义。实验表明:该方法实现简单,又切实可行。 展开更多
关键词 网络传输 JPEG 快速DCT 图像压缩 图像传输 数据码流排列方式 压缩数据结构
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部