期刊文献+
共找到126篇文章
< 1 2 7 >
每页显示 20 50 100
基于网络性能的智能Web加速技术——缓存与预取 被引量:12
1
作者 金志刚 张钢 舒炎泰 《计算机研究与发展》 EI CSCD 北大核心 2001年第8期1000-1004,共5页
Web业务在网络业务中占有很大比重 ,在无法扩大网络带宽时 ,需要采取一定技术合理利用带宽 ,改善网络性能 .研究了基于 RTT(round trip time)等网络性能指标的 Web智能加速技术 ,在对 Web代理服务器上的业务进行分析和对网络 RTT进行测... Web业务在网络业务中占有很大比重 ,在无法扩大网络带宽时 ,需要采取一定技术合理利用带宽 ,改善网络性能 .研究了基于 RTT(round trip time)等网络性能指标的 Web智能加速技术 ,在对 Web代理服务器上的业务进行分析和对网络 RTT进行测量分析的基础上 ,提出了智能预取控制技术及新的缓存 (cache)替换方法 .对新算法的仿真研究表明 ,该方法提高了缓存的命中率 .研究表明预取技术在不明显增加网络负荷的前提下 ,提高了业务的响应速度 ,有效地改进了 展开更多
关键词 网络性能 智能加速 算法 WEB 代理服务器 WWW
下载PDF
Web智能代理的预取技术和缓存技术 被引量:5
2
作者 赵政 张钢 +2 位作者 杨洁 王松 舒炎泰 《天津大学学报(自然科学与工程技术版)》 EI CAS CSCD 北大核心 2001年第5期563-567,共5页
针对同一个工作组中成员可能对 Web有相似的兴趣点和访问习惯问题 ,研究了主要包括缓存和预取两个部分的智能代理技术 ;研究了代理缓存三种替换算法 :L RU和 L RU的两种变种 .仿真试验表明 ,L RU算法的命中率极差 ,将 L RU的两种变种相... 针对同一个工作组中成员可能对 Web有相似的兴趣点和访问习惯问题 ,研究了主要包括缓存和预取两个部分的智能代理技术 ;研究了代理缓存三种替换算法 :L RU和 L RU的两种变种 .仿真试验表明 ,L RU算法的命中率极差 ,将 L RU的两种变种相结合则是一种较好的方案 .通过引入预测算法和门限算法 ,代理服务器可以预测最近将要访问到的页面 ,并在客户实际请求提出之前有选择地下载 .因为单个客户访问某个页面的历史次数往往不够多 ,将预测算法放在代理服务器上比放在客户端的预测概率更准确 .通过在代理服务器上实现缓存和预取技术 ,可减少用户访问 Web的响应时间 ,还可减少实际访问 Web服务器的总次数 .并提出了一个为发展中国家用户缩减 展开更多
关键词 万维网 智能代理 预取 缓存 代理服务器 WEB 预测算法 门限算法
下载PDF
数据库查询优化中的智能预取技术 被引量:10
3
作者 朱鸿宇 刘瑰 +1 位作者 唐福华 陈左宁 《计算机应用研究》 CSCD 北大核心 2007年第5期35-37,40,共4页
提出了一种新的用于关系数据库查询缓冲和预取的方法。首先将数据查询语句抽象成由四元组组成的查询模板,同时保存了查询语句的实际参数。基于这些模板和参数,提出了两种智能预取算法以适应两类不同的数据查询需求。第一个算法基于蚁群... 提出了一种新的用于关系数据库查询缓冲和预取的方法。首先将数据查询语句抽象成由四元组组成的查询模板,同时保存了查询语句的实际参数。基于这些模板和参数,提出了两种智能预取算法以适应两类不同的数据查询需求。第一个算法基于蚁群规则,该算法能够用于预测将来具有最高可能性的查询。经过监控某个特定应用对于数据库所发生的大量查询,实际的模板数要远远小于发生的查询数。当通过考虑查询模板和跟踪历史查询记录来预测未来可能发生的查询时,提出了第二类算法。该算法基于惯性规则,它使用BP网络来跟踪用户的查询历史。相对于前面的算法,该算法更适合多应用共存的场合。在模拟实验中发现对于单个应用而言,查询具有很高的模板依赖性,而对于多应用场合,惯性规则具有更好的适应性。 展开更多
关键词 数据预取 蚁群规则 惯性规则
下载PDF
基于频繁的Markov链预测模型 被引量:10
4
作者 闫永权 张大方 《计算机应用研究》 CSCD 北大核心 2007年第3期41-43,46,共4页
预取技术通过在用户浏览当前网页的时间内提前取回其将来最有可能请求的网页来减少实际感知的获取网页的时间。传统的Markov链模型是一种简单而有效的预测模型,但同时存在预测准确率偏低,存储复杂度偏高等缺点。通过提出一种算法来减小... 预取技术通过在用户浏览当前网页的时间内提前取回其将来最有可能请求的网页来减少实际感知的获取网页的时间。传统的Markov链模型是一种简单而有效的预测模型,但同时存在预测准确率偏低,存储复杂度偏高等缺点。通过提出一种算法来减小存储空间,最后通过证明能有效减小存储空间。 展开更多
关键词 预取 马尔可夫模型 频繁模式树
下载PDF
HTTP代理服务器的设计与实现 被引量:8
5
作者 孙永辉 姜昱明 《计算机工程与设计》 CSCD 2003年第7期56-58,62,共4页
实现了一个代理服务器系统,设计了代理的模型,给出了代理各个模块的设计结构图。该系统使用IP地址和用户口令对用户进行限制,使系统具备了一定的安全访问功能;缓存和预取的使用,提高了客户的响应速度,降低了网络流量。
关键词 HTTP 代理服务器 设计 网络流量 WEB 计算机网络
下载PDF
龙芯3A多核处理器系统级性能优化与分析 被引量:12
6
作者 孟小甫 高翔 +1 位作者 从明 张爽爽 《计算机研究与发展》 EI CSCD 北大核心 2012年第S1期137-142,共6页
多核处理器的性能与系统软件有着密切的联系:操作系统是处理器与应用程序之间的接口,对于充分利用处理器特性和提高应用程序的性能起着极其重要的作用;编译器与处理器体系结构密切相关,一方面要产生处理器支持的二进制代码,另一方面还... 多核处理器的性能与系统软件有着密切的联系:操作系统是处理器与应用程序之间的接口,对于充分利用处理器特性和提高应用程序的性能起着极其重要的作用;编译器与处理器体系结构密切相关,一方面要产生处理器支持的二进制代码,另一方面还要结合处理器特性产生高效运行的代码,其性能好坏直接影响着系统的整体性能.为了提高龙芯3A系统的实际性能,从操作系统和编译器着手,结合龙芯3A微结构特征,进行了一系列有效的优化.这些措施包括CC-NUMA多核操作系统的实现、操作系统二级Cache锁机制、操作系统调度共享二级Cache分配、自动向量化编译和支持预取机制的编译等.实验结果表明,在系统软件中增加对处理器特性的支持,能够充分挖掘体系结构的优势,对系统性能有较大的好处.其性能优化技术对于其他处理器的优化也有一定的借鉴价值. 展开更多
关键词 龙芯3A 自动向量化 预取 锁Cache 性能分析
下载PDF
一种异构多核处理器的并行流存储结构 被引量:7
7
作者 邓让钰 陈海燕 +7 位作者 窦强 徐炜遐 谢伦国 戴泽福 李永进 夏军 罗莉 张民选 《电子学报》 EI CAS CSCD 北大核心 2009年第2期312-317,共6页
异构多核处理器可结合多种处理器体系结构的优势,既保留传统通用体系结构的灵活性,又拥有大量计算资源,可提供更高的峰值计算性能.YHFT64-3异构多核处理器中浮点处理部件18套,峰值计算能力强大,设计与之相匹配的存储系统是一项重大挑战... 异构多核处理器可结合多种处理器体系结构的优势,既保留传统通用体系结构的灵活性,又拥有大量计算资源,可提供更高的峰值计算性能.YHFT64-3异构多核处理器中浮点处理部件18套,峰值计算能力强大,设计与之相匹配的存储系统是一项重大挑战.针对YHFT64-3处理器,本文提出了一种并行流层次存储结构,深入阐述了如何体现应用特点、支持并行数据流处理的存储系统的设计思想和方法,从多个层次实现对并行数据流的挖掘或捕获.测试结果表明,这种存储结构体现了应用特点,能够较好地发挥YHFT64-3处理器的性能,同频情况下(500MHz),YHFT64-3比YHFT64-2性能高2—3个数量级,与1.6GHz的Itanium2性能相当,但代价更低. 展开更多
关键词 异构多核处理器 流体系结构 预取 存储调度 优化的锁步执行模型
下载PDF
并行文件系统中适度贪婪的Cache预取一体化算法 被引量:6
8
作者 卢凯 金士尧 卢锡城 《计算机学报》 EI CSCD 北大核心 1999年第11期1172-1177,共6页
传统文件系统中的Cache和预取技术是两种降低访问延迟的有效方法.在并行科学计算应用的I/O访问模式下,简单的Cache和预取技术已无法提供较高的Cache 命中率.该文在分析该I/O模式的基础上提出了适度贪婪的Ca... 传统文件系统中的Cache和预取技术是两种降低访问延迟的有效方法.在并行科学计算应用的I/O访问模式下,简单的Cache和预取技术已无法提供较高的Cache 命中率.该文在分析该I/O模式的基础上提出了适度贪婪的Cache 和预取一体化算法(PGI).该算法充分利用了并行文件系统环境的特点,采用了适度贪婪的动态滑窗技术,可以有效地消除预取时的抖动,降低系统处理开销;并同时采用了Cache 和预取一体化的淘汰损失估计算法,使淘汰的损失降到最低点,在整体上提供了较短的I/O 展开更多
关键词 并行文件系统 预取 CACHE 操作系统 算法
下载PDF
通信对机群并行计算性能的影响 被引量:2
9
作者 胡明昌 史岗 +1 位作者 胡伟武 唐志敏 《小型微型计算机系统》 CSCD 北大核心 2003年第9期1569-1573,共5页
分析了通信和计算重叠模型及 L og GP模型 ,指出各通信参数对并行计算性能的影响 ,结合并行程序的特征介绍了在机群环境下改善并行计算性能经常采用的五种通信方式 :采用高速网络、采用用户级通信协议、利用 SMP通信、动态预取或迁移数... 分析了通信和计算重叠模型及 L og GP模型 ,指出各通信参数对并行计算性能的影响 ,结合并行程序的特征介绍了在机群环境下改善并行计算性能经常采用的五种通信方式 :采用高速网络、采用用户级通信协议、利用 SMP通信、动态预取或迁移数据、消息合并发送 ,详尽测试了各种方式影响性能情况并分析了其特点和适用范围 .采用高速网络是最常用的方法 ,性能提高明显 ,适用于各类应用程序 .需要传送大量小消息的并行程序还应采用用户级通信协议 .对于特定的一类应用程序 ,采用消息合并发送方式提高性能最多 .采用动态预取或迁移数据和利用 SMP通信时要慎重 。 展开更多
关键词 LogGP模型 用户级通信 机群 曙光3000 MPI JIAJIA 预取 home迁移
下载PDF
基于分段的适应性流媒体缓存管理算法 被引量:3
10
作者 郑冬冬 余宏亮 郑纬民 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2007年第7期1204-1207,共4页
为提高流媒体代理服务器的缓存效率,从而提高整个流媒体服务系统的性能,提出一种基于用户访问模式的适应性媒体分段缓存策略。该策略充分考虑用户行为模式对具体影片访问特性的不同,采取有针对性的分段缓存管理策略,可显著提高代理缓存... 为提高流媒体代理服务器的缓存效率,从而提高整个流媒体服务系统的性能,提出一种基于用户访问模式的适应性媒体分段缓存策略。该策略充分考虑用户行为模式对具体影片访问特性的不同,采取有针对性的分段缓存管理策略,可显著提高代理缓存命中率。为避免由于分段策略所潜在引发的播放抖动问题,对相应的预取算法进行了理论分析。事件驱动试验结果表明:所提出的缓存算法命中率较之传统的定长分段算法及系统现有的间隔缓存策略均有显著的性能提高,系统稳定时缓存命中率分别高出后两者54%和31%。 展开更多
关键词 多媒体技术与多媒体计算机 流媒体点播 代理缓存 预取
原文传递
一种高效预取机制的设计与实现
11
作者 杨波 高德远 张盛兵 《微电子学与计算机》 CSCD 北大核心 2001年第1期51-54,共4页
文章结合 NCS处理器的设计,提出了一种预取控制模型,该模型充分利用多相时钟的配合完成了指令和数据的预取,有效的消除了处理器的访内瓶颈,通过测试程序的运行,证明该模型是有效的;还讨论了该模型的具体电路实现,这对于研制我国... 文章结合 NCS处理器的设计,提出了一种预取控制模型,该模型充分利用多相时钟的配合完成了指令和数据的预取,有效的消除了处理器的访内瓶颈,通过测试程序的运行,证明该模型是有效的;还讨论了该模型的具体电路实现,这对于研制我国具有独立自主版权的处理器具有重要意义。 展开更多
关键词 CPU 微处理器 预取机制 设计
下载PDF
基于行内局部性的内存控制器端预取
12
作者 周叔欣 张见齐 +1 位作者 王焕东 章隆兵 《高技术通讯》 CAS 北大核心 2024年第3期248-255,共8页
本文提出一种基于行内局部性的内存控制器端预取。采用位图的数据结构记录行内每个数据块的状态;并且对每一行进行区域划分,量化每个区域的访问局部性;根据区域内的局部性高低决定预取的激进程度。对于局部性较低的区域,预取区域内未被... 本文提出一种基于行内局部性的内存控制器端预取。采用位图的数据结构记录行内每个数据块的状态;并且对每一行进行区域划分,量化每个区域的访问局部性;根据区域内的局部性高低决定预取的激进程度。对于局部性较低的区域,预取区域内未被访问过的数据块;对于局部性较高的区域,同时采用跨区域的预取。通过动态调整区域规模的大小来适应局部性程度的变化。上述预取方法在龙芯3A6000处理器上实现并评测,评测程序采用SPEC CPU2006访存密集型应用。评测结果显示本文的预取方法将每周期指令数(IPC)平均提升6.51%,将单线程IPC最高提升46.80%(bwaves),将双核四线程IPC最高提升26.22%(lbm)。 展开更多
关键词 内存控制器 预取 局部性
下载PDF
一种硬件预取机构及其对系统影响的研究 被引量:3
13
作者 邓让钰 谢伦国 肖立权 《计算机工程与科学》 CSCD 2001年第6期70-72,共3页
存储器访问延迟已经成为高性能微处理器性能发挥的关键障碍之一。预取是隐藏访存延迟的重要手段 ,其通常做法是显式执行指令将数据在实际使用前先行取到离微处理器较近的地方 ,但是这种方法增加了程序设计人员的负担。本文提出了一种硬... 存储器访问延迟已经成为高性能微处理器性能发挥的关键障碍之一。预取是隐藏访存延迟的重要手段 ,其通常做法是显式执行指令将数据在实际使用前先行取到离微处理器较近的地方 ,但是这种方法增加了程序设计人员的负担。本文提出了一种硬件预取方法 ,即在存储控制器中设计一个VPFB机构用来隐藏访存延迟 。 展开更多
关键词 微处理器 硬件预取机构 存储控制器 CPU
下载PDF
一种基于智能体的Web文档预取模式 被引量:4
14
作者 梁意文 曹霞 董红斌 《计算机工程与应用》 CSCD 北大核心 2001年第4期54-56,共3页
文章深入分析了用户对Internet资源的访问模式和web文档自身的更新模式,并提出了一个新的基于智能体的web文档预取系统结构。在这个系统结构基础上,通过用户存取日志及各种算法,发现特定用户感兴趣的主题,实现对兴趣... 文章深入分析了用户对Internet资源的访问模式和web文档自身的更新模式,并提出了一个新的基于智能体的web文档预取系统结构。在这个系统结构基础上,通过用户存取日志及各种算法,发现特定用户感兴趣的主题,实现对兴趣文档的主动预取,从而提高分布式信息系统上信息的获取效率。 展开更多
关键词 WEB 文档预取模式 智能体 信息库 INTERNET
下载PDF
磁盘阵列 Cache 自适应预读算法的研究 被引量:2
15
作者 王作新 郑乐黎 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 1997年第5期4-9,共6页
提出了一种磁盘阵列Cache的算法,它使用自适应的预读策略根据以往磁盘访问的信息来较精确地预测下一次访问的磁盘地址,并预先读出到Cache中,从而降低磁盘访问的平均服务时间。讨论了在多任务环境下的适配算法。模拟测试的... 提出了一种磁盘阵列Cache的算法,它使用自适应的预读策略根据以往磁盘访问的信息来较精确地预测下一次访问的磁盘地址,并预先读出到Cache中,从而降低磁盘访问的平均服务时间。讨论了在多任务环境下的适配算法。模拟测试的结果表明:本算法比LRU算法优越。 展开更多
关键词 磁盘阵列 高速缓冲存贮器 预读 自适应 适配表
下载PDF
p-HPF并行编译系统核外计算的实现及优化策略 被引量:4
16
作者 丁文魁 汪剑平 +2 位作者 向华 李晓明 许卓群 《计算机学报》 EI CSCD 北大核心 1999年第10期1042-1049,共8页
文中阐述了p-HPF编译系统中对核外计算的支持以及采取的优化策略.通过对编程模型的扩充和并行I/O模型的构造,p-HPF编译系统已能对核外数组进行有效的处理.通过采用数据筛选、行列优先、预取、文件与数组的一一映射等优... 文中阐述了p-HPF编译系统中对核外计算的支持以及采取的优化策略.通过对编程模型的扩充和并行I/O模型的构造,p-HPF编译系统已能对核外数组进行有效的处理.通过采用数据筛选、行列优先、预取、文件与数组的一一映射等优化策略,使并行程序执行核外计算的效率得到了大幅度地提高.文中叙述了核外计算模型及其优化的设计思想与实现。 展开更多
关键词 核外计算 核外数组 数据筛选 并行编译系统
下载PDF
基于预取的Cache替换策略 被引量:5
17
作者 孙玉强 王文闻 +1 位作者 巢碧霞 顾玉宛 《微电子学与计算机》 CSCD 北大核心 2017年第1期85-89,94,共6页
在页式虚拟存储管理系统中,合理的Cache替换策略可以减少CPU等待时间,提升Cache命中率和系统性能.许多经典Cache置换算法的依据都是页面的访问次数或访问时间,也有一些是两者兼顾.对此介绍了一种基于预取的Cache替换策略,主要做出了以下... 在页式虚拟存储管理系统中,合理的Cache替换策略可以减少CPU等待时间,提升Cache命中率和系统性能.许多经典Cache置换算法的依据都是页面的访问次数或访问时间,也有一些是两者兼顾.对此介绍了一种基于预取的Cache替换策略,主要做出了以下2点优化:(1)一次Cache置换淘汰多个页面;(2)Cache首次调入页面由"拉取"模式改为"推送"模式.模拟实验结果显示,该方法有效提高了Cache命中率,提升了系统性能. 展开更多
关键词 预取 替换策略 CACHE 命中率
下载PDF
基于结构相关性Markov模型的Web网页预取方法 被引量:3
18
作者 张丽 郭成城 晏蒲柳 《计算机工程与应用》 CSCD 北大核心 2004年第21期163-166,共4页
预取技术通过在用户浏览当前网页的时间内提前取回其将来最有可能请求的网页来减小实际感知的获取网页的时间。预测的准确性和方法的可用性是预取技术需要解决的主要问题。针对目前Web网页预取的一般方法的不足之处,提出了一种基于结构... 预取技术通过在用户浏览当前网页的时间内提前取回其将来最有可能请求的网页来减小实际感知的获取网页的时间。预测的准确性和方法的可用性是预取技术需要解决的主要问题。针对目前Web网页预取的一般方法的不足之处,提出了一种基于结构相关性Markov模型的Web网页预取方法。仿真实验的结果表明,这种方法在保证一定预测准确性的同时也具有较好的可用性,能够在减小用户访问延迟、提高响应速度方面达到较为满意的效果。 展开更多
关键词 预取 Web网页相关性 MARKOV模型
下载PDF
结合访存失效队列状态的预取策略 被引量:3
19
作者 郇丹丹 李祖松 +1 位作者 胡伟武 刘志勇 《计算机学报》 EI CSCD 北大核心 2007年第7期1104-1114,共11页
随着存储系统的访问速度与处理器的运算速度的差距越来越显著,访存性能已成为提高计算机系统性能的瓶颈.通过对指令Cache和数据Cache失效行为的分析,提出一种预取策略——结合访存失效队列状态的预取策略.该预取策略保持了指令和数据... 随着存储系统的访问速度与处理器的运算速度的差距越来越显著,访存性能已成为提高计算机系统性能的瓶颈.通过对指令Cache和数据Cache失效行为的分析,提出一种预取策略——结合访存失效队列状态的预取策略.该预取策略保持了指令和数据访问的次序,有利于预取流的提取.并将指令流和数据流的预取相分离,避免相互替换.在预取发起时机的选择上,不但考虑当前总线是否空闲,而且结合访存失效队列的状态,减小对处理器正常访存请求的影响.通过流过滤机制提高预取准确性,降低预取对访存带宽的需求.结果表明,采用结合访存失效队列状态的预取策略,处理器的平均访存延时减少30%,SPEC CPU2000程序的IPC值平均提高8.3%. 展开更多
关键词 预取 Cache失效 龙芯2号
下载PDF
申威1621处理器上矩阵乘法优化研究 被引量:1
20
作者 闫昊 刘芳芳 +1 位作者 马文静 陈道琨 《软件学报》 EI CSCD 北大核心 2023年第7期3451-3463,共13页
稠密矩阵乘法(GEMM)是很多科学与工程计算应用中大量使用的函数,也是很多代数函数库中的基础函数,其性能高低对整个应用往往有决定性的影响.另外,因其计算密集的特点,矩阵乘法效率往往也是体现硬件平台性能的重要指标.针对国产申威1621... 稠密矩阵乘法(GEMM)是很多科学与工程计算应用中大量使用的函数,也是很多代数函数库中的基础函数,其性能高低对整个应用往往有决定性的影响.另外,因其计算密集的特点,矩阵乘法效率往往也是体现硬件平台性能的重要指标.针对国产申威1621处理器,对稠密矩阵乘法进行了系统性地优化.基于对各部分开销的分析,以及对体系结构特点与指令集的充分利用,对DGEMM函数从循环与分块方案,打包方式,核心计算函数实现,数据预取等方面进行了深入优化.此外,开发了代码生成器,为不同的输入参数生成不同版本的汇编代码和C语言代码,配合自动调优脚本,选取最佳参数.经过优化和调优,单线程DGEMM性能达到了单核浮点峰值性能的85%,16线程DGEMM性能达到16核浮点峰值性能的80%.对DGEMM函数的优化不仅提高了申威1621平台BLAS函数库性能,也为国产申威系列多核处理器上稠密数据计算优化提供了重要参考. 展开更多
关键词 矩阵乘法 缓存 分块算法 优化 数据预取
下载PDF
上一页 1 2 7 下一页 到第
使用帮助 返回顶部