期刊文献+

并行计算机系统容错设计 被引量:3

Research on the Fault-Tolerant Design of Parallel Computer Systems
下载PDF
导出
摘要 容错设计是提高计算机系统可靠性的有效手段。本文提出了一种分布共享主存的并行计算机系统的容错结构,着重分析了结构采用的故障诊断机制,提出了系统中备份节点机配置的优化策略。 Fault-tolerant design is an effective method to improve the reliability of computer systems. This paper proposes a fault-tolerant architecture for parallel computer systems, analyzes the fault diagnosis techniques employed in this architecture and presents the configuration optimization strategy for stand-by nodes.
出处 《计算机工程与科学》 CSCD 2005年第9期69-70,84,共3页 Computer Engineering & Science
关键词 并行计算机系统 容错 可靠性 故障诊断 parallel computer system fault-tolerance reliability fault diagnosis
  • 相关文献

参考文献4

  • 1Gul N K Han. Fault-Tolerant Architecture for High Performance Embedded System Application[A]. Proc IEEE Conf on Computer Design: VLSI in Computers & Processors[C].1998.384-389. 被引量:1
  • 2Dinusha Naomi Fonseka. FTMPI: A Fault Tolerant Parallel Message Passing Library:[Master Thesis][D].Imperial College of Science, Technology and Medicine (University of London) Department of Computing, 2002. 被引量:1
  • 3Jeremy Brown, J P Grossman, Tom Knight. A Lightweight Idempotent Messaging Protocol for Faulty Networks[A]. Proc 14th ACM Symp on Parallel Algorithms and Architectures[C].2002. 被引量:1
  • 4陈蜀宇 杨晓帆 何中市.基于三值模型的网络分布式系统级故障诊断[A]..第十届全国容错计算学术会议[C].,2003.232-237. 被引量:1

同被引文献19

引证文献3

二级引证文献19

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部