以Web集群服务器的后端节点作为研究对象,通过减少后端节点的MTTR(Mean Time to Repair),来提高它们的可用性,从而提高整个集群服务器的可用性。首先,通过分析现有的故障恢复方案的不足,提出了新的改进方案,在新的方案中,采用了动态地...以Web集群服务器的后端节点作为研究对象,通过减少后端节点的MTTR(Mean Time to Repair),来提高它们的可用性,从而提高整个集群服务器的可用性。首先,通过分析现有的故障恢复方案的不足,提出了新的改进方案,在新的方案中,采用了动态地检测和发送状态信息的策略,并引入了故障猜测状态,弥补了现有方案的不足。最后设计了一个试验环境,与现有的方案测试相比,使用改进的方案,MTTR(平均故障修复时间)减少了63%,很好地提高了后端节点的可用性。展开更多
文摘以Web集群服务器的后端节点作为研究对象,通过减少后端节点的MTTR(Mean Time to Repair),来提高它们的可用性,从而提高整个集群服务器的可用性。首先,通过分析现有的故障恢复方案的不足,提出了新的改进方案,在新的方案中,采用了动态地检测和发送状态信息的策略,并引入了故障猜测状态,弥补了现有方案的不足。最后设计了一个试验环境,与现有的方案测试相比,使用改进的方案,MTTR(平均故障修复时间)减少了63%,很好地提高了后端节点的可用性。