2005.
29计算机工程与应用2005.
29计算机工程与应用2005.
29计算机工程与应用1引言商用处理器和网络的发展促进了更大规模机群系统的快速发展"1#.
然而,随着机群系统规模增大,部件增多,机群系统的整体故障概率也不断上升.
例如,一台有65536个处理器的Blue,-e.
e/0系统平均每隔几个小时就要遭遇一次节点失效"2#.
很多运行在机群系统上的科学计算任务一次要运行几天或者几个月,应用的运行时间比硬件的平均故障间隔时间(12B3)长,容错技术已经成为避免造成资源的巨大浪费的不可或缺的需求.
检查点切取4恢复技术通过将足够的进程信息记录到外存文件,避免了应用程序在每次节点失效后重头运行,使资源浪费的情况得以缓解,是一种有效的容错方法.
检查点主要包括两个基本过程"3#:状态检查(56e789:;.
eCE系统.
本文主要基于0CGHE操作系统,研究系统级检查点机制的性能优化策略.
检查点设置的时间开销(76e789:Ie:JeA6e@K)是检查点系统中进程地址空间的优化存储策略李艳红孟丹周应超武林平(中国科学院计算技术研究所,北京1000L0)MNI@;l:lO6P.
7;7.
@7.
7.
摘要机群系统的规模增大,部件增多,导致了机群的组合错误率也不断上升.
节点失效使运行于机群节点上的作业面临中途失败,从而造成巨大的资源浪费,甚至导致大量的作业无法完成.
检查点系统为节点提供了较好的容错性能,因此成为机群操作系统软件的重要组成部分.
进程的地址空间是检查点系统需要记录的一部分重要内容,对它的存储效率直接影响检查点操作的性能.
论文提出了两种检查点系统中进程地址空间的优化存储策略.
其中组合式检查点文件写策略解决了并发写机制在应用内存接近物理内存时的性能突降问题,DNQ(D77eNQAKeA)进程地址空间存储策略调整传统地址空间的存储顺序,使大内存应用的检查点操作性能得到了大幅度提升.
官方网站:点击访问青云互联活动官网优惠码:终身88折扣优惠码:WN789-2021香港测试IP:154.196.254美国测试IP:243.164.1活动方案:用户购买任意全区域云服务器月付以上享受免费更换IP服务;限美国区域云服务器凡是购买均可以提交工单定制天机防火墙高防御保护端口以及保护模式;香港区域购买季度、半年付、年付周期均可免费申请额外1IP;使用优惠码购买后续费周期终身同活动价,价格不...
优惠码50SSDOFF 首月5折50WHTSSD 年付5折15OFF 85折优惠,可循环使用荷兰VPSCPU内存SSD带宽IPv4价格购买1核1G50G1Gbps/3TB1个$ 9.10/月链接2核2G80G1Gbps/5TB1个$ 12.70/月链接2核3G100G1Gbps/7TB1个$ 16.30/月链接3核4G150G1Gbps/10TB1个$ 18.10/月链接阿联酋VPSCPU内存SS...
buyvm的第四个数据中心上线了,位于美国东南沿海的迈阿密市。迈阿密的VPS依旧和buyvm其他机房的一样,KVM虚拟,Ryzen 9 3900x、DDR4、NVMe、1Gbps带宽、不限流量。目前还没有看见buyvm上架迈阿密的block storage,估计不久也会有的。 官方网站:https://my.frantech.ca/cart.php?gid=48 加密货币、信用卡、PayPal、...