2005.
29计算机工程与应用2005.
29计算机工程与应用2005.
29计算机工程与应用1引言商用处理器和网络的发展促进了更大规模机群系统的快速发展"1#.
然而,随着机群系统规模增大,部件增多,机群系统的整体故障概率也不断上升.
例如,一台有65536个处理器的Blue,-e.
e/0系统平均每隔几个小时就要遭遇一次节点失效"2#.
很多运行在机群系统上的科学计算任务一次要运行几天或者几个月,应用的运行时间比硬件的平均故障间隔时间(12B3)长,容错技术已经成为避免造成资源的巨大浪费的不可或缺的需求.
检查点切取4恢复技术通过将足够的进程信息记录到外存文件,避免了应用程序在每次节点失效后重头运行,使资源浪费的情况得以缓解,是一种有效的容错方法.
检查点主要包括两个基本过程"3#:状态检查(56e789:;.
eCE系统.
本文主要基于0CGHE操作系统,研究系统级检查点机制的性能优化策略.
检查点设置的时间开销(76e789:Ie:JeA6e@K)是检查点系统中进程地址空间的优化存储策略李艳红孟丹周应超武林平(中国科学院计算技术研究所,北京1000L0)MNI@;l:lO6P.
7;7.
@7.
7.
摘要机群系统的规模增大,部件增多,导致了机群的组合错误率也不断上升.
节点失效使运行于机群节点上的作业面临中途失败,从而造成巨大的资源浪费,甚至导致大量的作业无法完成.
检查点系统为节点提供了较好的容错性能,因此成为机群操作系统软件的重要组成部分.
进程的地址空间是检查点系统需要记录的一部分重要内容,对它的存储效率直接影响检查点操作的性能.
论文提出了两种检查点系统中进程地址空间的优化存储策略.
其中组合式检查点文件写策略解决了并发写机制在应用内存接近物理内存时的性能突降问题,DNQ(D77eNQAKeA)进程地址空间存储策略调整传统地址空间的存储顺序,使大内存应用的检查点操作性能得到了大幅度提升.
百纵科技:美国高防服务器,洛杉矶C3机房 独家接入zenlayer清洗 带金盾硬防,CPU全系列E52670、E52680v3 DDR4内存 三星固态盘阵列!带宽接入了cn2/bgp线路,速度快,无需备案,非常适合国内外用户群体的外贸、搭建网站等用途。C3机房,双程CN2线路,默认200G高防,3+1(高防IP),不限流量,季付送带宽美国洛杉矶C3机房套餐处理器内存硬盘IP数带宽线路防御价格/月套...
justhost怎么样?justhost是一家俄罗斯主机商,2006年成立,提供各种主机服务,vps基于kvm,有HDD和SSD硬盘两种,特色是200Mbps不限流量(之前是100Mbps,现在升级为200Mbps)。下面是HDD硬盘的KVM VPS,性价比最高,此外还有SSD硬盘的KVM VPS,价格略高。支持Paypal付款。国内建议选择新西伯利亚或者莫斯科DataLine。支持Paypal付...
第一、香港服务器机房这里我们可以看到有提供四个大带宽方案,是全向带宽和国际带宽,前者适合除了中国大陆地区的全网地区用户可以用,后者国际带宽适合欧美地区业务。如果我们是需要大陆地区速度CN2优化的,那就需要选择常规的优化带宽方案,参考这里。CPU内存硬盘带宽流量价格选择E3-12308GB240GB SSD50M全向带宽不限999元/月方案选择E3-12308GB240GB SSD100M国际带宽不...