2005.
29计算机工程与应用2005.
29计算机工程与应用2005.
29计算机工程与应用1引言商用处理器和网络的发展促进了更大规模机群系统的快速发展"1#.
然而,随着机群系统规模增大,部件增多,机群系统的整体故障概率也不断上升.
例如,一台有65536个处理器的Blue,-e.
e/0系统平均每隔几个小时就要遭遇一次节点失效"2#.
很多运行在机群系统上的科学计算任务一次要运行几天或者几个月,应用的运行时间比硬件的平均故障间隔时间(12B3)长,容错技术已经成为避免造成资源的巨大浪费的不可或缺的需求.
检查点切取4恢复技术通过将足够的进程信息记录到外存文件,避免了应用程序在每次节点失效后重头运行,使资源浪费的情况得以缓解,是一种有效的容错方法.
检查点主要包括两个基本过程"3#:状态检查(56e789:;.
eCE系统.
本文主要基于0CGHE操作系统,研究系统级检查点机制的性能优化策略.
检查点设置的时间开销(76e789:Ie:JeA6e@K)是检查点系统中进程地址空间的优化存储策略李艳红孟丹周应超武林平(中国科学院计算技术研究所,北京1000L0)MNI@;l:lO6P.
7;7.
@7.
7.
摘要机群系统的规模增大,部件增多,导致了机群的组合错误率也不断上升.
节点失效使运行于机群节点上的作业面临中途失败,从而造成巨大的资源浪费,甚至导致大量的作业无法完成.
检查点系统为节点提供了较好的容错性能,因此成为机群操作系统软件的重要组成部分.
进程的地址空间是检查点系统需要记录的一部分重要内容,对它的存储效率直接影响检查点操作的性能.
论文提出了两种检查点系统中进程地址空间的优化存储策略.
其中组合式检查点文件写策略解决了并发写机制在应用内存接近物理内存时的性能突降问题,DNQ(D77eNQAKeA)进程地址空间存储策略调整传统地址空间的存储顺序,使大内存应用的检查点操作性能得到了大幅度提升.
以前我们在参与到云服务商促销活动的时候周期基本是一周时间,而如今我们会看到无论是云服务商还是电商活动基本上周期都要有超过一个月,所以我们有一些网友习惯在活动结束之前看看商家是不是有最后的促销活动吸引力的,比如有看到阿里云年中活动最后一周,如果我们有需要云服务器的可以看看。在前面的文章中(阿里云新人福利选择共享性N4云服务器年79.86元且送2月数据库),(LAOZUO.ORG)有提到阿里云今年的云...
至今为止介绍了很多UCLOUD云服务器的促销活动,UCLOUD业者以前看不到我们的个人用户,即使有促销活动,续费也很少。现在新用户的折扣力很大,包括旧用户在内也有一部分折扣。结果,我们的用户是他们的生存动力。没有共享他们的信息的理由是比较受欢迎的香港云服务器CN2GIA线路产品缺货。这不是刚才看到邮件注意和刘先生的通知,而是补充UCLOUD香港云服务器、INTELCPU配置的服务器。如果我们需要他...
BuyVM商家属于比较老牌的服务商,早年有提供低价年付便宜VPS主机还记得曾经半夜的时候抢购的。但是由于这个商家风控非常严格,即便是有些是正常的操作也会导致被封账户,所以后来陆续无人去理睬,估计被我们风控的抢购低价VPS主机已经手足无措。这两年商家重新调整,而且风控也比较规范,比如才入手他们新上线的流媒体优化VPS主机也没有不适的提示。目前,BuyVM商家有提供新泽西、迈阿密等四个机房的VPS主机...