2005.
29计算机工程与应用2005.
29计算机工程与应用2005.
29计算机工程与应用1引言商用处理器和网络的发展促进了更大规模机群系统的快速发展"1#.
然而,随着机群系统规模增大,部件增多,机群系统的整体故障概率也不断上升.
例如,一台有65536个处理器的Blue,-e.
e/0系统平均每隔几个小时就要遭遇一次节点失效"2#.
很多运行在机群系统上的科学计算任务一次要运行几天或者几个月,应用的运行时间比硬件的平均故障间隔时间(12B3)长,容错技术已经成为避免造成资源的巨大浪费的不可或缺的需求.
检查点切取4恢复技术通过将足够的进程信息记录到外存文件,避免了应用程序在每次节点失效后重头运行,使资源浪费的情况得以缓解,是一种有效的容错方法.
检查点主要包括两个基本过程"3#:状态检查(56e789:;.
eCE系统.
本文主要基于0CGHE操作系统,研究系统级检查点机制的性能优化策略.
检查点设置的时间开销(76e789:Ie:JeA6e@K)是检查点系统中进程地址空间的优化存储策略李艳红孟丹周应超武林平(中国科学院计算技术研究所,北京1000L0)MNI@;l:lO6P.
7;7.
@7.
7.
摘要机群系统的规模增大,部件增多,导致了机群的组合错误率也不断上升.
节点失效使运行于机群节点上的作业面临中途失败,从而造成巨大的资源浪费,甚至导致大量的作业无法完成.
检查点系统为节点提供了较好的容错性能,因此成为机群操作系统软件的重要组成部分.
进程的地址空间是检查点系统需要记录的一部分重要内容,对它的存储效率直接影响检查点操作的性能.
论文提出了两种检查点系统中进程地址空间的优化存储策略.
其中组合式检查点文件写策略解决了并发写机制在应用内存接近物理内存时的性能突降问题,DNQ(D77eNQAKeA)进程地址空间存储策略调整传统地址空间的存储顺序,使大内存应用的检查点操作性能得到了大幅度提升.
官方网站:点击访问火数云活动官网活动方案:CPU内存硬盘带宽流量架构IP机房价格购买地址4核4G50G 高效云盘20Mbps独享不限openstack1个九江287元/月立即抢购4核8G50G 高效云盘20Mbps独享不限openstack1个九江329元/月立即抢购2核2G50G 高效云盘5Mbps独享不限openstack1个大连15.9元/月立即抢购2核4G50G 高效云盘5Mbps独享不限...
进入6月,各大网络平台都开启了618促销,腾讯云目前也正在开展618云上Go活动,上海/北京/广州/成都/香港/新加坡/硅谷等多个地区云服务器及轻量服务器秒杀,最低年付95元起,参与活动的产品还包括短信包、CDN流量包、MySQL数据库、云存储(标准存储)、直播/点播流量包等等,本轮秒杀活动每天5场,一直持续到7月中旬,感兴趣的朋友可以关注本页。活动页面:https://cloud.tencent...
腾讯云轻量应用服务器又要免费升级配置了,之前已经免费升级过一次了(腾讯云轻量应用服务器套餐配置升级 轻量老用户专享免费升配!),这次在上次的基础上再次升级。也许这就是良心云吧,名不虚传。腾讯云怎么样?腾讯云好不好。腾讯云轻量应用服务器 Lighthouse 是一种易于使用和管理、适合承载轻量级业务负载的云服务器,能帮助个人和企业在云端快速构建网站、博客、电商、论坛等各类应用以及开发测试环境,并提供...