切换高可用性

高可用性  时间:2021-03-26  阅读:()
板坯连铸机动态轻压下过程控制系统的高可用性实现祭程!
,赵琦!
,朱苗勇!
,田建良",程乃良"(!
#东北大学材料与冶金学院,辽宁沈阳!
!
$$$%;"#上海宝钢集团梅山钢铁股份有限公司)[摘要]阐述了梅钢"&板坯连铸机动态轻压下过程控制系统的高可用性架构过程,提出了一种软件故障自主恢复与硬件热备冗余相结合的高可用性系统架构方案,并结合实际生产过程分析了备机切换过程中检查点数据的可用性,最后给出了系统故障测试结果.
实际表明,系统投产以后运行稳定,达到了预期目标.
[关键词]双机热备;高可用性;系统管理;板坯连铸;动态轻压下[中图分类号]'("%)*+;',"+-[文献标识码].
[文章编号]!
$$$/+$0)("$$+)$"/$$%0/$%012*/%3"4501),-264)"0/7,04-5540/),0'5*5)-310,5'%(40/)"/60654%5)"/#3%4$"/-1234567!
,89:;=@A/BA67!
,'2:C1=@6/D=@67",39EC(C@=/D=@67"(!
#FG4AADAH@I5J=@DKL5I@DDMJ7B,CAJI45@KI5J6>6=N5JK=IB,F456B@67!
!
$$$%,34=6@;"#5=K4@62JA6@6OFI55D3APIOAHF4@674@=.
@AKI55D(JAMQ)+(5),%4):'45HJ@R5S=I44=74@N@=D@T=D=IBHAJOB6@R=GKAHIJ5OMGI=A6QJAG5KKGA6IJADKBKI5RAHCA"KD@TGA6I=6MAMKG@KI=67R@G4=65=65=7@67=K=6IJAOMG5O#:9:KBKI5RHJ@R5KG45R5,GART=65OKAHIS@J5R@D/HM6GI=A6K5DH/J5GAN5J=67S=I44@JOS@J54AI/KI@6OTBJ5OM6O@6GB,S@KQJ5K56I5O#:N@=D@T=D=IBAHG45GUQA=6IO@I@=6KS=IG4AN5JQJAG5KKAHKI@6OTBGARQMI5JS@K@6@DBV5O=6N=5SAH@GIM@DQJAOMGI=A6#W=6@DDB,J5KMDIKAHKBKI5RTM7I5KI=67@J57=N56#,J@GI=G5K4ASKI4@IAQ5J@I=A6AHI45KBKI5R=KKI@TD5@6O5XQ5GI5O7A@D=KJ5@G45O#8-*90,25:4AI/KI@6OTB;4=74@N@=D@T=D=IB;KBKI5RR@6@75R56I;KD@TGA6I=6MAMKG@KI=67;OB6@R=GKAHIJ5/OMGI=A6连铸过程对连铸坯实施轻压下操作是消除中心偏析、提高连铸坯内部质量的有效手段.
在着力开发此技术的工艺控制核心模型的同时,控制系统的稳定性和安全性问题也显得尤为重要.
针对连铸生产过程的实时性和连续性,在上海宝钢集团梅山钢铁股份有限公司"&连铸机动态轻压下过程控制系统[!
]开发过程中,通过高可用性架构,将系统故障时间控制在!
4Y@内["].
在系统硬件架构方面采用两台服务器和磁盘阵列柜建立双机热备系统;软件架构方面利用系统管理模块,对系统进行监控和管理,增加了软件本身的自主恢复能力.
:系统的高可用性架构动态轻压下过程控制系统采用双节点群集模式架构[-Z%]:当系统工作时,工作节点对外提供服务,备用节点监控工作节点运行情况,不参与对外服务.
当工作节点出现异常时,备用节点主动接管工作机的工作,继续对外提供服务,从而保证系统的不间断运行.
原来的工作节点进行故障处理后,根据预先设定的配置命令以人工或自动的方[收稿日期][修改稿收到日期][作者简介]祭程(!
)\$/),男,山东济南人,助教,博士研究生,主要研究方向为冶金过程控制.
·0%·梅钢动态轻压下过程控制系统专栏冶金自动化;高可用性架构3)@A@'B(C'1BD(1E'**E1/F(1@*G*F'CB1(*@A*1BF('0HEF)1/无法解决时再转入热备机切换.
系统实现自主修复的关键为系统管理模块对其他模块的实时监控与重启功能.
系统管理模块具有看门狗功能,即在系统运行过程中,通过信号交互,实时检测模型计算、数据通信等其他模块的运行状态,如果被检测对象出现异常,则迅速将异常模块重启.
如果系统管理模块在一定时间无法使系统恢复正常,系统管理模块将自动关闭,群集管理器检测到后转入备机切换过程.
如图4所示.
具体恢复过程如下:(!
)数据管理模块以!
*的循环周期向磁盘阵列柜写入系统启动初始所需的检查点数据.
(4)模型计算模块、数据管理模块或数据通信模块中的线程存在未处理异常(I/>/0@'0'JE'DKF)1/[-])时,该模块中相应的进程将自动退出,不弹出错误描述对话框.
(+)系统管理模块通过调用L'F:(1E'**M'(*)1/函数以!
*的短周期实时检测其他模块的运行情况,如果检测到被监控模块中线程存在的未处理异常引起了程序的异常退出,立即调用N('F':(1KE'**函数启动被监控对象;利用I*'(+4O0@@中"*=H/('0)判断被监控模块是否响应,如没有响应则终止它.
(,)一旦系统管理模块监测到其他模块在设·-,·板坯连铸机动态轻压下过程控制系统的高可用性实现0%)12(%34&%+3.
!
55673!
万方数据图!
系统恢复过程流程图01+0(&20+/3+&(0.
.
定时间内连续$次没有响应或异常退出,则认为软件系统无法实现故障自恢复,系统管理模块自动关闭,转入备机切换过程.
(4)备机的过程控制系统启动过程中首先获取当前系统时间并与检查点数据时间比较,采用相应的算法在可接受的误差范围内校正检查点数据.
如果当前检查点数据不可用,继续读取前一时刻检查点,直到读取到完整的检查点数据为止.
结合检查点数据与当前流线状态,系统恢复生产服务.
(5)此外,当出现操作系统崩溃、硬件异常等系统管理模块无法恢复的故障时,直接转入备机切换.
备机的热切换功能基于6"78&'.
9020+$::;群集管理器实现.
"检查点数据可用性分析动态轻压下过程控制系统核心计算模型均基于跟踪单元方法架构[],即将数据通信模块读取的当前流线信息与检查点信息对比,选择距当前时刻最近且完整的检查点数据与当前通信信息一同输入工艺模型进行计算.
保证了温度场计算在时间和空间上的连续,同时降低了平均拉速的计算误差.
生产过程中,计算周期越短计算精度越高,对计算周期4.
和:.
两种情况进行仿真比较得出:稳态浇铸条件下,两种情况计算无偏差;在非稳态浇铸条件下,设定铸机在:.
内拉速从$@:1A1"7降至:,改变计算周期前后温度场计算偏差BC,水量设定值偏差C,且对新生成的跟踪单元无影·高可用性实现冶金自动化!
##$年第!
期万方数据响.
因此可以认为,当备机切换时间小于!
"#时,切换过程前后模型计算偏差小于$%,可以忽略.
!
系统功能测试与分析上线调试期间,对系统进行了故障测试,表!
给出了测试结果.
故障测试表明:(!
)过程控制系统本身的自主恢复功能,大大降低了双机热备切换次数,使软件引起的故障恢复时间控制在一个通信周期(&#)以表"系统测试结果01+#2345#6#+*7故障测试项目测试结果强行结束模型计算模块、数据通信模块或数据管理模块.
系统界面无影响,运行正常.
强行结束系统管理模块.
切换至备机,切换时间$#,切换后程序运行正常.
连续强行结束模型计算模块、数据通信模块或数据管理模块.
切换至备机,切换时间8#,切换后程序运行正常.
强行删除模型计算模块、数据通信模块或数据管理模块的关键文件,造成该模块无法正常启动,并关闭该模块.
切换至备机,切换时间8#,切换后程序运行正常.
强行结束操作系统关键进程造成系统崩溃.
切换至备机,切换时间$#,切换后程序运行正常.
工作机强行断电.
切换至备机,切换时间$#,切换后程序运行正常.
备用机强行断电.
群集管理器提示错误,程序运行正常.
拔掉心跳线.
群集管理器提示错误,程序运行正常.
拔掉工作机网线.
切换至备机,切换时间$#,切换后程序运行正常.
拔掉工作机与磁盘阵列的数据线.
切换至备机,切换时间$#,切换后程序运行正常.
内.
(9)系统管理模块的后台处理保证了系统界面的连续性,无异常反应.
(:)在操作系统崩溃、硬件异常、过程控制软件连续无响应、系统管理模块关闭四种情况下进行双机热备切换,系统恢复时间小于两个通信周期(!
"#),满足生产要求.
($)热备系统切换前后,过程控制系统数据计算连续,无异常跳跃.
#结论梅钢9;板坯连铸机动态轻压下过程控制系统采用软件与硬件相结合的方式实现系统的高可用性.
当控制程序内部模块出现运行错误时,首先进行系统自恢复,恢复时间小于一个通信周期,大大降低了双机热备切换机率.
当操作系统故障、硬件故障或系统管理模块无法完成自主恢复时,系统在两个通信周期内完成热备机切换.
结合工艺控制过程对检查点数据的可用性和系统恢复前后的数据连续性进行了分析,仿真结果表明备机切换引起的系统控制精度误差小于$%.
在线调试结果表明,系统故障最大恢复时间不超过!
"#.
系统投用至今运行稳定,产量已超过&"万+.
[参考文献][!
]祭程,朱苗勇,程乃良,:!
(!
):&!
&$,:!
(!
):&!
&$(8):!
&9$!
&>"(8):!
&9$!
&>"]祭程,张书岩,赵琦,等)[45S,V,*,ND\,0LB0(-,NF@Q0(-):编辑:夏宁]·X$·板坯连铸机动态轻压下过程控制系统的高可用性实现0)1&*23)&45'&,4/6778946万方数据板坯连铸机动态轻压下过程控制系统的高可用性实现作者:祭程,赵琦,朱苗勇,田建良,程乃良,JICheng,ZHAOQi,ZHUMiao-yong,TIANJian-liang,CHENGNai-liang作者单位:祭程,赵琦,朱苗勇,JICheng,ZHAOQi,ZHUMiao-yong(东北大学,材料与冶金学院,辽宁,沈阳,110004),田建良,程乃良,TIANJian-liang,CHENGNai-liang(上海宝钢集团梅山钢铁股份有限公司)刊名:冶金自动化英文刊名:METALLURGICALINDUSTRYAUTOMATION年,卷(期):2007,31(2)参考文献(8条)1.
祭程;朱苗勇;程乃良板坯连铸机动态轻压下过程控制系统研究与实现[期刊论文]-冶金自动化2007(01)2.
胡兵全基于Windows的双机热备系统的设计与实现[学位论文]20043.
于斌;刘宏伟;崔刚高可用双机容错服务器的研究与设计[期刊论文]-计算机工程与设计2006(09)4.
RajkumarBuyyaHighperformanceclustercomputingarchitectureandsystem20015.
PMChen;EKLee;GAGibsonRAID:high-performance,reliablesecondarystorage1994(02)6.
JeffreyRichter;王建华Windows核心编程20007.
祭程;张书岩;赵琦连铸板坯轻压下实时温度场计算及动态二冷控制模型的研究与开发[会议论文]20058.
沙丽杰;武秀川;韦鹓分布式系统检查点算法中程序卷回时文件系统的状态恢复[期刊论文]-计算机工程与应用2002(17)引用本文格式:祭程.
赵琦.
朱苗勇.
田建良.
程乃良.
JICheng.
ZHAOQi.
ZHUMiao-yong.
TIANJian-liang.
CHENGNai-liang板坯连铸机动态轻压下过程控制系统的高可用性实现[期刊论文]-冶金自动化2007(2)

云基最高500G DDoS无视CC攻击(Yunbase),洛杉矶CN2GIA、国内外高防服务器

云基成立于2020年,目前主要提供高防海内外独立服务器用户,欢迎各类追求稳定和高防优质线路的用户。业务可选:洛杉矶CN2-GIA+高防(默认500G高防)、洛杉矶CN2-GIA(默认带50Gbps防御)、香港CN2-GIA高防(双向CN2GIA专线,突发带宽支持,15G-20G DDoS防御,无视CC)、国内高防服务器(广州移动、北京多线、石家庄BGP、保定联通、扬州BGP、厦门BGP、厦门电信、...

ManSora:英国CN2 VPS,1核/1GB内存/10GB SSD/1TB流量/100Mbps/KVM,$18.2/月

mansora怎么样?mansora是一家国人商家,主要提供沪韩IEPL、沪日IEPL、深港IEPL等专线VPS。现在新推出了英国CN2 KVM VPS,线路为AS4809 AS9929,可解锁 Netflix,并有永久8折优惠。英国CN2 VPS,$18.2/月/1GB内存/10GB SSD空间/1TB流量/100Mbps端口/KVM,有需要的可以关注一下。点击进入:mansora官方网站地址m...

Letbox(35美元/年),美国洛杉矶VPS终身7折

Letbox 云服务商在前面的文章中其实也有多次介绍,这个服务商其实也算是比较老牌的海外服务商,几年前我也一直有使用过他们家的VPS主机,早年那时候低至年付15-35美元左右的VPS算式比较稀缺的。后来由于服务商确实比较多,而且也没有太多的网站需要用到,所以就没有续费,最近这个服务商好像有点活动就躁动的发布希望引起他人注意。这不有看到所谓的家中有喜事,应该是团队中有生宝宝了,所以也有借此来发布一些...

高可用性为你推荐
johncusack谁知道《失控的陪审团》的电影内容是什么?约翰·库萨克在里面演的是什么角色?陈嘉垣大家觉得陈嘉桓漂亮还是钟嘉欣漂亮?嘀动网动网和爱动网各自的优势是什么?丑福晋大福晋比正福晋大么lcoc.top服装英语中double topstitches什么意思partnersonlinecashfiesta 该怎么使用啊~~www.zhiboba.com看NBA直播的网站哪个知道梦遗姐男人梦遗,女人会吗?hao.rising.cn我的Google Chrome主页被http://hao.rising.cn//?b=64锁定了,谁有办法?蜘蛛机器人在《红色警戒2共和国之辉》中,对付“蜘蛛机器人”的最好武器是什么?
老域名 免费vps 免费顶级域名 2014年感恩节 火车票抢票攻略 网通代理服务器 独享主机 贵阳电信测速 lamp什么意思 深圳域名 免费php空间 创速 广东服务器托管 asp空间 privatetracker 九零网络 asp介绍 symantec 阿里云宕机故障 bwg 更多