板坯连铸机动态轻压下过程控制系统的高可用性实现祭程!
,赵琦!
,朱苗勇!
,田建良",程乃良"(!
#东北大学材料与冶金学院,辽宁沈阳!
!
$$$%;"#上海宝钢集团梅山钢铁股份有限公司)[摘要]阐述了梅钢"&板坯连铸机动态轻压下过程控制系统的高可用性架构过程,提出了一种软件故障自主恢复与硬件热备冗余相结合的高可用性系统架构方案,并结合实际生产过程分析了备机切换过程中检查点数据的可用性,最后给出了系统故障测试结果.
实际表明,系统投产以后运行稳定,达到了预期目标.
[关键词]双机热备;高可用性;系统管理;板坯连铸;动态轻压下[中图分类号]'("%)*+;',"+-[文献标识码].
[文章编号]!
$$$/+$0)("$$+)$"/$$%0/$%012*/%3"4501),-264)"0/7,04-5540/),0'5*5)-310,5'%(40/)"/60654%5)"/#3%4$"/-1234567!
,89:;=@A/BA67!
,'2:C1=@6/D=@67",39EC(C@=/D=@67"(!
#FG4AADAH@I5J=@DKL5I@DDMJ7B,CAJI45@KI5J6>6=N5JK=IB,F456B@67!
!
$$$%,34=6@;"#5=K4@62JA6@6OFI55D3APIOAHF4@674@=.
@AKI55D(JAMQ)+(5),%4):'45HJ@R5S=I44=74@N@=D@T=D=IBHAJOB6@R=GKAHIJ5OMGI=A6QJAG5KKGA6IJADKBKI5RAHCA"KD@TGA6I=6MAMKG@KI=67R@G4=65=65=7@67=K=6IJAOMG5O#:9:KBKI5RHJ@R5KG45R5,GART=65OKAHIS@J5R@D/HM6GI=A6K5DH/J5GAN5J=67S=I44@JOS@J54AI/KI@6OTBJ5OM6O@6GB,S@KQJ5K56I5O#:N@=D@T=D=IBAHG45GUQA=6IO@I@=6KS=IG4AN5JQJAG5KKAHKI@6OTBGARQMI5JS@K@6@DBV5O=6N=5SAH@GIM@DQJAOMGI=A6#W=6@DDB,J5KMDIKAHKBKI5RTM7I5KI=67@J57=N56#,J@GI=G5K4ASKI4@IAQ5J@I=A6AHI45KBKI5R=KKI@TD5@6O5XQ5GI5O7A@D=KJ5@G45O#8-*90,25:4AI/KI@6OTB;4=74@N@=D@T=D=IB;KBKI5RR@6@75R56I;KD@TGA6I=6MAMKG@KI=67;OB6@R=GKAHIJ5/OMGI=A6连铸过程对连铸坯实施轻压下操作是消除中心偏析、提高连铸坯内部质量的有效手段.
在着力开发此技术的工艺控制核心模型的同时,控制系统的稳定性和安全性问题也显得尤为重要.
针对连铸生产过程的实时性和连续性,在上海宝钢集团梅山钢铁股份有限公司"&连铸机动态轻压下过程控制系统[!
]开发过程中,通过高可用性架构,将系统故障时间控制在!
4Y@内["].
在系统硬件架构方面采用两台服务器和磁盘阵列柜建立双机热备系统;软件架构方面利用系统管理模块,对系统进行监控和管理,增加了软件本身的自主恢复能力.
:系统的高可用性架构动态轻压下过程控制系统采用双节点群集模式架构[-Z%]:当系统工作时,工作节点对外提供服务,备用节点监控工作节点运行情况,不参与对外服务.
当工作节点出现异常时,备用节点主动接管工作机的工作,继续对外提供服务,从而保证系统的不间断运行.
原来的工作节点进行故障处理后,根据预先设定的配置命令以人工或自动的方[收稿日期][修改稿收到日期][作者简介]祭程(!
)\$/),男,山东济南人,助教,博士研究生,主要研究方向为冶金过程控制.
·0%·梅钢动态轻压下过程控制系统专栏冶金自动化;高可用性架构3)@A@'B(C'1BD(1E'**E1/F(1@*G*F'CB1(*@A*1BF('0HEF)1/无法解决时再转入热备机切换.
系统实现自主修复的关键为系统管理模块对其他模块的实时监控与重启功能.
系统管理模块具有看门狗功能,即在系统运行过程中,通过信号交互,实时检测模型计算、数据通信等其他模块的运行状态,如果被检测对象出现异常,则迅速将异常模块重启.
如果系统管理模块在一定时间无法使系统恢复正常,系统管理模块将自动关闭,群集管理器检测到后转入备机切换过程.
如图4所示.
具体恢复过程如下:(!
)数据管理模块以!
*的循环周期向磁盘阵列柜写入系统启动初始所需的检查点数据.
(4)模型计算模块、数据管理模块或数据通信模块中的线程存在未处理异常(I/>/0@'0'JE'DKF)1/[-])时,该模块中相应的进程将自动退出,不弹出错误描述对话框.
(+)系统管理模块通过调用L'F:(1E'**M'(*)1/函数以!
*的短周期实时检测其他模块的运行情况,如果检测到被监控模块中线程存在的未处理异常引起了程序的异常退出,立即调用N('F':(1KE'**函数启动被监控对象;利用I*'(+4O0@@中"*=H/('0)判断被监控模块是否响应,如没有响应则终止它.
(,)一旦系统管理模块监测到其他模块在设·-,·板坯连铸机动态轻压下过程控制系统的高可用性实现0%)12(%34&%+3.
!
55673!
万方数据图!
系统恢复过程流程图01+0(&20+/3+&(0.
.
定时间内连续$次没有响应或异常退出,则认为软件系统无法实现故障自恢复,系统管理模块自动关闭,转入备机切换过程.
(4)备机的过程控制系统启动过程中首先获取当前系统时间并与检查点数据时间比较,采用相应的算法在可接受的误差范围内校正检查点数据.
如果当前检查点数据不可用,继续读取前一时刻检查点,直到读取到完整的检查点数据为止.
结合检查点数据与当前流线状态,系统恢复生产服务.
(5)此外,当出现操作系统崩溃、硬件异常等系统管理模块无法恢复的故障时,直接转入备机切换.
备机的热切换功能基于6"78&'.
9020+$::;群集管理器实现.
"检查点数据可用性分析动态轻压下过程控制系统核心计算模型均基于跟踪单元方法架构[],即将数据通信模块读取的当前流线信息与检查点信息对比,选择距当前时刻最近且完整的检查点数据与当前通信信息一同输入工艺模型进行计算.
保证了温度场计算在时间和空间上的连续,同时降低了平均拉速的计算误差.
生产过程中,计算周期越短计算精度越高,对计算周期4.
和:.
两种情况进行仿真比较得出:稳态浇铸条件下,两种情况计算无偏差;在非稳态浇铸条件下,设定铸机在:.
内拉速从$@:1A1"7降至:,改变计算周期前后温度场计算偏差BC,水量设定值偏差C,且对新生成的跟踪单元无影·高可用性实现冶金自动化!
##$年第!
期万方数据响.
因此可以认为,当备机切换时间小于!
"#时,切换过程前后模型计算偏差小于$%,可以忽略.
!
系统功能测试与分析上线调试期间,对系统进行了故障测试,表!
给出了测试结果.
故障测试表明:(!
)过程控制系统本身的自主恢复功能,大大降低了双机热备切换次数,使软件引起的故障恢复时间控制在一个通信周期()以表"系统测试结果01+#2345#6#+*7故障测试项目测试结果强行结束模型计算模块、数据通信模块或数据管理模块.
系统界面无影响,运行正常.
强行结束系统管理模块.
切换至备机,切换时间$#,切换后程序运行正常.
连续强行结束模型计算模块、数据通信模块或数据管理模块.
切换至备机,切换时间8#,切换后程序运行正常.
强行删除模型计算模块、数据通信模块或数据管理模块的关键文件,造成该模块无法正常启动,并关闭该模块.
切换至备机,切换时间8#,切换后程序运行正常.
强行结束操作系统关键进程造成系统崩溃.
切换至备机,切换时间$#,切换后程序运行正常.
工作机强行断电.
切换至备机,切换时间$#,切换后程序运行正常.
备用机强行断电.
群集管理器提示错误,程序运行正常.
拔掉心跳线.
群集管理器提示错误,程序运行正常.
拔掉工作机网线.
切换至备机,切换时间$#,切换后程序运行正常.
拔掉工作机与磁盘阵列的数据线.
切换至备机,切换时间$#,切换后程序运行正常.
内.
(9)系统管理模块的后台处理保证了系统界面的连续性,无异常反应.
(:)在操作系统崩溃、硬件异常、过程控制软件连续无响应、系统管理模块关闭四种情况下进行双机热备切换,系统恢复时间小于两个通信周期(!
"#),满足生产要求.
($)热备系统切换前后,过程控制系统数据计算连续,无异常跳跃.
#结论梅钢9;板坯连铸机动态轻压下过程控制系统采用软件与硬件相结合的方式实现系统的高可用性.
当控制程序内部模块出现运行错误时,首先进行系统自恢复,恢复时间小于一个通信周期,大大降低了双机热备切换机率.
当操作系统故障、硬件故障或系统管理模块无法完成自主恢复时,系统在两个通信周期内完成热备机切换.
结合工艺控制过程对检查点数据的可用性和系统恢复前后的数据连续性进行了分析,仿真结果表明备机切换引起的系统控制精度误差小于$%.
在线调试结果表明,系统故障最大恢复时间不超过!
"#.
系统投用至今运行稳定,产量已超过&"万+.
[参考文献][!
]祭程,朱苗勇,程乃良,:!
(!
):&!
&$,:!
(!
):&!
&$(8):!
&9$!
&>"(8):!
&9$!
&>"]祭程,张书岩,赵琦,等)[45S,V,*,ND\,0LB0(-,NF@Q0(-):编辑:夏宁]·X$·板坯连铸机动态轻压下过程控制系统的高可用性实现0)1&*23)&45'&,4/6778946万方数据板坯连铸机动态轻压下过程控制系统的高可用性实现作者:祭程,赵琦,朱苗勇,田建良,程乃良,JICheng,ZHAOQi,ZHUMiao-yong,TIANJian-liang,CHENGNai-liang作者单位:祭程,赵琦,朱苗勇,JICheng,ZHAOQi,ZHUMiao-yong(东北大学,材料与冶金学院,辽宁,沈阳,110004),田建良,程乃良,TIANJian-liang,CHENGNai-liang(上海宝钢集团梅山钢铁股份有限公司)刊名:冶金自动化英文刊名:METALLURGICALINDUSTRYAUTOMATION年,卷(期):2007,31(2)参考文献(8条)1.
祭程;朱苗勇;程乃良板坯连铸机动态轻压下过程控制系统研究与实现[期刊论文]-冶金自动化2007(01)2.
胡兵全基于Windows的双机热备系统的设计与实现[学位论文]20043.
于斌;刘宏伟;崔刚高可用双机容错服务器的研究与设计[期刊论文]-计算机工程与设计2006(09)4.
RajkumarBuyyaHighperformanceclustercomputingarchitectureandsystem20015.
PMChen;EKLee;GAGibsonRAID:high-performance,reliablesecondarystorage1994(02)6.
JeffreyRichter;王建华Windows核心编程20007.
祭程;张书岩;赵琦连铸板坯轻压下实时温度场计算及动态二冷控制模型的研究与开发[会议论文]20058.
沙丽杰;武秀川;韦鹓分布式系统检查点算法中程序卷回时文件系统的状态恢复[期刊论文]-计算机工程与应用2002(17)引用本文格式:祭程.
赵琦.
朱苗勇.
田建良.
程乃良.
JICheng.
ZHAOQi.
ZHUMiao-yong.
TIANJian-liang.
CHENGNai-liang板坯连铸机动态轻压下过程控制系统的高可用性实现[期刊论文]-冶金自动化2007(2)
恒创科技也有暑期的活动,其中香港服务器也有一定折扣,当然是针对新用户的,如果我们还没有注册过或者可以有办法注册到新用户的,可以买他们家的香港服务器活动价格,2M带宽香港云服务器317元。对于一般用途还是够用的。 活动链接:恒创暑期活动爆款活动均是针对新用户的。1、云服务器仅限首次购买恒创科技产品的新用户。1 核 1G 实例规格,单个账户限购 1台;其他活动机型,单个账户限购 3 台(必须在一个订单...
关于Linode,这是一家运营超过18年的VPS云主机商家,产品支持随时删除(按小时计费),可选包括美国、英国、新加坡、日本、印度、加拿大、德国等全球十多个数据中心,最低每月费用5美元($0.0075/小时)起。目前,注册Linode的新用户添加付款方式后可以获得100美元赠送,有效期为60天,让更多新朋友可以体验Linode的产品和服务。Linode的云主机产品分为几类,下面分别列出几款套餐配置...
无忧云官网无忧云怎么样 无忧云服务器好不好 无忧云值不值得购买 无忧云,无忧云是一家成立于2017年的老牌商家旗下的服务器销售品牌,现由深圳市云上无忧网络科技有限公司运营,是正规持证IDC/ISP/IRCS商家,主要销售国内、中国香港、国外服务器产品,线路有腾讯云国外线路、自营香港CN2线路等,都是中国大陆直连线路,非常适合免北岸建站业务需求和各种负载较高的项目,同时国内服务器也有多个BGP以及高...
高可用性为你推荐
空间邮箱QQ邮箱的容量是多少网罗设计怎么能学习好网络设计8080端口路由器如何开8080端口怎么查询商标怎样查询商标有没有被注册方法有哪些?丑福晋大福晋比正福晋大么斗城网女追男有多易?喜欢你,可我不知道你喜不喜欢我!!平安夜希望有他陪我过sodu.tw台湾人看小说的网站是sodu.tw给个看免费小说的网站www.k8k8.com谁能给我几个街污网站我去自己学www.jsjtxx.com怎样让电脑安全又高速
联通vps 播放vps上的视频 淘宝二级域名 ix主机 美国主机网 BWH 域名优惠码 500m空间 华为4核 ca4249 工作站服务器 服务器干什么用的 1元域名 789 重庆联通服务器托管 shuangcheng 美国asp空间 web是什么意思 阿里云宕机故障 赵荣博客 更多