服务器及存储设备维护方案
项目背景及需求
为了保证石家庄市第四医院业务系统稳定持续可靠运行采用了IBM服务器、存储、赛门铁克集群软件。在系统交付后提供专业的厂商维护服务提供保证硬件环境7X24可用性的能力。
服务级别 7*24 服务期 36个月
一、维护服务方案制定原则
本方案主要针对石家庄市第四医院的IBM服务器、存储及相关的操作系统、数据库、系统软件、集群软件制定合理科学的维护策略。方案的制定遵循以下原则
业务为中心
本项目的最终目标是保证业务系统的安全和可靠运行。包括计算机系统的可靠运行和业务数据的安全保证我们将动用一切有效的措施手段力求业务系统万无一失我们的目标是 “非正常性停机时间为零”。
重在措施
注重预防。我们将在传统的被动式服务的基础上提供主动式的服务和客户一起做好系统的监控维护工作。采取以预防为主的策略把故障隐患消灭在萌芽中。
服务组织。服务组织管理和流程管理是项目成功得关键。我们将在责任工程师项目经理 的统一调度下指挥技术、应用、商务及服务监督人员在售前、服务实施、售后的各个环节紧密与客户方配合。
追求最佳性价比
服务的级别意味着客户的成本我们在保障高标准服务的前提下努力通过精心组织、精心实施来降低客户的成本 同时为客户提供更多的增值服务。
二、保修服务内容及标准
本方案针对石家庄市第四医院IBM服务器、存储等相关的硬件设备及操作系统、集群软件维护服务以及数据库协助维护服务、协助应用软件升级、应用软件的备份等服务内容。主要服务项目如下
1)故障排除
在规定时限内排除故障恢复系统运行包括故障定位、部件更换、数据恢复的全部工作不在另外收取任何费用。
2)定期巡检
定期对系统进行预防性维护包括检查系统状态、设备清洁、系统备份 以及与客户工程师的技术交流。
3)培训
我们将免费提供针对项目的技术培训和技术交流。包括
现场培训主要在巡检及项目实施过程中进行由我公司工程师结合实际情况对工程设备的安装调试、使用和维护进行详细的讲解达到客户相关人员能够自主使用和维护系统设备的目标。
专业技术培训
通过培训使相关技术人员能有效管理IBM服务器、监控、 日常操作维护对集群环境、 WINdows环境、系统性能优化等特别予以关注。我公司将免费提供培训师资、教材及搭建培训软硬件环境。
培训的具体地点及安排由我公司和用户协商而定。参考课程如下
服务器、 WINdows系统及网络管理
存储管理
集群高可用方案
故障定位与系统运维常见问题
4)增值服务
咨询服务
解答客户在系统使用中的问题。可通过电话解答客户非保修设备使用中的技
术问题。一般情况下指导客户解决问题特殊情况下可到客户现场指导并解决问题这样可以有效地提高客户的系统管理水平降低系统的人为故障率。
定期发送有关资料使客户及时跟踪掌握相关IT新技术及新产品互相交流系统使用及维护方面的经验。
协助客户建立健全规范的管理制度和系统使用维护的技术流程及规范。建立系统的配置档案和升级维护档案定期提交系统维护及管理报告。
系统升级、扩充
为客户提供系统升级、扩充、改造、迁移等服务。结合客户的实际情况为客户详细制订切实可行的技术方案和合理的费用计划并可提供现场的实施工作。
如客户需要搬迁设备我们可以为客户制订安全周密的搬迁计划并负责实施保证客户设备搬迁后的正常运转省去了客户自行搬迁所带来的烦恼。
协调工作
协调原厂商包括软硬件的维护和维修工作。定期召开例会双方交流向客户方领导汇报工作并听取领导及技术人员的意见和建议。
服务标准
服务工作时间
7X24 X 365电话受理服务请求或帮助客户解决技术问题。
响应时间
接到报修后30分钟内予以实质性响应工程师8小时内到达服务现场。
故障恢复时间
接到报修后24个小时内恢复系统正常运行。
服务热线
项目经理王建13930175521
0311-67900566 总调度长/工作时间
保密条款
将严格遵循保密协议凡涉及客户的机型配置、 IP地址、软件等信息不得向第三方泄露维护过程中如需涉及客户系统的数据信息必须先通过客户方认可维护工作的数据信息无论是打印或介质上的数据信息不得带离客户工作现场。
三、服务实施细则
1)前期工作
在保修合同生效前河北三明科技有限公司将派出硬件工程师和系统软件工程师前往客户现场对现场的IBM X3850 X5、 IBM X3650M3、 DS3500及相关网络设备进行测试并对运行情况做好文档记录。然后对设备进行必要的清洁、保养和维护使设备处于良好的运行状态。
施工交底依据合同明确服务标准、工作流程、联系方式
建立设备档案详细记录设备型号、 出厂编号、版本号、工作状态
场地环境检查包括供电装置、 电源电压、接地和室内湿度、温度、温变梯度、空气洁净度、防雷措施等进行检查对问题隐患提出改进建议
数据备份在客户方配合下将操作系统、应用程序、应用数据等做一次完整备份交客户保管以备使用
现场培训与交流
制定服务方案根据详细系统配置制定《IBM服务器服务实施计划书》详细描述保修服务内容、人员组织分工、工作标准、服务流程、应急预案、备件清单、投诉管理、突发或不可预测事件管理等内容报双方领导批复后执行
承诺现场备件到位同时中心备件库中配备或补充本案专用备件配备相应的系统及软件环境。
2)故障预防建议
系统工程师通过预防性检查对系统硬件进行检测和诊断对系统中潜在的硬件故障采取预防措施。如果某些部件出现无法恢复的故障系统工程师将尽快予以修理更换。维护期内提供定期巡检服务。系统工程师定期巡检的目的在于通过巡检及时发现和纠正可能出现的硬件和系统问题,从而在最大程度上为设备的连续稳定运行提供保证,巡检内容主要包括a)服务器主机系统的运行状态b) 网络设备的运行状态c)外部设备包括磁盘阵列运行情况d)所有连接接口 CABLE, 电源等可能容易导致设备出现问题的敏感部件
e)检查系统Error logf) 协助用户机房技术人员解决和分析日常设备运行中出现的未解决问题。
3)故障排除
合同生效后系统发生故障后每次服务流程如下
报修
系统发生故障客户可在第一时间内与河北三明科技有限公司项目经理责任工程师取得联系说明客户单位、故障机型尽可能说明故障现象以及可能的故障原因。
客户也可与河北三明科技有限公司直接联系我公司会在第一时间内与河北三明科技有限公司项目经理取得联系并全程跟踪本次服务。
响应
河北三明科技有限公司项目经理会立即在响应时间本项目为30分钟与客户现场工程师取得联系取得详细的故障信息做出相应的判断在电话中与客户工程师互动交流首先排除因系统参数设定、使用中的软性故障如果未能排除故障则服务工程师立即准备赴现场服务。
现场服务
服务工程师携带相应备件赴用户现场进行维修。首先进行现场诊断分析锁定故障部件更换部件或调整参数数据恢复直至系统恢复正常运行。
每次现场服务完成后 由河北三明科技有限工程师填写《现场工作日志》由客户方代表确认并签署意见后交公司存档。
如第一次现场服务不能解决故障则立即启动应急预案。
第三方配合
河北三明科技有限公司承诺只要是我公司所保的系统发生故障我们的服务工程师必须在第一时间内赶赴客户现场。不论是系统硬件、操作系统故障还是我公司承担的网络、应用程序故障或者系统升级改造、系统迁移等我公司服务工程师将积极配合客户完成系统维护工作绝不会因扯皮推卸责任而损害客户利益。
4) 常用故障诊断技术
计算机故障类型以及故障的诊断手段有很多对于IBM服务器、存储的故障我们通常采取以下2种诊断方式
硬件故障诊断诊断并排除由硬件引起的故障
排除由软件操作系统和应用软件如Oracle数据库、中间件等引起的故障
软件故障诊断
由于软件故障情况错综复杂通常我们常用以下命令来查看系统状态。
# lsdev –Cc adapter
列出各I/O卡及设备的所有相关信息如逻辑单元号硬件地址及设备文件名等。
# ps -ef
列出正在运行的所有进程的各种信息如进程号及进程名等。
# netstat –rn
列出网卡状态及路由信息等。
# ifconfig -a
列出网卡状态及网络配置信息。
# df
列出已加载的逻辑卷及其大小信息。
# lsvg -o
列出已加载的逻辑卷及其加载位置。
# oslevel – s # uname –a
列出系统ID号 OS版本及用户权限等信息。
# hostname
列出系统网络名称。
# lsdev –Cc disk
显示磁盘各种信息如磁盘大小包含的逻辑卷设备名称等。
# lsvg – l vgname
显示逻辑卷组信息如包含哪些物理盘及逻辑卷等。
网络故障
如需修改网络地址、主机名等一定要用smitty mktcpip命令
查看网卡状态 ifconfig -a
Hardware Station Crd Hardware Net-Interface
Path Address In# state name unit state
8/20/5/1 0x0800097843FB 0 up lan0 up
确认网络地址
# ifconfig en0
启动网卡
# ifconfig en0 up
网络不通的诊断过程
Ifconfig -a查看网卡是否启动(up)ping 自己网卡地址(ip地址)ping其它机器地址如不通在其机器上用lanscan命令得知stationaddress然后linkloop station_address来确认网线及集成器是否有问题。在同一网中 subnetmask应一致。
配置网关
手动加网关
/usr/sbin/route add default 20.08.28.98 1
把网关自动加入系统中vi /etc/rc.config.d / netconf
:
ROUTE_DESTINATION [0]=default
ROUTE_GATEWAY [0]=20.08.28.98
ROUTE_COUNT [0]=1
:/sbin/init.d/net将执行
/usr/sbin/route add default 20.08.28.98 1
命令netstat -rn查看路由表
另外也可用set_parms addl_netwrk来设缺省路由。
Oracle数据库预防与检测协助
因为采用预防为主的策略目前我们知道仅仅靠电话支持服务和紧急救援服务不是解决ORACLE数据库问题的根本方法 因为这些方法无法避免和预防ORACLE突发问题的产生。
为使生产系统能够更加安全高效地运行避免ORACLE数据库因意外问题而带来的损失因此用户需要定期的数据库系统维护服务我公司将派工程师为用户定期巡检。
定期巡检与检测服务可以享受到以下好处
加快应用系统的实施周期
规范化客户的数据库维护工作
最大限度地提高系统的可用性
通过高水平的系统维护最大限度的降低系统停机的时间
在现场进行数据库的监控和信息的收集缩短问题的解决时间
将ORACLE的经验和技术带给您的支持队伍
完善和增强现有系统维护人员的能力
得到专门的技术支持资源保证技术支持工程师熟悉现场的配置和环境
与我ORACLE工程师共同工作 以更高效的方式提高问题解决能力
把 ORACLE资深支持工程师的技术和经验传授给您的系统维护人员
定期巡检与检测服务承诺
定期对系统进行全面的检查给出详细的报告根据检查结果给出相应建议和改进方案
检查并分析系统日志及跟踪文件发现并排除数据库系统错误隐患
检查数据库空间的使用情况
数据库的备份和恢复
协助解决数据库维护和开发过程中出现的问题
提出检查报告和建议以及改进方案
5)巡检
定期巡检的目的在于及时发现和预防可能出现的硬件和系统问题从而在最大程度上为系统的连续稳定运行提供保证巡检工作主要包括
主机系统的运行状态对系统CPU、 内存、 I/O状态、进程等检查对系统设置、 日志文件、 Error Report进行检查分析清理系统中的日志文件和垃圾文件
外部设备运行状态对磁盘阵列、磁带机、外置光驱、维护终端等的状
2021年6月底,raksmart开发出来的新产品“cloud-云服务器”正式上线对外售卖,当前只有美国硅谷机房(或许以后会有其他数据中心加入)可供选择。或许你会问raksmart云服务器怎么样啊、raksm云服务器好不好、网络速度快不好之类的废话(不实测的话),本着主机测评趟雷、大家受益的原则,先开一个给大家测评一下!官方网站:https://www.raksmart.com云服务器的说明:底层...
美国知名管理型主机公司,2006年运作至今,虚拟主机、VPS、云服务器、独立服务器等业务全部采用“managed”,也就是人工参与度高,很多事情都可以人工帮你处理,不过一直以来价格也贵。也不知道knownhost什么时候开始运作无管理型业务的,估计是为了扩展市场吧,反正是出来较长时间了。闲来无事,那就给大家介绍下“unmanaged VPS”,也就是无管理型VPS,低至5美元/月,基于KVM虚拟,...
ihostart怎么样?ihostart是一家国外新商家,主要提供cPanel主机、KVM VPS、大硬盘存储VPS和独立服务器,数据中心位于罗马尼亚,官方明确说明无视DMCA,对版权内容较为宽松。有需要的可以关注一下。目前,iHostART给出了罗马尼亚vps的优惠信息,罗马尼亚VPS无视DMCA、抗投诉vps/2核4G内存/40GB SSD/100M端口月流量2TB,€20/年。点击直达:ih...