IT@Intel白皮书英特尔IT部门IT最佳实践开源云集成2012年9月使用开源软件加速部署云服务使用OpenStack*,加上我们的内部代码与现有的企业软件,英特尔IT部门部署了云基础设施,将数据中心解决方案转变为可快速提供的用户服务.
StephenAnderson英特尔IT部门云基础工程师JamesChamings英特尔IT部门云基础工程师WinsonChan英特尔IT部门云自动化工程师JoelCooklin英特尔IT部门云自动化工程师DasKamhout英特尔IT部门首席工程师/英特尔IT部门云负责人要点概述为了提高我们云部署的速度与稳定程度,英特尔IT部门最近为我们的私有云增加了混合解决方案,包括OpenStack*软件—一种可扩展的开源云操作环境.
使用OpenStack*,加上我们的内部代码与现有的企业软件,英特尔IT部门部署了云基础设施,将数据中心解决方案转变为可快速获取的用户服务.
在2010年,英特尔IT部门使用现有的企业管理工具和解决方案,实施了英特尔的首款私有云解决方案.
一年后,为了对最终用户提供更佳支持并降低成本,我们开始寻求解决方案来实现以下的目标:改进我们的按需自助服务、缩短服务供应时间、增加提供的服务数量、加强对云服务的自动化管理并增加云服务的使用量.
通过将OpenStack与我们实施的自动化监控和配置工具(可帮助我们增强自动化资源管理)集成起来,我们现在能够:为应用开发人员快速供应新容量由于支持活动/活动应用设计,可提高冗余度和自动化,帮助我们更快实现云架构应用零宕机的目标缩短软件升级周期,加快实施最新的更新、特性和功能,提供最先进的云计算服务提高服务水平与符合规范未来,我们计划提高私有云与公有云之间的相互操作,同时将打造一个受管的、相互操作和开放的云作为我们提供服务的标准方式,并朝着这一目标而迈进.
IT@Intel白皮书使用开源软件加速部署云服务2www.
intel.
com/cn/ITIT@INTELIT@Intel计划将全球各地的IT专业人员及我们机构中的IT同仁紧密联系在一起,共同分享经验教训、方法和战略.
我们的目标十分简单:分享英特尔IT部门获得业务价值的最佳实践,使之成为IT竞争优势.
如欲了解更多信息,请访问www.
intel.
com/cn/IT或联系您当地的英特尔代表.
背景英特尔IT部门运营着一个规模庞大的计算环境,支持全球大约91,500名英特尔员工,和分布在69个数据中心内的75,000台服务器.
广大员工使用超过138,000个设备连接我们的服务,而其中多数设备为移动商用PC和手持设备.
云运营对于我们的业务至关重要.
它们可帮助我们提供一种高度稳定的计算环境,可同时为多个租户提供共享的、灵活的基础设施,向通过身份验证的设备和用户按需交付安全的服务和数据.
在2010年,我们将现有的企业管理工具和解决方案,与集成软件和数据库整合,实施了我们的首个私有云.
这使我们得以提供一种有机的解决方案,它整合了计算、存储和网络资源,可为我们的最终用户提供计算基础设施即服务(infrastructureasaservice,以下简称laaS).
按需自助服务是我们云环境的一个重要的属性.
为了开发一种为最终用户提供的自助服务门户、真正的企业私有云,我们起初开发了一种包括授权、配额、透明的测量服务及数据驱动型业务逻辑的托管自动化框架.
该框架使我们在需要时可为我们的业务用户提供容量,将IT从关键的业务服务发布路径中解脱出来,创建更加灵活的企业基础设施来支持我们动态和不断变化的业务需求.
我们的私有云还建立了一种可管理的容量,为多租户提高了资源共享,在过去3年节省了超过900万美元.
我们还向运营团队提供大量自动化和数据透明度方面的改进,帮助我们降低基础设施运行成本.
我们的私有云继续迈向成功之路.
我们云中的按需服务为应用开发人员缩短了新容量的供应时间,以前获得一台服务器需要90天,现在获得一台具有服务级协议的虚拟机(virtualmachine,以下简称VM)只需不到3小时,甚至在许多情况下,不到45分钟,这非常契合我们在不到一天的时间内将创意转变为实际使用的目标.
我们的云战略英特尔IT部门开放云是我们迈向受管的、相互操作和开放云的重要一步.
在2010年开始实施私有云时,我们的初期目标是提供简单的计算laaS,使用户能更加便捷获得服务器.
为此,我们在整个环境中推行自动化,并使我们的应用开发人员和应用所有者为他们的应用环境快速部署基础设施.
在2011年(见图1),我们与自己的软件开发人员合作构建分布式工作的云感知应用,它可在发生节点或环境故障时,让最终用户依然能够享用服务.
这需要把应用视作web服务的提供商与用户.
我们的目标是将每个选定的应用及其功能划分为更精细的部分,它们可单独地实施、测试和扩展,也可处理环境中的故障.
在2012年,我们开始完全迁移至私有云,它涉及下列注意事项:所有的数据中心解决方案转变至可使用的web服务(使我们的云服务不仅限于计算laaS的范畴),还包括存储与网络用户的web服务.
目录要点概述.
1背景.
2我们的云战略.
2解决方案.
3使用开源软件的优势.
5英特尔IT部门云平台解决方案堆栈.
6英特尔IT部门云操作环境.
6管理.
7提高系统的稳定程度和利用率.
.
.
.
.
.
.
.
9提高服务水平与符合规范.
10成效.
10总结.
11了解更多信息.
11缩写词.
11使用开源软件加速部署云服务IT@Intel白皮书www.
intel.
com/cn/IT3提供平台即服务(platformasaservice,以下简称PaaS),为最终用户以web服务形式提供网页和数据架构的托管平台.
这有利于应用的开发与部署,让最终用户无需应对基础设施方面的复杂问题,如操作系统、网络和平台应用配置.
研究和实施新解决方案(本文有详述),在完全私有的laaS环境中运行云架构应用.
基于在2012年在早期的实际使用,我们在2013年计划转而使用更多的混合解决方案,以便让一部分容量运行在我们的公有云和私有云中.
我们甚至计划每3-6个月在我们的企业私有云中实施混合云模式的模块与功能.
使用外部云提供商将使我们能够进一步提取部署的资源,让我们根据成本、位置与监管要求,灵活确定计算与存储需求的来源.
我们的目标是创建一种开放云,把公有云环境当做我们数据中心服务的扩展.
这包括监控成本并使该环境看起来、运行起来都犹如我们基础设施的扩展,提供应用和数据的无缝用户体验.
无论是内部或外部,我们的最终用户需要随时随地通过任何设备轻松、安全地访问他们的应用与数据.
当一切都成为一种服务—计算、网络、存储和软件,API就成为云应用的构建模块与杠杆点.
将应用拆分为单独的web服务API可使应用的功能集成至其它的云应用并重复使用,同时为每个服务支持适当的扩展.
设计良好的API还可提高相互操作,保护应用免受基础技术实施与供应商特定实施的影响.
我们的目标是到2014年实施一种受管的、相互操作和开放云,实际的实施时间取决于业界在开放式解决方案和开放标准方面的发展情况.
web服务、数据服务和身份服务之间的相互操作在帮助我们实现管理与无缝相互操作方面具有重要作用.
我们使用通用API或抽象层,希望使最终用户更轻松地使用不同提供商的计算、存储和网络资源.
解决方案为了提高灵活程度、速率和效率,我们对我们2011年使用的私有云进行了分析,以期进一步提高它的性能、自助服务供应与自动化管理.
这样做的主要动机在于我们洞察到业界对于企业IT的全新期待.
IT消费化的概念—通常使人联想到自带设备的策略—正席卷各个企业.
习惯经由互联网获得服务的IT最终用户期待轻松获取应用、存储与连接,并快速接收更新.
最终用户应用开发人员应用所有者IT运营Apps—应用;IaaS—基础设施即服务;ODCA—开放数据中心联盟;PaaS—平台即服务;SaaS—软件即服务ODCA框架1.
0版采用云和IaaS服务ODCA框架1.
5版采用简单的SaaS、云感知应用和复杂的计算IaaS,减少企业应用ODCA框架2.
0版云和应用形式间的数据共享;增加云感知应用的使用并创建私有PaaS和IaaSODCA框架2.
5版增加混合应用间的数据共享,创建混合SaaS,PaaS和IaasODCA框架3.
0版英特尔IT部门的云目标计算、存储和网络简单的计算IaaS企业传统应用云感知应用简单的SaaS私有IaaS私有PaaS云感知应用复杂的SaaS混合IaaS混合PaaS混合SaaS受管的、相互操作和开放云复杂的计算IaaS云感知应用企业传统应用简单的计算IaaS计算、存储和网络企业传统应用企业传统应用2010–20122011–20132012–20142013–20152014–2016图1.
英特尔和企业IT行业正致力于发展云计算,这需要耗时多年.
在迈向受管的、相互操作和开放云这一终极目标的过程中,跨私有云和公有云的混合应用将逐渐成为标准.
这将有利于优化成本,在服务间实现无缝数据共享,进而提高最终用户的工作效率.
IT@Intel白皮书使用开源软件加速部署云服务4www.
intel.
com/cn/IT新的实施计划扩展了我们的选择面,并让我们的思维不局限于当前的解决方案,能够寻求最灵活、可管理和高效的解决方案来满足自身需求.
我们需要快速改变策略,将我们所有的数据中心解决方案作为用户服务提供,这对于多数运行未构建基础设施API的企业IT部门而言是一项庞大的工作.
对我们而言,这意味着要为该解决方案打下坚实基础:我们网络结构的万兆以太网,所有全新的刀片服务器及存储节点的高密度双机架单元服务器.
目前,我们正推出基于最新英特尔至强处理器E5-2600产品家族的服务器.
几乎所有组件都具备冗余以实现出色的弹性与高度稳定,但是整个系统也不会过度配置,因为软件需要承受一定水平的故障,以控制基础设施成本.
为了满足对用户服务的期待并实现对所有数据中心组件的自动化管理,我们将各种现成商用、开源和公有云解决方案作比较,评估了多家供应商的多种大规模云解决方案.
最终,我们认为最适用于我们环境的解决方案是为当前环境增加OpenStack*.
OpenStack是一种开源软件栈,用于支持高度可扩展的基础设施.
它提供一种开放、可扩展的框架,以管理laaS云中的各类资源,包括计算、网络和存储资源.
我们的决定取决于OpenStack开发人员社区的优势、开发人员和管理员文档的质量和代码演进的速度.
我们的云运行在英特尔至强处理器E5-2600产品家族之上为了满足英特尔IT部门对于更高处理能力和能效以及更强的安全需求,我们将我们主流的双路平台正迁移我们的云环境至英特尔至强处理器E5-2600产品家族.
英特尔至强E5-2600处理器家族作为现代数据中心和云的核心部分,可提供最佳的性能、功能与经济高效的组合,让我们能够在单台服务器上运行更多的虚拟机(VM),并将VM整合至更少的服务器上.
与前代英特尔至强处理器5600系列相比,这些处理器可将性能提高多达55%,1还可将每瓦性能提高50%.
2英特尔至强处理器E5-2600产品家族包括英特尔集成I/O.
该集成可将I/O控制器从主板上的单独芯片直接移动至处理器芯片上,同时也支持最新一代的PCIExpress*(PCIe)3.
0标准与英特尔数据直接I/O.
与以往架构相比,这可帮助将I/O延迟降低多达30%.
3PCIe3.
0规范的支持可将I/O带宽提高多达2倍.
4英特尔至强处理器E5-2600产品家族继续基于为企业级数据保护提供关键基础的安全技术,如英特尔高级加密标准新指令—可帮助系统快速对运行于一系列应用和交易间的数据加密和解密,及英特尔可信执行技术—通过创建可信基础层为虚拟环境和云环境提供坚实的保护,减少基础设施遭遇恶意攻击的机会.
优化的平台解决方案包括英特尔C600系列芯片组和英特尔的万兆以太网解决方案,可帮助确保不同工作负载均能够实现较高的性能,同时确保高级功能,如集成的串行连接SCSI和以太网光纤通道等高级功能.
这些可帮助您在当前的虚拟和云环境中简化、整合以及加快存储和网络连接.
1请参阅英特尔IT部门简介,"借助基于全新英特尔至强处理器E5-2600产品家族的工作站,提高设计吞吐量.
"2使用SPECint*_rate_base2006性能指标评测结果除以处理器的TDP再作性能比较.
前代双路英特尔至强处理器X5690(130WTDP)的处理器TDR基准得分416—基于截止2011年12月5日www.
spec.
org发布的最高得分.
更多详情请参阅www.
spec.
org/cpu2006/results/res2011q4/cpu2006-20111121-19037.
html.
新的得分659乃基于英特尔内部测量结果预测,使用英特尔RoseCity平台,具体配置为:两枚英特尔至强处理器E5-2690(135WTDP),启用英特尔睿频加速技术、增强型英特尔SpeedStep技术和英特尔超线程技术,128GB内存、英特尔编译器12.
1和THP,以及供x86_6所用的RedHatEnterpriseLinuxServer6.
1beta.
3英特尔内部测量数据,I/O设备在闲置状态下从本地系统内存中读取数据所需的平均时间.
比较了英特尔至强处理器E5-2600产品家族(230纳秒)与英特尔至强处理器5500系列(340纳秒).
基准配置:GreenCity系统,具有两枚英特尔至强处理器E5520(2,26GHz,4核),12GB内存(频率为1333),禁用c状态、英特尔睿频加速技术和SMT.
新配置:Meridian系统,具有两枚英特尔至强处理器E5-2665(2.
4GHz,8核),32GB内存(频率为1600MHz),启用c状态和英特尔睿频加速技术.
测量结果基于使用英特尔内部Rubicon(PCIe2.
0)和Florin(PCIe3.
0)测试卡的LeCroyPCIe*协议分析器,运行环境为Windows*2008R2(SP1).
4PCIe3.
0规范中的8GT/s和128b/130b编码特性能够将互联带宽提升为PCIe2.
0规范的两倍.
资料来源:www.
pcisig.
CDm/news_room/November_18_2010_Press_Release使用开源软件加速部署云服务IT@Intel白皮书www.
intel.
com/cn/IT5使用开源软件的优势IT部门可能会担心开源软件具有一定风险,包括:与通常配有专门支持团队解决技术问题的现有产品相比,可能不具备针对开源应用的技术支持开发开源解决方案的社区最终可能背离公司的最大利益,或开源解决方案可能被大型公司收购实施时间的自然增长,及最终超过现有解决方案的培训与再开发成本担心不受控制的开源使任何人都可破坏代码我们的企业IT团队也存有这类忧虑.
然而,英特尔IT部门将开源软件用于我们的设计网格(DesignGrid)由来已久,并发现了如下优势:强大而活跃的社区,众多第三方公司提供出色的支持服务.
大量与我们规模相近或规模更大的公司实施或运行OpenStack,辅以他们自己的代码.
OpenStack的广泛使用可确保特性与功能将继续反映我们的需求.
丰富的文档,包括管理指南、API文档和开发人员文档,可确保学习曲线较短.
对开源代码库的完全访问,包括严格的同行评审及整合各种代码之前的接受与回归测试.
频繁的更新周期—每6个月进行一次重要发布,可帮助快速实施最新的特性与功能,包括性能与效率改进.
在对开源软件OpenStack进行评估时,我们发现OpenStack不仅安全可靠,而且还可满足我们其它的大规模计算要求.
另外,在从专有解决方案向开源解决方案转变时,我们发现了一些令人瞩目的优势,包括:能够实现相互操作、最小化厂商锁定并帮助达成我们的混合云目标.
我们的开发团队可专注于更高价值的云功能领域,并通过与社区合作帮助开放式的云技术行业快速发展.
转变更快,成本更低.
与实施我们私有云环境的基本要素相比,采用开源软件使我们得以在开源社区中完成大量工作.
因为其他企业IT部门也使用OpenStack,各IT部门便可一起编写必要的核心代码,无需单独编写后再在社区中进行共享.
减少提供计算laaS的时间,更多时间用以提供更高级别的服务领域.
这可提供我们的应用开发人员需要的更高级服务,提高最终用户的工作效率.
您的应用标准硬件OpenStack*共享服务Openstack仪表板计算网络存储OpenStack*OpenStack是一种云操作系统,可控制数据中心的大型计算、存储和网络资源池,所有资源都通过界面管理,该仪表板为管理员提供控制权限并授权他们的用户经由web界面供应资源.
作为一种开源解决方案,OpenStack由全球的开发人员和云计算技术人员协作进行开发与支持.
该项目旨在为所有类型的云提供易于实施、可扩展和特性丰富的解决方案.
该技术包含一系列为云基础设施解决方案提供各种组件的相关项目.
所有的OpenStack源代码都使用Apache2.
0许可证.
IT@Intel白皮书使用开源软件加速部署云服务6www.
intel.
com/cn/IT英特尔IT部门云平台解决方案堆栈如图2所示,我们的全新云解决方案包括:界面层,包括图形用户界面(graphicaluserinterface,以下简称GUI)、命令行界面(commandlineinterface,以下简称CLI)及API(发布其所有的关键数据中心组件为用户使用的服务).
GUI和CLI的开发都给予API层.
具有配置管理数据库(配置和状态管理)管理层、观测器(事件监控)、决策器(基于规则的自动化决策者)、执行器(配置与状态执行)及采集器(用于运行时配置和目录的运行数据库)等组件.
具有基础组件的OpenStack云操作环境.
包括计算、存储和网络组件的物理基础设施.
为了将新基础设施和软件版本更新的影响降到最低,我们设计了支持定期升级的云平台,它可帮助我们更出色管理员工设备在IT基础设施和软件要求方面的快速变化.
例如,我们每6个月发布新版的OpenStack,并预期其发布后的3个月内集成下一版本—Folsom.
核心服务和对象存储的定期升级不会给最终用户造成宕机,是开放云运行模式中持续集成与演进这一核心理念的关键特性.
英特尔IT部门云操作环境该云操作环境包含各种开源服务,它们提供可供SaaS和最终用户通过API或GUI使用的基础功能.
每个组件都是OpenStack2012.
2—Essex版本的一部分.
NOVA计算服务该云操作环境的主要组件是Nova计算服务.
Nova安排将VM映像部署至适当主机,并在它的生命周期内对VM进行管理.
我们使用本地连接的非共享iSCSI资源来托管所有的VM,并使用基于基础映像和增量磁盘的部署模式以实现磁盘资源的最高效利用.
Nova能够尽可能独立于管理程序运行.
它可兼容开源库,如libvirt(一种开源API和管理工具),用于管理多数支持、基于内核的VM.
我们选择基于内核的VM作为管理程序是看重它的速度、可靠程度及出色的CPU和内存资源管理能力.
GLANCEGlance组件是我们的映像存储库,目前部署在laaS唯一可用的共享存储平台上.
Glance还可存储VM快照,后者在OpenStack的Essex发行版环境中才运行的VM进行单次崩溃一致拷贝.
我们计划在2012年末将Glance用作对象存储后端,这将为支持大量基于Windows*和Linux*的VM提供一种安全、强大的VM映像和快照存储解决方案.
界面管理IntelContributionsandOpen-SourceFoundation云操作环境IntelContributions和OpenStack*发布周期观测器Nagios内部决策器执行器Puppet采集器配置管理数据库图形用户界面命令行界面操作系统Glance块存储NovaVolume对象存储Swift网络Quantum计算NovaDashboard计算存储网络3个月3个月6个月12-18个月英特尔开放云实用程序(IntelOpenCloudUtility)API图2.
英特尔IT部门云平台解决方案堆栈图表,描述开源组件和其它组件及它们相关的更新周期.
使用开源软件加速部署云服务IT@Intel白皮书www.
intel.
com/cn/IT7NOVAVOLUME我们计划于2012年第4季度部署NovaVolume(后继者将为Cinder)这种服务,它将是一种用于VM的强大、高度稳定(highlyavailable,以下简称HA)持久的块存储解决方案,可增强综合的平台能力.
SWIFTSwift是支持用于OpenStack内的对象存储解决方案之一.
它采用分布式存储方法,该方法使用商用硬件和HA设计.
我们计划在2012年第4季度开始将Swift用于支持GlanceVM映像和快照存储,与此同时,我们计划将它扩展,为最终用户对象存储解决方案提供Amazon简单存储服务兼容的API的开放版本.
QUANTUMQuantum是一种OpenStack项目,可在网络接口设备之间提供网络连接服务,如虚拟NIC,由Nova和其它OpenStack服务管理.
随着在OpenStack中和OEM提供的解决方案中的Quantum日趋完善,我们预计将需要对我们的网络架构进行修改,以更广泛地用于网络配置的复杂分割与实时定义.
区域的使用我们发现,该虚拟环境的若干组件具有一定的结构,如核心身份服务与目录服务与我们的客户操作系统所用的补丁库.
为了确保该少部分虚拟基础设施的可靠程度,我们将计算和存储资源分成两个区域—有状态与无状态,这两种区域可供相同的云API访问.
本质上,永久性的VM驻留在此次部署的有状态区域.
有状态资源可使用更强大的冗余存储及某种隔离措施,以应对性能与安全问题.
该环境的无状态区域部署着所有的云感知和自动化资源.
优化此处的存储与计算解决方案,以实现主要的设计目标—最大的可用容量.
未来,我们计划增加更多的无状态区域,如低成本开发区域.
信息安全我们实施OpenStack中,另一关键方面是使用了Nova安全组,以在环境中的租户间和单个租户内的不同VM角色间实现自动化逻辑分割.
这类隔离对于支持安全的多租户极为重要.
Nova安全组的利用支持提取和快速配置iptables—内置的Linux内核驻留防火墙系统.
这可大幅减少在多租户资源池中进行合理分割所需的工作,消除了与外部防火墙服务自动化协调的需要.
管理OpenStack用作laaS框架带来了诸多挑战.
OpenStack是云操作环境中的核心,但该核心目前未与英特尔IT部门需要的,用于可扩展管理云资源的管理特性作预整合.
我们需要一个自动化层以:监控基础设施中的节点及应用服务器,我们称其为观测器.
决定对相关事件的适当反应,我们称其为决策器.
按照决定采取行动,我们称其为执行器.
保持对符合规范的审查跟踪,我们称其为采集器.
为了执行这些功能,我们设计了英特尔开放云实用程序,它包含5种可管理的组件:配置管理数据库(ConfigurationManagementDatabase,以下简称CMDB)、观测器、决策器、执行器和采集器.
英特尔开放云实用程序英特尔开放云实用程序是我们自动化与管理解决方案的核心.
该实用程序提供表述式的状态转移(RepresentationalStateTransfer,以下简称REST)API,可管理多个元素管理器中的配置、模板、关系、状态与集成.
部分使用最常用的元素管理器包括用于OpenStack计算的Nova、用于监控的Nagios、及用于VM定制与应用部署的Puppet.
它还包括公有云计算与硬件负载平衡器.
当用户请求一个新VM实例或一些VM实例时,API会记录该请求并通过相应的元素管理器供应该虚拟基础设施.
然后,Puppet定制和部署VM和应用,并直接从我们的开放云实用程序中获得它的清单.
如果收到可执行事件,该实用程序可立即采取行动,同时Puppet执行并确保一致.
可采取的行动包括从负载平衡器池移出单个VM,将从节点提升为主节点,或离线下获取整个自动扩展组(auto-scalinggroup,以下简称ASG),启用它的匹配ASG—假设运行在我们的其它开放云实用程序数据中心内—以响应应用请求.
自动扩展是一种开源解决方案,用于根据需求自动增加或降低容量以确保性能稳定和成本最低.
IT@Intel白皮书使用开源软件加速部署云服务8www.
intel.
com/cn/IT配置管理数据库CMDB是我们的自动化与管理解决方案的核心,可追踪部署在该环境中的VM.
该域模型可记录理想的设置、配置、关系和状态.
后端协调—自动化安排、协调及对于我们计算机系统、中间件和服务的管理—和自动化解决方案使用该模型在该环境中执行状态.
例如,当最终用户请求一些新的VM,API会将该请求记录在该模型中并启动自动化程序来供应VM.
VM一旦生成,执行器可从该模型中读取理想的配置和状态信息并在该VM上执行该信息.
我们目前对CMDB的实施基于开源Web2.
0应用框架,并通过RESTfulAPI—一种使用HTTP实施的web服务—来提供.
观测器我们的观测器基于Nagios(一种开源监控工具).
该观测器利用Nagios广泛的预建监控器、支持多种操作系统及具备监控操作系统以外的大量资源的能力,包括负载平衡器、防火墙和网络交换机.
作为一种观测器,Nagios可对系统、应用、服务和业务流程提供企业级开源监控.
如果发生故障,Nagios可执行健康检查、找出问题、发送可执行告警并启动修复流程以在问题影响业务流程、客户和最终用户前将其消于无形.
我们的计划是提供监控服务,并让我们的最终用户能够通过他们环境中的指定核心监控器,或他们自己的定制监控器来执行启用和禁用.
Nagios是经由Puppet来部署的,以下会有所述.
决策器我们的决策器组件是一种实时配置系统,旨在做出基于状态的决策.
我们当前对决策器的实施采用了定制与默认事件处理程序.
决策器监听观测器发布的告警.
一接收到告警,决策器会针对特定的VM实例采取行动(通常是关闭)以应.
最强大的租户扩展特性是VM子分类(sub-classing),通过子分类租户可借助定制业务逻辑对事件进行响应.
如前所述,根据配置与当前状态,可决定关闭应用服务器并将它从负载平衡器池移除,或者,如果未识别到自动化修复方案,它可能仅仅在我们的服务管理系统中为运维部门自动生成一个事故.
也可能调用针对ASG的行动,与VM子分类相似,它们可能根据各个子分类以提供定制不同的逻辑.
执行器为了执行和确保配置行动,我们使用Puppet(一种开源IT自动化软件工具)作为我们的执行器.
Puppet旨在帮助IT部门在它的生命周期内管理基础设施,从供应和配置到补丁管理与合规.
Puppet将重复的任务作自动化处理,可快速部署关键应用,并主动管理需要内部或在公有云中从10台服务器向1000台服务器扩展的事件.
Puppet可直接从我们的开放云实用程序中获得它的配置清单,帮助我们确保该实用程序内的当前状态与在服务器上的状态一致.
例如,如果在服务器意外重启前发送告警,观测器组件可能已对有问题的服务器进行了观测,保护了它的新状态并试图立即执行该状态.
然而,由于服务器处于离线状态,所以无法采取理想的行动.
不过,因为Puppet配置为启动时运行,因此Puppet将确保系统符合它目前在开放云实用程序中的配置状态.
采集器如执行器一样,采集器的作用至少部分由Puppet通过Facter特性实施.
Facter是一种跨平台程序,用于检索关于硬件与操作系统的基本服务器信息.
它充当我们的运行时CMDB.
我们还将若干自定义的Facter添加到我们管理的每个VM,帮助将VM关联至它的开放云实用程序VM模板、租户、ASG、支持小组等.
该信息提供给服务管理平台用以问题与事故管理.
云资源管理实施情况图3所示为我们的自动化云资源管理中不同组件的协作情况.
观测器将告警发送至决策器订阅的消息总线.
该消息总线是常用数据模型、常用命令集和支持不同系统通过共用接口组进行通信的消息传送基础设施的组合.
然后,决策器根据该基础设施和应用布局的实时配置数据作出决策,并在必要时指示执行器通过CMDB执行改变.
使用开源软件加速部署云服务IT@Intel白皮书www.
intel.
com/cn/IT9例如,如果观测器检测到特定节点在指定应用扩展单元(用于扩展的服务器实例的组合)内存在问题,决策器可禁用该节点并命令执行器进行更换.
如果发生了影响整个数据中心的灾难性故障,决策器可禁用数据中心内的某个扩展单元,甚至可将数据中心完全从DNS端点的全局负载平衡器列表中删除.
5提高系统的稳定程度和利用率英特尔IT部门正致力于实现更高的系统稳定程度,这是我们众多计划中的一个.
我们的目标是主要业务服务达到99.
99%,这意味着一年中计划内与计划外的宕机时间不超过52分钟.
这种水平的HA需要实施大量的自动修复.
目前,我们的系统稳定水平在99.
7-99.
95%区间波动,因应用不同而有所差异.
我们实现这一目标的一种途径就是采用活动/活动应用设计.
如图4所示,在活动/活动实施过程中,两个或更多数据中心同时处于活动状态,每个数据中心都运行不同虚拟服务器上的常用应用.
这些数据中心完全对称.
在应用网络内,任何交易信息可发送至任何数据中心,再由后者读取或更新任何数据项组.
5如欲了解更多有关如何设计才可快速从故障中恢复的信息,请参见开放数据中心联盟的白皮书《开发云功能应用》.
活动/活动方法可提供最高灵活程度并最优化的系统投资,因为对于所有可用的处理容量而言,请求的负载保持均衡.
如果一个数据中心发生故障,其它数据中心的用户不会受影响.
另外,发生故障的数据中心的用户可快速切换至正常的数据中心,快速恢复他们的服务.
在活动/活动模式中使用多个实例,我们可实现更高的性能、稳定度、利用率和灵活度.
在本项目的第一阶段,我们重点关注3个水平的自动化修复,它们支持云服务在多个数据中心间在高度可靠和稳定的情况下运行.
破坏和重新创建节点.
将扩展单元从负载平衡器中移除,在某些情况下,这意味着将大量服务器移出负载平衡器.
将数据中心从全局负载平衡器池中删除.
我们计划在后面的阶段中添加更多复杂的使用案例.
我们发现有必要借助能够对照动态模型进行根本原因分析的关联引擎改进决策器.
例如,观测器和决策器可能会突然接收到大量针对一组应用服务器的告警.
这由潜在的网络或存储故障造成,但决策器并未意识到这点,因而继续在该组应用服务器上进行适当的操作.
通过借助功能更强的关联与分析引擎(能够理解它接收到的消息的上下文)改进的决策器,我们能帮助它做出更明智的决定.
决策器观测器配置管理数据库负载平衡器VMVMVMVM云操作环境OpenStack*基础设施计算、网络、存储采集器执行器图3.
为了自动化管理云资源,英特尔IT部门在OpenStack*顶部增加了一个层面,它包括配置管理数据库.
观测器、决策器、执行器和采集器功能.
全局负载平衡器互联网英特尔数据中心A公司间连接VPN完全网状式VPNVMVMVMVMVMVMVMVMVM图4.
在活动/活动应用设计中,两个或更多数据中心同时处于活动状态,在不同虚拟服务器上运行的常用应用以确保高度稳定.
英特尔数据中心B外部提供商IT@Intel白皮书使用开源软件加速部署云服务10www.
intel.
com/cn/IT将开源软件用于平台即服务作为扩展企业私有云的下一个逻辑步骤,英特尔IT部门正在积极实施平台即服务(PaaS),以加快定制应用部署并推广云感知应用程序的设计原则.
该PaaS环境将基于我们已取得成功的基础设施即服务(laaS)成果.
我们将利用开源软件提供一个包含自助服务、按需工具、资源、自动化和托管平台运行时容器的环境.
我们预计PaaS可通过模板、资源共享、可重复使用的Web服务和大规模多租户机制推动云感知应用程序的创建.
在成功实施概念验证后,我们正着力提供早期采用试点,我们预计它很快会促成在实际工作环境全面部署.
通过提高程序员的工作效率,我们预计PaaS将帮我们将私有云的价值扩展到更多部门和更大的使用范围,从而支持我们使用混合云(公共-私有)进一步扩展和提高成本效益的技术发展蓝图.
提高服务水平与符合规范和许多IT部门一样,英特尔IT部门向大量企业技术作投资,从服务管理工具到身份验证和授权工具.
我们使用开源基础设施的一大主要目标就是了解它与我们企业使用的现有解决方案的整合效果到底有多出色,如我们的服务管理系统.
与服务管理系统的整合至关重要,尤其是因为我们正在转变为完全的信息技术信息库环境.
根据我们的架构与设计目标,我们的系统需要提供用于追踪服务水平与符合规范的必要数据.
配置采用管理系统,加上监控系统与关联引擎,可帮助在供应时间与资源关联.
然后,该信息被提供给消息总线,并导入服务管理工具.
观测器也会在供应时间获得该信息,以确保资源被立即监控及资源告警可通过消息总线再次被服务管理工具轻松捕获,从而支持快速、独立的自动修复,例外情况只要求操作人员接收事故清单以进行问题管理.
利用消息总线模型和发布与订阅方法,该设计可极其灵活地识别和记录引起告警的原因、引起自动修复起因和生成用于操作人员故障分析的清单.
成效全新的英特尔IT云平台解决方案堆栈提高资源管理与其它优化的自动化水平,帮助我们向受管的、相互操作和开放云的目标迈进了重要的一步.
它让我们得以在设计核心laaS解决方案上所花的时间减少,将其用于更高水平的服务领域,以提供更佳的服务,让应用开发人员使用它们来构建可提高最终用户工作效率的应用.
我们的全新解决方案已大幅减少了供应服务所需的时间,并可自动解决诸多资源问题.
现在,我们只需5-10分钟便可部署一台VM.
除了可向我们的客户提供更快速的自助服务外,我们的解决方案致力于提供更可靠的基础设施,定期更新可让它"与时俱进",同时减少员工的工作量.
另外,我们预计活动/活动应用设计的实施将产生明显成效,利用率和稳定程度将有所提高,平均恢复时间将更短.
使用开源软件加速部署云服务IT@Intel白皮书www.
intel.
com/cn/IT11总结在我们致力于实现受管的、相互操作和开放云目标的过程中,OpenStack等开源项目可帮助我们部署云基础设施,将数据中心解决方法打造为可快速获取的用户服务.
我们将继续使用可提供最佳解决方案并契合我们云演进的商用软件,而OpenStack可提供多功能工具,支持构建用于管理和提供各种资源(如云中的计算、网络和存储资源)的开放式可扩展框架.
短期来看,我们预计将继续改进所有层面的云平台.
下一步,我们的关注重点包括协调、块存储、自动扩展策略、实时迁移和复杂的应用部署.
我们还计划继续向混合解决方案演进,使我们能够更轻松地使用公有云服务.
了解更多信息如欲参阅以下相关主题的白皮书,请访问www.
intel.
com/cn/it:"企业私有云架构和实施蓝图""构建企业公有云的最佳实践""借助平台即服务扩展英特尔的企业私有云""在英特尔IT部门私有云内实施按需服务"如欲了解有关英特尔IT部门最佳实践的更多信息,请访问:www.
intel.
com/cn/it缩写词ASG自动扩展组CLI命令行界面CMDB配置管理数据库GUI图形用户界面HA高度稳定laaS基础设施即服务PaaS平台即服务REST表述式的状态转移SaaS软件即服务VM虚拟机性能测试和等级评定均使用特定的计算机系统和/或组件进行测量,这些结果反映了那些测试所测定的英特尔产品的大致性能.
系统硬件、软件设计或配置的任何差异都可能影响实际性能.
购买者应进行多方咨询,以评估他们考虑购买的系统或组件的性能.
如欲了解有关性能测试和英特尔产品性能的更多信息,请访问www.
intel.
com/performance/resources/benchmark_limitations.
htm或致电(美国)1-800-628-8686或1-916-356-3104.
本白皮书仅用于参考目的.
本文件以"概不保证"方式提供,英特尔不做任何形式的保证,包括对适销性、不侵权性,以及适用于特定用途的担保,或任何由建议、规范或范例所产生的其它担保.
英特尔不承担因使用本规范相关信息所产生的任何责任,包括对侵犯任何专利、版权或其它知识产权的责任.
本文不代表英特尔公司或其它机构向任何人明确或隐含地授予任何知识产权.
野草云服务商在前面的文章中也有多次提到,算是一个国内的小众服务商。促销活动也不是很多,比较专注个人云服务用户业务,之前和站长聊到不少网友选择他们家是用来做网站的。这不看到商家有提供香港云服务器的优惠促销,可选CN2、BGP线路、支持Linux与windows系统,支持故障自动迁移,使用NVMe优化的Ceph集群存储,比较适合建站用户选择使用,最低年付138元 。野草云(原野草主机),公司成立于20...
春节期间我们很多朋友都在忙着吃好喝好,当然有时候也会偶然的上网看看。对于我们站长用户来说,基本上需要等到初八之后才会开工,现在有空就看看是否有商家的促销。这里看到来自HMBcloud半月湾服务商有提供两款春节机房方案的VPS主机88折促销活动,分别是来自洛杉矶CN2 GIA和日本CN2的方案。八八折优惠码:CNY-GIA第一、洛杉矶CN2 GIA美国原生IP地址、72小时退款保障、三网回程CN2 ...
DiyVM 香港沙田机房,也是采用的CN2优化线路,目前也有入手且在使用中,我个人感觉如果中文业务需要用到的话虽然日本机房也是CN2,但是线路的稳定性不如香港机房,所以我们在这篇文章中亲测看看香港机房,然后对比之前看到的日本机房。香港机房的配置信息。CPU内存 硬盘带宽IP价格购买地址2核2G50G2M1¥50/月选择方案4核4G60G3M1¥100/月选择方案4核8G70G3M4¥200/月选择...