IT@Intel白皮书英特尔IT部门IT最佳实践固态硬盘2012年7月采用固态硬盘加快数据中心工作负载的运行速度英特尔IT部门从性能测试中发现与传统企业级质量的硬盘相比,部分最新的英特尔固态硬盘在成本、稳定程度、性能及耐用方面具有显著的优势.
ChristianBlack英特尔IT部门企业架构师DarrinChen英特尔IT部门高级系统工程师执行概述业界对于将固态硬盘(SSD)用于数据中心、特别是非常适合固态硬盘的高随机I/O应用的兴趣在持续高涨.
固态硬盘获得广泛使用的最大障碍在于成本及人们对于其是否耐用、特别是当有大量数据写入的承受能力存在担忧.
为此,英特尔IT部门在测试环境中使用我们安全合规应用的数据库进行了性能试验,结果发现与传统企业级硬盘(HDD)相比,最新的固态硬盘在成本、稳地程度、性能及耐用方面具有显著的优势.
我们的安全合规应用的数据库用于记录在我们的计算环境中所有服务器和个人电脑的安全状况.
进行此次调查的起因在于我们观察到每分钟转数15K的硬盘给我们的安全合规应用的数据库的100%随机工作负载造成了严重的性能瓶颈.
该数据库的补丁安装和报告功能所要求的HDD磁头行程(headtravel)将性能降低到不可接受的程度.
我们的目标是设计一种既可加快数据库运行速度又不会引至成本过高或更为复杂的解决方案.
根据评估结果,我们认为改使用最新的固态硬盘可以:消除存储性能瓶颈,在执行随机磁盘I/O任务时将磁盘性能提高多达5倍.
将读取延迟、写入延迟和最长延迟分别降低多达10倍、7倍及8倍,因为固态硬盘对于补丁安装及合规数据读取/写入请求可做出更快的反应.
加快闲置到活动状态的过渡速度,还不会随着硬盘容量的使用而遇到I/O损失(寻道时间更长).
从IT在运作中节省的时间,确保初期投入的成本尽管较高但仍然物有所值:为实现最大磁盘阵列深度和长达25年的硬盘耐用性能、消除涉及监控数据记录积压的合规问题、以及减少被监控系统安装补丁延迟所造成的损失,.
将磁盘的功耗需求降低50%以上,同时减少1/3所产生的热量.
本文讨论了我们的测试方法、试验结果及部署于我们数据中心时产生的实际效果.
同时,我们还介绍如何确定特定应用是否适合在SSD上运行.
以我们的测试结果为基础,英特尔IT部门现在正研究其它的SSD使用案例,尤其是用于已知高随机I/O工作负载.
www.
intel.
com/cn/IT2IT@Intel白皮书采用固态硬盘加快数据中心工作负载的运行速度IT@IntelIT@Intel计划将全球各地的IT专业人员及我们机构中的IT同仁紧密联系在一起,共同分享经验教训、方法和战略.
我们的目标十分简单:分享英特尔IT部门最佳实践,获得业务价值并实现IT竞争优势.
如欲了解更多信息,请访问www.
intel.
com/cn/IT或联系您当地的英特尔代表.
背景随着对于将固态硬盘(SSD)用于数据中心的兴趣日益浓厚,人们也越来越关注SSD的优势及其耐写性—SSD经受大量数据写入的能力.
过去,SSD是否耐用一直是用户的忧虑,但是,最近实现的SSD在性能耐用方面的改良及其它引人注目的优势似乎可以为这种硬盘获得更广泛用途铺平道路.
同许多其它公司一样,英特尔通常也将服务器中的数据存储在硬盘驱动器(HDD)上,后者可向磁盘写入数据并可从磁盘读取数据.
相比之下,SSD则使用基于半导体的内存存储数据.
这种内存通常为NAND("NOTAND"的缩写)闪存,即用于USB闪盘的存储介质.
NAND内存之所以为理想选择是因为不同于RAM,它具有永久储存的特性,且在掉电后不会丢失数据.
尽管多数SSD的外形和接口与HDD兼容,但SSD并不没活动部件.
正因为没有活动的磁盘或驱动器手臂读取和写入数据,SSD也就不存在机械部件磨损的问题.
这带来了许多优势.
高度可靠.
SSD的平均故障间隔时间为200万小时.
快速访问.
SSD可迅速从闲置状态恢复运行或执行磁头寻道操作,消除了用户的等待时间.
出色的抗冲击和耐振动性能.
SSD耐冲击与振动,同时可保持数据的完整.
低功耗.
与HDD相比,SSD的功耗降低了一半多.
更低的发热量.
配有SSD的系统散热量更低.
静音运行.
SSD无活动部件,不会产生噪音.
在支持性能极为依赖每秒I/O操作数(IOPS)的数据库应用时,SSD还具有鲜为人知的优势.
因为SSD不要求磁头读取或写入数据,与企业级—15K每分钟转数(RPM)—HDD相比,SSD具有更高的IOPS、更高的访问速度.
成本是用户通常提及的一个SSD问题.
在容量相同的情况下,串行连接SCSI(SAS)SSD的价格一般是传统15KRPMSASHDD的价格的三倍多.
然而,随着NAND闪存价格下降和产量增加,SSD的价格也在持续下降.
比较硬盘发生故障的原因HDD的主要故障源是机械方面的.
发生最为频繁的故障是磁头碰撞,此时驱动器手臂会碰触到磁盘片,会造成数据丢失.
最后,其它组件也会磨损:磁盘片会因轴承磨损发生振动,驱动器的精度会下降且润滑油会蒸发.
结果会造成更多的重试、更多受损的数据需要纠错码(ECC)恢复、硬盘温度更高、功耗更大,最终导致发生故障.
虽然磁性介质对于写入次数没有限制,但磁性比特强度具有5-7年的半衰期.
然而,在磁性比特强度对性能或数据的完整产生任何实质影响之前,HDD很可能会因机械因素而更早发生故障.
目录执行概述.
1背景.
2比较硬盘发生故障的原因.
2最近的SSD在耐用方面获得改进.
3解决方案.
3测试方法.
3测量现有工作负载.
4在lometer中对工作负载建设模型.
5测试结果.
6利用真实工作负载对工作负载模型进行验证.
6测定顶线性能.
7计算耐用程度.
7计算不可纠正的位错误率.
8功耗与散热比较.
9在实际运营环境取得的结果.
10总结.
11缩写词.
12www.
intel.
com/cn/IT3采用固态硬盘加快数据中心工作负载的运行速度IT@Intel白皮书相比之下,SSD可能会因个别NAND闪存单元上的数据保留或读取错误问题偶尔发生故障.
发生故障前,每块基于闪存的SSD可提供1-5百万个写入循环—这当然是非常大的数目.
这被称为写入耐用性.
只有在达到SSD上任一独立模块的最大编程/擦除(P/E)循环数后,这些错误才会发生.
在许多使用案例中,这几乎不是问题.
最近的SSD在耐用方面获得改进SSD是否耐用取决于其总容量及其NAND闪存单元能够支持的P/E循环数.
当主机向SSD发出写入命令后,SSD数据管理方案可能会消耗多个P/E循环以在单个NAND闪存单元上执行这一命令.
在这种操作期间,NAND写入与主机写入之比称为写入放大.
例如,当向SSD写入100千兆字节(GB)时,NAND闪存单元可能会写入两次,导致写入200GB的NAND闪存单元.
这相当于写入放大值为2(200GB/100GB=2).
多年以来,SSD容量借助称为多层单元(MLC)NAND的技术获得增加.
MLCNAND在每个单元中使用多个电荷电平(chargelevel),支持使用相同数量的单元存储更多的比特数.
虽然适合客户端应用,但MLCNANDP/E循环极限值可能不足以满足数据中心应用的耐用需求.
供应给较为不太苛刻的应用的SSD可能需使用板载ECC引擎努力克服这些问题.
然而,在超过特定P/E循环后,这些SSD在使用寿命结束时将无法恢复数据.
高耐用技术(HET)是英特尔为数据中心环境及其它注重耐用性能的应用新推出的解决方案,可使用经过耐用验证的MLCNAND来扩展SSD的耐用性能.
HET的芯片级和系统级优化支持其采取超越ECC的错误恢复步骤将MLCNAND功能扩展到更高的P/E循环数量,并使用特殊的编程序列减轻可能发生的程序状态干扰问题.
在一种名为后台数据刷新的方案中,采用HET的SSD可在不活动期间移动数据,重新分配已进行大量读取操作的区域.
此外,采用HET的SSD还配备了额外的备用区域,以降低写入放大系数.
由于这些改进,采用HET的SSD可提供许多数据中心应用需要的耐用及数据保留能力.
不过,这也需要一些权衡取舍.
标准MLCNANDSSD可在断电情况下保留数据12个月,采用HET的MLCNANDSSD在断电情况下只能保留3个月的数据.
然而,由于采用HET的MLCNANDSSD可提供高达30倍于标准MLCNANDSSD的写入循环数,所以这一方案实际上对于始终通电的企业工作负载十分有利.
解决方案英特尔IT部门需要为安全应用所用的数据库中部署新型硬盘解决方案,因为数据库的传入数据总是超出HDD阵列的写入容量.
笨拙的I/O队列深度迫使员工将宝贵的时间耗费在手动控制安全补丁安装及合规数据,因此造成了记录的积压.
为了满足该数据库的高随机I/O需求,我们决定使用读取/写入速度更快的SSD处理这类数据.
在测试中,我们选择了高度耐用,采用HET的SSD—英特尔固态硬盘(英特尔SSD)710系列.
我们的目标是先在受控环境中测试这些SSD的性能,然后根据所得数据,再在实际工作环境中运行安全合规应用的数据库来测定它们的性能.
测试方法为了判定将SSD用于高I/O应用(例如安全合规应用的数据库)是否可行及其优势,我们选择采取以下方法:1.
使用Perfmon(一种性能监控工具)测量现有的数据库服务器工作负载.
2.
在lometer(一种开源I/O负载生成、测量及描述工具)中构建工作负载的模型.
3.
使用与实际工作环境相同的实验室硬件,证实工作负载模型可准确表示真实的工作负载.
4.
使用RAID5和RAID10设置测试测试独立磁盘(RAID)组的8硬盘冗余阵列中15KHDD和SSD的多种配置与控制器设置.
5.
确定15KHDD和SSD的顶线性能.
6.
使用工作负载模型计算其耐用程度—SSD的预计使用寿命.
7.
判定会遭遇到不可纠正错误的概率,来计算不可纠正的位错误率(UBER).
8.
如果该解决方案前景看好,在实际工作环境里的安全合规应用的数据库上进行测试.
www.
intel.
com/cn/IT4IT@Intel白皮书采用固态硬盘加快数据中心工作负载的运行速度测量现有工作负载使用Perfmon测量现有工作负载时,我们主要关注队列深度,后者表示磁盘控制器中排队的未完I/O的数量.
图1表示有8个磁盘的RAID10F:\阵列(安全合规应用的数据库在其上运行)的队列深度(灰色).
标准经验法则是:对于阵列中的每块磁盘来说,队列深度不应超过1或2.
而就8磁盘的F:\阵列来说,在任何延长期间队列深度不应超过16.
图1显示F:\阵列正在超过这一极限;队列有时会累积到255个未完I/O.
这意味着大量读写数据正在阵列中累积—行业规范设计SAS控制器可处理的最高数量.
对于15KHDD阵列来说,图1中的读取和写入吞吐量都非常低.
尤其是写入工作负载的平均值还不到25兆字节每秒(MBps),不同的是备份任务的执行时间大概在晚上11:30到午夜.
这一工作负载量表明无法处理写入业务计算记录,迫使这些记录全天都积累在队列中.
举例来说,带有精确顺序写入工作负载的单个15K300GBSAS硬盘应基本能够将200MBps写入磁盘.
1带有4磁盘写入和4磁盘镜像的8磁盘RAID10阵列应能够写入多达制造商支持协议我们在测试时使用、并引入到数据中心的固态硬盘(SSD)目前并不在为我们供应系统的服务器制造商的支持范围内.
对于大多数IT部门来说,包括英特尔IT,覆盖整个系统制造商支持协议对是数据中心服务器来说是个基本的要求.
为了保留对服务器中每个部件(除SSD硬盘外)的支持,我们让制造商知道我们有意向在服务器中部分磁盘阵列中使用经内部验证的SSD.
我们还表示会继续将制造商供应并验证的HDD用于系统的启动/操作系统硬盘.
这样,支持协议就不涵盖SSD,但仍然包括所有其它常见的系统组件.
我们继续使用制造商提供的启动/操作系统硬盘,有必要时可以让支持人员在系统上执行基于操作系统的诊断.
800MBps.
这些估值并未计算控制器上的写缓存,后者可提高性能或镜像活动(可根据控制器降低性能).
即使有这些最高写入速度的大概数据,但是我们F:\磁盘阵列的25MBps写入速度及其恒定的高队列深度还是够清楚地表明I/O的随机模式正在降低性能.
如此高度随机的多硬盘读/写磁头–寻道–被逼多次来回移动寻找数据写入的空间,以至硬盘无法满足传入数据的要求.
我们所用的数据库应用实际上在后台做许多清理工作.
表格被清理后按顺序进行排1使用同步传输速率对硬盘进行评级.
惠普300千兆字节6G串行连接SCSI15KRPM双端口企业级硬盘驱动器的同步传输速率为6每秒千兆字节(Gbps)—请访问:http://h18000.
wwwl.
hp.
com/products/quickspecs/l2244_na/12244_na.
html.
为了计算我们估计的写入速度,我们将6Gbps除以8(8位/字节).
那相当于750每秒千兆字节或约750每秒兆字节(MBps).
单块物理盘无法达到6Gbps,根据英特尔IT部门的经验,一般来说它大约可达到这一速度的25%.
在独立磁盘(RAID)阵列的冗余阵列中,通常需要至少4块磁盘RAID0(只考虑性能,不考虑奇偶性/冗余)才能达到接口饱和(在理想条件下).
因此,就一块磁盘而已,在最理想的条件及假定无错误的情况下,我们慷慨地将750MBps除以4,并向上舍入接近到每15KRPM硬盘200MBps.
050100150200250300喑ВツI/O0501001502002503002AM4AM6AM8AM12PM2PM4PM6PM8PM10PM10AM12AM1.
В∕www.
intel.
com/cn/IT5采用固态硬盘加快数据中心工作负载的运行速度IT@Intel白皮书IOPS44%λI/O喍IOPS喎05001,0001,5002,0002,5003,0002AM4AM6AM8AM12PM2PM4PM6PM8PM10PM10AM12AM2.
ВI/Oこ∕列.
这意味着安全数据库文件本身没有碎片.
相反,流入数据库表的数据实在高度随机,因此使数据库运行起来就像高碎片文件一样.
图2所示为读写磁盘吞吐量(按IOPS计).
读写IOPS的比较表示这是一个写入密集型的工作负载.
从少量的磁盘读取我们可以推测到这些读取既不是临近的写入操作,也不会造成过大的队列深度.
在一天内,除了备份活动的几次高峰外,F:\阵列上的磁盘读取量始终都较低.
了解IOPS磁盘写入量,可发现重要数据,有助于构建测试SSD的工作负载的模型.
我们将吞吐量(MBps)除以IOPS,发现写入操作不仅是随机的,而且数据块约为16千字节(KB),这与我们安全合规应用的数据库解决方案等结构化查询语言(SQL)数据库相一致.
根据我们收集(图1和2)的工作负载数据及有关数据库和HDD磁盘阵列的资料,我们得出了以下结论:80GB的数据库使用了组成RAID10F:\阵列的8块73GB磁盘的27%左右的空间.
磁盘空间仅有27%被使用,队列深度极高及吞吐率非常低,这些事实表明工作负载具有100%的随机I/O、约为16KB的块大小、及30%的读取率.
在lometer中对工作负载建设模型根据我们在实际运营环境中收集的数据,下一步就是采用一种测试工具对工作负载进行建立模型.
Lometer是一种用于单个集群磁盘系统的开源I/O子系统测量及描述工具(www.
iometer.
org),用作故障排除及为I/O工作负载建设模型的性能指标评测工具.
Lometer可配置磁盘参数,如磁盘的最高容量、未完I/O的数量、I/O线程数、随机或顺序分配比例、读/写分配、及块大小,以便复制应用(例如我们安全合规应用的数据库)的行为.
关于我们的SDD测试,我们使用lometer的目的就是尽量为安全合规应用的数据库工作负载(我们使用了Perfmon对其进行测量和描述)建立准确的模型.
我们首次使用检查现有工作负载时收集的数据对lometer进行配置:16KB块大小、100%随机分配、及30%的读取速度—亦即是我们最糟糕的使用情况.
(对于每块硬盘来说,同时读取和写入是最糟糕的情况.
)同时,我们不愿意手动加载系统来超出实际使用的情况,因此我们将系统设置为运行4个工作流程(每个流程具有4个队列),使系统上处于测试中的总体队列保持在16个队列数,每块硬盘2个队列.
这与我们系统当前处理的工作负载保持一致—后台中的SQL将只在4个和8个不同流程(将要在任何指定的时间写入数据库)之间启动.
另外,通用的工程经验法则是在一个RAID集中为每块硬盘配备的I/O队列数不多于2个.
www.
intel.
com/cn/IT6IT@Intel白皮书采用固态硬盘加快数据中心工作负载的运行速度不带有活动部件的SDD具有的一个优势是可迅速从闲置状态恢复.
为了确保测试能够客观,我们安排了2分钟的加速时间,以便15KHDD可进行必要的"热身"以消除缓存爆发的影响.
紧接加速时间的是10分钟的运行时间,以便测量这两种硬盘间的性能.
每种测试进行3次.
测试变化率小于+/-5%.
取3次测试结果的平均数作为显示在我们图表中的最终结果.
硬盘控制器按照有关建议进行了设置.
SSD:开启硬盘高速缓存,自适应预读及回写缓存开启.
HDD:关闭硬盘高速缓存,自适应预读及回写缓存开启.
测试结果对于在受控环境进行的测试,我们在RAID5和RAID10配置的8硬盘阵列中使用了100GBSSD及143GB15KHDD.
测试的8硬盘阵列设置的逻辑磁盘容量设定为320GB,这是我们的数据库增长限制目标.
配置中的测试服务器完全相同,包括其阵列控制器.
利用真实工作负载对工作负载模型进行验证当我们在Iometer中构建了工作负载的模型后,便用验证的方式确认Iometer负载会在控制环境中圆满地复制安全合规应用的数据库的工作负载.
图3所示为在运行于RAID10配置中73GBHDD8磁盘阵列上的数据中心的实际80GB数据库工作负载上,当天的I/O测量峰值—如黑框中所示—平均为1,850IOPS.
请注意,这只使用了大约27%的磁盘容量,刚好是我们想要复制的容量.
对于Iometer模型测试,我们在RAID10配置的143GB15K测试HDD的8磁盘阵列上设置了160GB的逻辑磁盘.
由于市场上不再销售73GBHDD了,143GBHDD是我们可以找到的最小硬盘.
图3中的蓝底部分表示速率达到了1,855IOPS的极限,磁盘容量利用率大概为28%.
由于这些结果中的磁盘容量利用率与峰值写入IOPS与我们实际工作环境中的百分比几乎一样,它们在Iometer中验证了我们的模型,为使用该模型进行测试扫清了障碍.
图3.
黑盒中所示为当日测试中安全合规应用的数据库工作负载的每秒写入I/O操作数的峰值阶段.
每秒I/O操作数(IOPS)05001,0001,5002,0002,5003,000测试时Iometer构建的峰值IOPS阶段(1,855IOPS)RAID10配置中143GB15K测试硬盘的8磁盘阵列2AM4AM6AM8AM12PM2PM4PM6PM8PM10PM10AM12AM磁盘写入磁盘读取Iometer构建的峰值IOPS阶段采用IometerOverlay的安全合规应用的数据库工作负载IOPSwww.
intel.
com/cn/IT7采用固态硬盘加快数据中心工作负载的运行速度IT@Intel白皮书测定顶线性能图4所示为10分钟运行时间得出的平均结果,逻辑磁盘容量设置为320GB,我们计划利用这个容量应对数据库的未来增长.
RAID5配置的SSD阵列可处理5倍于HDD阵列的IOPS.
在RAID10配置中,该优势也接近5倍.
这优越的性能清楚表明了SSD阵列在随机数据访问中具有显著的优势.
SSD阵列能够直接从任何位置读取数据,无需机械运动,且在lometer将工作负载传送至磁盘、磁盘载满数据时,会出现很少或不出现I/O损失.
面对相同的工作负载,HDD磁盘阵列会被拖垮.
对于图5中显示的平均延迟,SSD阵列与HDD阵列也相差很大.
RAID5配置中的SSD阵列显示读取延迟降低了10倍,RAID10配置中的SSD阵列则表明读取延迟降低了8倍.
至于写入延迟,RAID5和RAID10配置中的SSD阵列都显示下降了7倍.
图6中显示的最长延迟尤其可以突出它们间的差异,因为其表示硬盘在响应I/O请求时表现更为糟糕.
15KHDD阵列的最长延迟时间为12秒,而RAID5配置中SSD阵列的这一时间则为154毫秒,相差非常悬殊.
在RAID10配置中,SSD阵列比HDD阵列的最长延迟时间低8倍.
显然,两种SSD阵列对于数据库请求都可以快出许多的速度进行响应.
计算耐用程度我们评估工作的一项重要内容就是计算SSD是否耐用.
尽管性能测试表明SSD阵列在IOPS吞吐量与访问时间(读取与写入)方面优势明显,但多数IT部门还是想知道高价的SSD是否耐用.
如前所述,MLCNAND的块擦除周期是有限的.
有限的块擦除周期还会被写入放大值进一步减少,后者为SSD控制器需要写入的数据量与主机控制器想要SSD控制器写入的数据量之间的比率.
写入放大值为1最为理想,它意味着想要写入1MB,实际写入1MB.
因为NAND在重写前必须擦除,所以执行这些操作的过程就包括移动或重写数据一次以上.
这种乘数效应可增加SSD使用寿命期间需要的写入次数,可以缩短其可靠运行的时间.
英特尔SSD710系列中的HET可通过标准MLCNAND之外的多种方法扩展SSD的耐用程度.
这些方法包括提供备用的写入区域降低写入放大的影响并增加硬盘的总体写入容量.
例如,标准MLC硬盘的总写入容量可能为550万亿字节(TB),而替换有HETNAND和英特尔SSD710系列逻辑的相同硬盘的总写入容量可能为1拍字节(PB).
测定硬盘耐用时间的方法是一样的,而总写入容量的起始值则不同.
03006009001,2001,5008xSSDRAID108xSSDRAID58x15KRPMRAID108x15KRPMRAID51,215933154105010203040508xSSDRAID108xSSDRAID58x15KRPMRAID108x15KRPMRAID547.
3032.
104.
503.
7015.
619.
362.
231.
27I/O喍喎I/O喍喎I/O02,0004,0006,0008,0008xSSDRAID108xSSDRAID58x15KRPMRAID108x15KRPMRAID5I/O喍IOPS喎IOPS1,0471,6515,5098,003倅4.
I/O100%喑30%喑320GB166.
I/O100%喑30%喑320GB165.
I/O100%喑30%喑320GB16www.
intel.
com/cn/IT8IT@Intel白皮书采用固态硬盘加快数据中心工作负载的运行速度成本优势容量为300GB的固态硬盘(SSD)所需的成本大约是容量相近的15K硬盘驱动器(HDD)的3倍.
对用于我们安全合规应用的数据库的数据卷的8磁盘阵列及其在另一数据中心的复制伙伴而言,这是一笔不小的开支.
但就以我们的使用模型来说,这种额外的开支却大大低于我们从以下各方面所获得的节省:消除以前员工采用手动方法来调整I/O以处理笨拙的I/O队列深度所耗费的大量时间.
消除监控数据记录的积压,帮助避免规范不符合的问题.
降低因为监控系统安装补丁的延迟而可能造成的损失.
提供出色的性能与容量,满足未来3-5年工作负载的预计增长.
简化解决方案到本地磁盘设置,摒弃存储区域网络或网络连接存储等较为复杂的解决方案.
从我们的数据库I/O模型及5天的lometer老化测试中,我们估计每天大致可向SSDRAID10阵列写入151GB的容量,一年可写入54TB.
如我们所知,英特尔SSD710系列的总写入容量或寿命大约是1PB.
我们将每年的写入容量(54TB)乘以写入放大值(3)—使用英特尔固态硬盘工具箱测量,然后除以1PB,可发现我们数据库使用案例中的单块SSD硬盘的寿命为6.
4年.
现在,我们必须考虑RAID设置对8硬盘阵列的影响.
在RAID10配置中,这会将总写入量分摊在4块硬盘,因此阵列的寿命是6.
4的4倍,即25.
6年.
RAID5配置会将总写入量分摊在7块硬盘,因此阵列的寿命是6.
4的7倍,即44.
8年.
我们还需要考虑英特尔IT部门的实践经验.
在过去4年中,我们甚至将英特尔SSD的beta样品(约500个)用于IT实验室的繁重工作负载中,在此情况下也只出现过两次硬盘故障.
故障率仅为0.
4%.
计算不可纠正的位错误率硬盘具备多种方法确保数据的完整.
SSD通常使用奇偶校验或ECC纠正位错误,并配合其它方法避免发生数据完整的问题.
在将SSD阵列用于我们安全合规应用的数据库之前,我们希望了解硬盘的UBER.
UBER越低,SSD越能确保数据无错误.
UBER会随着硬盘读取速度的增加而扩展.
为了确定我们计划推出的硬盘的UBER,我们首先计算出了平均的读取带宽(以MBps计),即为9.
38MBps.
然后,我们将31,536,000(一年的秒数)乘以1024KB/MB乘以1024字节乘以8位/字节,得出了一年的总读取量(位),为2.
48141x1017.
根据英特尔的NAND解决方案事业部及英特尔SSD710系列规范,基于1,000硬盘样本的NAND单元位错误率—不可纠正错误的统计概率—为1x10-17.
如果将NAND单元位错误率乘以我们每年的总读取比特数(1x10-17x2.
48141x1017),我们可得出预计在1年后减少的比特数,部署1,000块硬盘时该比特数为2.
481.
这就相当于0.
248%的故障率.
如果将该数字除以3以体现每天8小时的占空比(大约是服务器每天运行数据库的时间),我们可得出部署1,000块硬盘时每年的故障率为0.
083.
实际上,采取以下步骤可以消除或弱化这种极低的故障率:RAID控制器擦洗(也称为巡读),是一种顺序读取过程,可读取所有数据及其相应的奇偶校验信息、并在需要时重建奇偶校验.
数据库交易日志发运及数据复制,可确保数据库所有的写入数据在另一系统上复制.
执行扇区备用的任何文件系统(包括NTFS),可标记坏扇区或不一致的扇区并对其进行重映射.
www.
intel.
com/cn/IT9采用固态硬盘加快数据中心工作负载的运行速度IT@Intel白皮书功耗与散热比较虽然功耗与散热并非我们的主要研究,但这两个因素却是今日为数据中心挑选组件时所需考虑的首要问题.
为了进行功耗对比,我们使用了存储系统领先制造商提供的相关规格.
这些规格对100GBSSD和300GB15KHDD的运行与闲置功耗进行了比较(见表1).
数据表明,使用SSD可节能50%以上.
运行时硬盘的散热量可影响单个服务器及整个数据中心的总体散热要求.
这点非常重要,因为散热是数据中心主要的耗电项目之一.
为了证明被测HDD和SSD承受负载时散热量的区别,我们使用了热成像摄像机.
图7中的图片显示承受负载时,SSD大概可少发出1/3的热量.
表1.
固态硬盘与硬盘驱动器的功耗对比状态100千兆字节(GB)的固态硬盘300GB硬盘驱动器节能闲置1.
38瓦8.
74瓦7.
36瓦84%运行4.
97瓦12.
92瓦7.
95瓦61%注:数字来源于该数据表第4页:http://www.
emc.
com/collateral/software/specification-sheet/h8514-vnx-series-ss.
pdf图7.
该热成像图片对比了测试时搭载一块15K146千兆字节(GB)硬盘驱动器(左)与搭载一块100GB固态硬盘(右)时的散热量.
耐用程度的计算方法计算固态硬盘(SSD)及针对特定工作负载的SSD阵列的预期使用寿命的步骤如下:1.
测量现有工作负载.
2.
在lometer中对工作负载建设模型.
3.
在受控环境中运行工作负载模型以对其进行验证,使用lometer读取、写入系统和驱动阵列(类似于测量现有工作负载所用的系统和驱动阵列).
4.
对工作负载作必要调整,以准确复制实际工作负载.
5.
在测试系统中安装测试SSD驱动阵列.
6.
将测试运行规定的天数.
7.
每次从阵列中取出一块硬盘,将其放入另一台服务器.
使用英特尔固态硬盘工具箱(www.
intel.
com/go/ssdtoolbox)确定写入放大率,并收集必要的数据计算每天写入的数据量(写入量/天).
8.
根据写入量/天,计算出硬盘上一年的数据写入量并乘以放大率.
9.
将磁盘的预期寿命(按Pb计)除以写入量/年.
这就是磁盘的预期寿命.
10.
使用阵列中所有磁盘的平均预期寿命确定阵列的预期寿命,并考虑所用的RAID配置.
www.
intel.
com/cn/IT10IT@Intel白皮书采用固态硬盘加快数据中心工作负载的运行速度英特尔至强处理器E5产品家族我们的测试完成于英特尔至强处理器E5产品家族发布之前.
该款处理器将I/O控制器与中枢集成至处理器芯片,使I/O延迟降低了多达30%.
根据一项评估,在该平台上,单个使用母板非RAID控制器的英特尔固态硬盘710系列300GB可运行我们在实际运营环境中的安全数据库工作负载及搭载8磁盘RAID10组的RAID控制器.
这种性能为未来基于软件的新颖RAID配置打开了大门,这种配置可借助英特尔至强处理器E5产品家族的强大能力打破本地存储的瓶颈,该瓶颈现在仍困扰着支持RAID的存储控制器.
在实际运营环境取得的结果根据在测试环境中得出的有利结果,我们用300GBSSD的RAID108磁盘阵列替换了我们安全合规应用的数据库的数据卷所用的15KHDDRAID108磁盘阵列.
我们还用300GBSSD的RAID106磁盘阵列更新了用于日志卷的6硬盘15KHDDRAID106磁盘阵列.
我们还对测试结果进行了15天的监控.
根据图8和9所示的结果,我们已:消除了安全合规应用的数据库的性能瓶颈(监控修补积压)消除了手动控制数据收集的需要提供了扩展空间,可降低安全事物的轮询间隔图8所示为实施SSD前HDD的读取-写入磁盘活动(IOPS),及SSD实施后的相同工作负载.
该全天活动图表中特别显示高峰时磁盘工作负载可比采用HDD时高出25%,这说明SSD的响应速度更快.
另外,下午的IOPS工作负载似乎更加稳定,振幅不会频繁变化,表明SSD运行更加顺畅.
请注意,在SSD升级前后一天执行的总IOPS在5%的范围内波动.
图9所示为读取和写入磁盘吞吐量(MBps)及采用HDD时的磁盘队列,还说明了实施SSD后收集的实际运作数据.
备份等一些活动仍然会增加队列,但在多数情况下,持续的队列深度完全消除了.
值得注意的是,备份等顺序磁盘操作的排队实际上可提高操作的性能.
安全合规应用的数据库工作负载(IOPS)—SSD实施前后0900180027003,6004,500实施前每秒磁盘读取实施后每秒磁盘读取实施前每秒磁盘写入实施后每秒磁盘写入每秒I/O操作数(IOPS)2AM4AM6AM8AM12PM2PM4PM6PM8PM10PM10AM12AM图8.
实施SSD前后,安全合规应用的数据库工作负载测量(IOPS).
www.
intel.
com/cn/IT11采用固态硬盘加快数据中心工作负载的运行速度IT@Intel白皮书050100150200250300—SSDI/O2AM4AM6AM8AM12PM2PM4PM6PM8PM10PM10AM12AM9.
SSD喑喑SSD在减少排队I/O数量方面实现了40倍的改进,同时保持MBps的读取与写入能力.
这种改进将能让该团队减少安全轮询(security-polling)的间隔,且与当前设置相比,可将规格符合提升4倍.
总结基于测试,我们已采用SSD阵列处理我们安全合规应用的数据库的数据和日志卷操作,并已看到了效果.
我们在受控环境及实际工作环境中运行的数据中心进行的测试表明对于生成随机磁盘I/O的工作负载,SSD阵列可大幅提高性能.
对于这些应用,SSD的性能、高度可靠、功能稳定及较低的功耗和散热要求压倒了较高初期成本的不足.
测试表明,改用经测试的SSD可实现以下效果:在执行随机磁盘I/O任务时将磁盘性能提高多达5倍,从而减少性能瓶颈.
将读取延迟、写入延迟和最长延迟分别降低多达10倍、7倍及8倍,因为固态硬盘对于补丁安装及合规数据读取/写入请求可做出更快的反应.
从闲置状态开始运转时反应更快,随着硬盘使用容量增长或碎片增加,性能不会受损.
在各方面都具有显著的成本优势,比如减少员工花在处理长I/O队列深度上的时间,及因为缩短响应和记录补丁安装请求的时间而让计算环境中的各个部件更符合安全的规格.
我们发现,使用实验室的工具和硬件进行测量、复制、测试、执行和在实际使用环境作最终测量的方法步骤至关重要.
这些方法证明了安全数据库工作负载中磁盘I/O的实际改善,让我们有信心升级至SSD.
最终,我们帮助数据库信息安全团队和120位控制台用户增强了使用体验,他们现在认为其应用更为"敏捷"了.
根据这些结果,我们计划将SSD阵列的优势惠及数据中心中其他有不同工作负载的应用.
如欲了解有关英特尔IT部门最佳实践的更多信息,请访问:www.
intel.
com/cn/it撰稿人EdGiguereMarkJacksonTerryYoshii缩写词ECC纠错码GB千兆字节Gb/秒千兆位每秒HDD传统硬盘HET高度耐用的技术IOPS每秒I/O操作数KB千字节MB兆字节MBps兆字节每秒MLC多层单元NAND非和(电子逻辑门)NAS网络连接存储P/E编程/擦除PBPB字节RAID独立磁盘的冗余阵列RPM每分钟转数SAN存储域网络SAS串行连接SCSISCSI小型计算机系统接口SQL结构化查询语言SSD固态硬盘TBTB字节UBER不可纠正的位错误率性能测试和等级评定均使用特定的计算机系统和/或组件进行测量这些测试反映了英特尔产品的大致性能系统硬件、软件设计或配置的任何差异都可能影响实际性能.
购买者应进行多方咨询,以评估其考虑购买的系统或组件的性能.
如欲了解有关性能测试和英特尔产品性能的更多信息,请访问www.
intel.
com/performance/resources/benchmarkjimitations.
htm或致电(美国)1-800-628-8686或1-916-356-3104.
本白皮书仅用于参考目的.
本文件以"概不保证"方式提供,英特尔不做任何形式的保证,包括对适销性、不侵权性,以及适用于特定用途的担保,或任何由建议、规范或范例所产生的其它担保.
英特尔不承担因使用本文相关信息所产生的任何责任,包括对侵犯任何专利、版权或其它知识产权的责任.
本文不代表英特尔公司或其它机构向任何人明确或隐含地授予任何知识产权.
hypervmart怎么样?hypervmart是一家成立了很多年的英国主机商家,上一次分享他家还是在2年前,商家销售虚拟主机、独立服务器和VPS,VPS采用Hyper-V虚拟架构,这一点从他家的域名上也可以看出来。目前商家针对VPS有一个75折的优惠,而且VPS显示的地区为加拿大,但是商家提供的测速地址为荷兰和英国,他家的优势就是给到G口不限流量,硬盘为NVMe固态硬盘,这个配置用来跑跑数据非常...
这两天在站长群里看到不少有使用DEDECMS织梦程序的朋友比较着急,因为前两天有看到来自DEDECMS,我们熟悉的织梦程序官方发布的公告,将会在10月25日开始全面商业用途的使用DEDECMS内容管理程序的会采用授权收费模式,如果我们有在个人或者企业商业用途的,需要联系且得到授权才可以使用,否则后面会通过维权的方式。对于这个事情,我们可能有些站长经历过,比如字体、图片的版权。以及有一些国内的CMS...
华纳云怎么样?华纳云是香港老牌的IDC服务商,成立于2015年,主要提供中国香港/美国节点的服务器及网络安全产品、比如,香港服务器、香港云服务器、香港高防服务器、香港高防IP、美国云服务器、机柜出租以及云虚拟主机等。以极速 BGP 冗余网络、CN2 GIA 回国专线以及多年技能经验,帮助全球数十万家企业实现业务转型攀升。华纳云针对618返场活动,华纳云推出一系列热销产品活动,香港云服务器低至3折,...