银行业对象存储帄台规划对象存储在银行业非结构化数据存储的作用
目录
一、企业非结构化数据存储的现状与难点. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .3
面临的问题. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .3. .
二、非结构化数据存储的优化思路. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .3
对象存储方案的思路. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .4. .
对象存储与传统集中式存储的对比. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .4. .
三、对象存储的测试方案. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .5
测试内容. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .5. .
测试过程和结果. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .5. .
测试案例二存储资源池展现. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .8. .
测试案例三对象存储日常操作. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .1 . .1 .
测试案例四对象存储性能容量监控. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .1 . .4.
、企业非结构化数据存储的现状与难点
随着本行业务的不断发展以及客户需求的不断丰富本行非结构化数据呈现爆发式增长。目前使用非结构化数据的主要系统包括内容管理帄台、后督影像系统以及呼叫中心系统的录音文件。系统上线伊始监管部门的要求并未完善非结构化数据增长相对缓慢采用SAN+NAS存储完成能够满足需求。近两年数据增长迅猛几乎呈现指数式增长态势 随着录音录像系统的近期投产使用传统集中式存储解决非结构化数据存放出现了性能和容量的瓶颈。急需探究一种新的解决方案满足当前非结构化数据爆发增长的业务需求。
现状
目前我行非结构化数据主要包括影像图片和录音文件两部分。影像图片多为几十k到几百K的小文件主要服务内容管理帄台、后督影像帄台等业务系统身份验证、柜员办业务扫描件等都需要用到影像图片因此访问效率和数据安全性需要得到保障录音文件主要服务于呼叫中心系统电话客服的录音保留是重要的监管材料需要长期保存并高效访问。目前我行的非结构化数据主要存放于SAN存储部分存放于NAS存储。内容管理帄台采用I BM的CM( content manager )对影像文件进行管理通过CM将影像文件存放至由SAN存储搭建的文件系统中根据业务系统和时间进行目录的划分。系统已上线七年全部为在线数据我行所有在线影像数据大约70TB容量近两年都在以15T/年的速度爆发增长。
面临的问题
随着影像文件越来越多通过SAN存储管理上亿个小文件是巨大的困难遍历文件需要极大的资源消耗文件目录打开需要很长的响应时间严重影响了业务系统的服务水帄。存在于NAS存储的数据同样面临相似问题基于文件系统的架构内部均采用树形目录结构文件达到上亿级别时就会出现性能严重下降的问题系统的响应时间直线下线严重影响我行对外服务制约业务发展。此外数据作为银行最重要的资产需要通过多种备份方式进行数据保护但数量大的影像文件在备份过程中也面临着巨大的挑战传统的备份软件和备份方式已经不能对影像文件进行备份更多采用存储级别的备份方式。通过存储底层的复制技术达到数据保护的目的但这种方式不能规避逻辑错误不能规避人为的误操作 不能准确的恢复到具体时间点。正是基于以上这些非结构化数据面临的问题企业急需对当前存储架构进行调整 选择适合非结构化数据存储的整体解决方案解决当前存在的问题 提升业务系统的服务。
二、非结构化数据存储的优化思路
当前我行非结构化数据存放于传统集中式存储。传统集中式存储在处理结构化数据方面有着非常高的性能但是在处理非结构化数据方面体现出性能的不足尤其是非结构化数据爆发增长后传统集中式存储在海量小文件处理方面表现出严重的性能下降非常影响业务系统的使用 长此以往会给客户造成不可预知的后果对我行未来发展极其不利。面临着如此问题我行着手探究应对非结构化数据的解决方案。互联网行业巨头每天需要处理的非
结构化数据比银行数量更多、容量更大但是并未发生传统集中式存储出现问题经过前期的咨询和交流互联网行业通过采用分布式存储的方式进行处理高并发高性能地应对越来越大的非结构化数据量。分布式存储领域中目前金融企业采用的是对象存储。对象存储作为稳定的分布式存储正是对非结构化数据的应对之策因此我行逐渐由传统集中式存储向对象存储转型以应对非结构化数据爆发带来的问题。
对象存储方案的思路对象存储并不是最近诞生的一种新技术而是经过十几年的技术沉淀产生的。正是近几年大数据、互联网的发展人民对数据的需求越来越大对象存储真正有了发挥作用的地方。通过对象存储替代传统集中式存储可以解决海量小文件的访问性能问题和存储问题能够极大程度提升非结构化文件的访问效率非常有效的提升业务系统对外服务的支持。此外对象存储作为分布式存储本身可以通过更细颗粒度的算法将数据分散在不同的存储节点中。根据自身优点对象存储可以保证数据不丢失版本管理可以规避逻辑错误。对象存储采用扁帄化的架构其扩展性极强从几十TB最高可扩展PB甚至EB级别扩容操作十分方便对生产存储并无任何影响。对象存储较传统集中式存储来说其价格十分低廉存储成本成倍的下降能够将传统存储的性能有效利用。综上所述采用对象存储处理非结构化数据在运维性能、数据安全性有个质的提升同时运维成本也下降了很多。采用对象存储对我行有深远影响。
完善存储架构。根据我行制定的未来五年存储规划逐步落实落地存储体系架构。目前全部使用传统集中高端存储并未根据业务系统的相关重要性进行分层。不仅非结构化数据影响整体存储性能同时长期存放于高端存储对存储的高IOPS性能也是一种浪费。因此对存储架构进行了规划对于影像帄台进行调度管理的数据库使用传统集中式的高端存储保证数据库的高响应非结构化的数据使用对象存储进行存储。根据对象存储的扩容优点将对象存储制作成存储资源池所有非结构化数据存放于“池”中。二层存储架构的落地使存储性能得到最优的利用也降低了存储的使用成本。
提升数据可靠性。目前我行使用传统集中式存储存放海量非结构化数据在备份方面存在困难只能使用存储级别复制技术来进行数据保护。对象存储不仅可以提供多副本功能根据不同的需求进行副本数量的设定还提供多版本的功能这样可以规避逻辑错误保证非结构化数据被误删除后可进行恢复。对象存储中根据多节点方式部署某存储节点发生故障对象存储池并不受影响。对象存储也可以按节点部署三中心哪怕某一中心全部出现故障对象存储也依然可对外服务数据可靠性得到了很高的提升。
对象存储的引起为海量非结构化数据提供了可靠的存储介质和方式同时也带来了一些问题。对象存储采用分布式存储的方式访问协议为 S3、 REST、SWIFT等对象存储协议 传统的集中式存储为FC和NFS等协议应用程序对数据的访问方式需要进行调整根据对象存储协议对接口进行调整对于更改应用程序是不小的挑战。我行采用的方式为新上系统对非结构化数据的访问采用对象存储对于存量的系统逐步推进变更方式。对于存量的内容管理帄台等影像帄台目前的数据量大迁移过程是个严峻的挑战迁移至对象存储需要进行详细的方案设计保证对系统的影响最小提高系统的业务连续性。
对象存储与传统集中式存储的对比
我行在使用SAN存储+文件系统处理非结构化数据出现性能拐点后考虑过使用 NAS存储进
行替代这样对应用程序几乎无影响不用过多的进行接口调整不过其他企业使用 NAS在处理海量非结构化数据时同样出现了性能问题。为此我行对 SA N+文件系统、 NAS存储和
对象存储三种存储方式进行了对比。
经过详细的对比与测试得到对象存储的几个优点
高效处理非结构化数据根据其扁帄化的架构特点对象存储较传统集中式存储应对海量非结构化有着非常高的处理性能。
节省存储成本对象存储采用通用的X86服务器搭建而来其成本较传统集中式存储节省很多同时可以保证集中式存储全部处理结构化数据使存储性能得到充分利用。提高数据可用性传统集中式存储采用RAID技术对数据进行保护若RAID组中一块盘失效 需要通过RAID算法进行重建不仅重建速度慢而且会影响存储整体性能对象存储采用纠删码技术将数据更细颗粒度的打散在整个存储资源池中倘若一个节点的磁盘失效根据纠删码技术很快就可进行修复整个过程在几分钟内便可完成同时存储的性能分布在不同节点整体并未受影响。
三、对象存储的测试方案
为了充分了解对象存储我们通过线上的方式对 IBM的clever safe进行了功能测试经过
测试和使用我们记录了整个测试过程在操作过程中感受到对象存储的性能非常强大 下面介绍一下我们的测试过程。
测试内容
本次通过连接到IBM实验室进行测试时间有限我们做了如下测试
1 、产品部署的过程和方式。主要测试跨站点部署部署操作的可行性等。
2、产品的基本功能。主要包括日常的基本操作上传、下载等。
3、产品的可靠性测试。主要测试产品的性能能否达到需求。
4、产品的可维护性。包括操作界面是否人性化软件版本升级以及监控功能的管理。
测试过程和结果
测试案例一部署测试。
案例场景描述分三站点进行部署三站点分别部署三地此场景充分验证对象存储部署的灵活性三站点的部署方式有效的规避了单机房或单站点的风险。
通过WEB界面进入管理界面点击Config ure进入配置界面。创建1个访问节点 3个存储节点。访问节点部署北京站点 3个存储节点分别部署北京、上海、深圳三个城市。
^gH 6色e①尸"gl^
co,o中 rn C如da b」xf- C仑玉石歹I严动17216 1 57 1 15/m aoaget/b" lkEd,t DeceSlte adm'mo de0 appm,al
e,o,Admmostm的'的s,沁"""' assoo小em toas rte "
窃因'叩"t(o"216'6' 1 1'1
巳氐盯, ,,了2 16>6'11S)
""'' ° '"'括"'""" r'o比氐se
s,沁ct dea, to assoo l l i emtos s,te
邸旧3(17216157 1 18)
A岱 '比"父'缸t改Ide邓氐k沁比
e s归"心'"沺
的
m,石'
至此集群创建完成可以看到三中心三站点的部署方式将集群完全拉开点击 Devices可以查看集群中所有节点的分布信息和健康状况。
测试案例二存储资源池展现案例场景描述依据三站点的存储节点创建存储资源池包括storage pool 、access pool
和vault 。
创建storage pool 。将三站点的存储节点加入存储资源池每个站点 25G空间存储资源池创建完成有75G空间。
创建access pool 。由于本次测试只创建了一个访问节点故访问存储池中只包括一个节点选择多种API可对此进行访问。
CloudCone 商家在以前的篇幅中也有多次介绍到,这个商家也蛮有意思的。以前一直只有洛杉矶MC机房,而且在功能上和Linode、DO、Vultr一样可以随时删除采用按时计费模式。但是,他们没有学到人家的精华部分,要这样的小时计费,一定要机房多才有优势,否则压根没有多大用途。这不最近CloudCone商家有点小变化,有新人洛杉矶优化线路,具体是什么优化的等会我测试看看线路。内存CPU硬盘流量价格...
LOCVPS发来了针对元旦新年的促销活动,除了全场VPS主机8折优惠外,针对德国/荷兰KVM #1/美国KVM#2 VPS提供终身7折优惠码(限量50名,先到先得)。LOCVPS是一家成立于2012年的国人VPS服务商,提供中国香港、韩国、美国、日本、新加坡、德国、荷兰、俄罗斯等地区VPS服务器,基于KVM或XEN架构(推荐优先选择KVM),均选择直连或者优化线路,国内延迟低,适合建站或远程办公使...
至今为止介绍了很多UCLOUD云服务器的促销活动,UCLOUD业者以前看不到我们的个人用户,即使有促销活动,续费也很少。现在新用户的折扣力很大,包括旧用户在内也有一部分折扣。结果,我们的用户是他们的生存动力。没有共享他们的信息的理由是比较受欢迎的香港云服务器CN2GIA线路产品缺货。这不是刚才看到邮件注意和刘先生的通知,而是补充UCLOUD香港云服务器、INTELCPU配置的服务器。如果我们需要他...