成都科汇科技有限公司
Kehui Technology Co., Ltd.
请点击此处输入图片描述
引子
随着数字化浪潮向每个人袭来,我们已经进入一个数据爆发的年代。人类每天产生的数据,已经远远超过传统存储技术的存储和管理能力。近年来,随着数据量的飞速增长,数据管理,尤其是非结构化海量数据的存储与管理,已经成为IT管理的热门话题。对象存储随之应运而生。
?
根据权威机构预测,在未来几年,企业级存储市场整体平均年复合增长率将放缓,而对象存储将以每年大于25%的年复合增长率以迅猛的势头飞速增长。为何在数据爆发的年代,对象存储这么热门呢?
简单说来原因有三:
1丨对象存储规模大
2丨对象存储赋予了数据灵魂
3丨对象存储更安全
1
对象存储的存储规模大
请点击此处输入图片描述
传统的存储架构中,通常是以GB/TB为单位进行使用及管理的。对于这样一个数据增长的年代,传统的方式是根据不同的业务单独购买,由于条块分割,导致数据形成一个一个的孤岛,同时受限于技术能力,难以进行统一的规划管理及使用。同时传统的使用方式中,文件以NAS的方式进行访问及管理,通常的管理能力大约为数百万-数千万个文件不等。
对象存储脱胎于互联网架构,通常起步以数百TB为单位,扩展能力能够达到数十个PB以上,同时对于使用公有云存储的应用系统,通常可以直接平滑使用对象存储。对象存储的管理是以平台式的管理为主,通常一个管理员就可以管理数十个PB以上的存储平台,大大降低了客户对于大容量存储的管理难度。同时,对象存储采用扁平化的存储管理结构,能够管理高达百亿的对象,远远超过传统NAS的管理能力。
2
对象存储赋予了数据灵魂
请点击此处输入图片描述
对象存储内部存储的数据,通常叫做对象。其与文件的差别,在于在文件的基础之上增加了元数据。这样,对于客户或者应用来说,数据就被赋予了新的灵魂,让数据在大数据年代的深度分析平台上进行跳舞。
为什么这么说呢?
从技术意义上来说,元数据是指用来描述数据的系统属性及自定义属性的数据集。通俗意义上来说,元数据就是用来描述数据本身的“标签”。举个简单的例子:
每个人采集的身份证照片,那么这个照片,就是数据本身。拍摄的时间、地点、相机型号、光圈、快门速度等,就是系统属性。而这个照片的人名、性别、生日、户口所在地、籍贯、住址、电话、工作等,就属于自定义属性的范围。
要依赖于某种传统技术,例如人口管理数据库,将数据保存在NAS里,将自定义属性的内容保存在数据库里,才能进行管理和检索访问。一旦离开了这个数据库,就无法找到这个数据的附加属性及其价值。那么这个照片在此时,就是没有生命的数据。
如果使用对象存储,那么可以将自定义属性作为元数据,与原始的数据放在一起按照对象的方式进行存储,由对象存储进行统一管理及存储,那么,这个数据就可以在**的系统上调取到其附加的自定义属性,从而获取到其关联的信息。那么此时,数据就被赋予了灵魂,可以独立的体现自我价值。
随着大数据分析的如火如荼,非结构化数据的价值也将大大提升,对象存储赋予数据新的灵魂,将会使得客户更容易进行数据的管理与分析,从而提炼出更多的业务价值。
3
对象存储更安全
请点击此处输入图片描述
传统的存储架构中,无论是SAN架构还是NAS架构,使用RAID方式进行保护是**普遍的。但是面对爆发增长的数据量,越来越多的客户选择使用单盘容量更大的硬盘或闪盘。在此时,当有盘损坏的时候,Raid重建的时间窗口将会变成以天为单位,原有的单块盘/两块盘冗余的可靠性已经远远无法**数据的安全性。同时,传统架构中,多以集中式架构为基础,当单一设备故障时,其所属的数据均无法顺利访问。
对象存储中,普遍采用多副本/纠删码的保护方式。其通常允许在一个故障域内至少有4个硬盘以上的冗余度。同时由于其采用分布式的部署方式,也赋予了当单一节点故障时,业务不中断的能力。