云存储是在云计算(cloud computing)概念上延伸和发展出来的一个新的概念,是指通过集群应用、网格技术或分布式文件系统等功能,将网络中大量各种不同类型的存储设备通过应用软件集合起来协同工作,共同对外提供数据存储和业务访问功能的一个系统。
云存储对使用者来讲,不是指某一个具体的设备,而是指一个由许许多多个存储设备和服务器所构成的集合体。使用者使用云存储,并不是使用某一个存储设备,而是使用整个云存储系统带来的一种数据访问服务。所以严格来讲,云存储不是存储,而是一种服务。云存储的核心是应用软件与存储设备相结合,通过应用软件来实现存储设备向存储服务的转变。
与传统的存储设备相比,云存储不仅仅是一个硬件,而是一个网络设备、存储设备、服务器、应用软件、公用访问接口、接入网、和客户端程序等多个部分组成的复杂系统。各部分以存储设备为核心,通过应用软件来对外提供数据存储和业务访问服务。
云存储不仅仅是存储,更多的是应用。应用存储是一种在存储设备中集成了应用软件功能的存储设备,它不仅具有数据存储功能,还具有应用软件功能,可以看作是服务器和存储设备的集合体。应用存储技术的发展可以大量减少云存储中服务器的数量,从而降低系统建设成本,减少系统中由服务器造成单点故障和性能瓶颈,减少数据传输环节,提供系统性能和效率,保证整个系统的高效稳定运行。
技术趋势
IDC研究表明,从2006年到2010年,全球信息总量将增长6倍以上,从161EB增加到988EB(1EB=1024PB)。一些新推出的磁盘阵列中已经普遍采用了750GB或1TB的SATA硬盘。目前已知存储密度最高的磁盘阵列可以在4U空间内提供高达42TB的存储容量,这在以前是根本无法想像的。最新一代LTO-4磁带的单盒磁带存储容量也达到了1.6TB(压缩比为2∶1)。
技术的不断进步必将推动存储向更高容量发展,而重复数据删除、压缩等技术的引入,可以进一步提升存储空间的利用率。从性能方面看,FC磁盘阵列已经逐步过渡到4Gb时代,而8Gb FC又在向数据中心用户招手;万兆IP存储不再是纸上谈兵;在InfiniBand领域,已经有厂商推出了40Gb InfiniBand适配器产品。[nextpage]
现有的网络存储架构,比如SAN或NAS还能够有效支撑无处不在的云计算环境吗?有人表示怀疑。其主要论据是:面对PB级的海量存储需求,传统的SAN或NAS在容量和性能的扩展上会存在瓶颈;云计算这种新型的服务模式必然要求存储架构保持极低的成本,而现有的一些高端存储设备显然还不能满足这种需求。
从谷歌公司的实践来看,它们在现有的云计算环境中并没有采用SAN架构,而是使用了可扩展的分布式文件系统Google File System(GFS)。这是一种高效的集群存储技术。 近几年逐渐兴起的集群存储技术,不仅轻松突破了SAN的性能瓶颈,而且可以实现性能与容量的线性扩展,这对于追求高性能、高可用性的企业用户来说是一个新选择。
随着一些专注于集群存储业务的厂商,比如Panasas、Isilon、龙存科技等在中国市场的快速发展,集群存储技术的应用会更加普及。虽然集群存储在处理非结构化数据方面优势十分明显,但从目前情况看,集群存储不太可能在短时间内完全取代传统的网络存储方式,SAN和NAS仍会有用武之地。
云存储选择
虽然在可扩展的NAS平台上有很多选择,但是通常来说,他们表现为一种服务、一种硬件设备或一种软件解决方案,每一种选择都有它们自身的优势和劣势:
● 服务模式:最普遍的情况下, 当你考虑云存储的时候,你就会想到其所提供的服务产品。这种模式很容易开始,其可扩展性几乎是瞬间的。根据定义,你拥有一份异地数据的备份。然而,带宽是有限的,因此要考虑你的恢复模型。你必须要满足你网络之外的数据的需求。
● HW模式:这种部署位于防火墙背后,并且其提供的吞吐量要比公共的内部网络好。购买整合的硬件存储解决方案非常方便,而且,如果厂商在安装/管理上做的好的话,其往往伴随有机架和堆栈模型。但是,这样你就会放弃某些摩尔定律的优势,因为你会受到硬件设备的限制。
● SW模式:SW模式具有HW模式所具有的优势。另外,它还具有HW所没有的价格竞争优势。然而,其安装/管理过程序要谨慎关注,因为安装某些SW的确非常困难,或者可能需要其他条件来限制人们选择HW,而选择SW。