专家谈存储那些事 支招轻松应对大数据
IT专家网 12年06月27日 14:58 【转载】 作者:IT专家网 责任编辑:王振
导读:在日前的IBM智慧存储发布会上,全球网络存储工业协会中国技术中心首席技术顾问侯海波深入浅出地介绍了存储的主要功能、存储的历史、现状和未来,并着重谈了当前存储面临的数据爆炸增长等挑战以及应对的方法。
应对之道
今天的应对之道,首先我们看一下数据存在什么地方,当然大家可能想到光媒介,有磁带,但是主流的还是磁盘,1956年的时候IBM发明了第一块磁盘,当时大概是24寸,100多公斤,数据量是5MB,今天随便一块磁盘上到2TB、3TB,也就是说我们的容量已经扩展了100万倍。但是,不管磁盘多大,在企业应用里面还是不够的,我们知道电信的磁盘是几百块、上千块才能存得下,怎么把这些磁盘组织起来,存储更大的容量,这里我们就用到一个技术,一个是外部存储,把磁盘组织起来放到一个柜子里,这叫磁盘阵列,不光放进去就可以了,还有一个RAID的技术,把这些磁盘组织起来,通过一系列的方式使得我们得到更大的容量来使用,同时性能还提高。举个例子,一个人假如说只能记100个单词,如果要记 1000个单词可以组织10个人,每人记100个,组成一个团队之后存储容量就扩大了。如果我要是记100个单词,第一个人记,其他人闲着,可能我还是需要100分钟的时间。如果100个单词来了之后,把它分成10组,每一个人记10个,大家同时记,那么我们10分钟就可以把数据记下来,这就是说RAID 技术让我们可以利用廉价的磁盘组成一个大容量的磁盘,当然,它的可靠性也会增加。
介质还不能完全解决问题,我们还需要一个好的架构。早期的存储,我们是直接把磁盘放到服务器这样的主机里面,主机和磁盘是密不可分的,在这种情况下,如果我要增加存储,我需要首先增加主机。后来,我们把磁盘扩展到机箱的外面,组成一个柜子,也就是磁盘阵列,刚开始只能通过一种协议,也就是我说的NAS这样的连接联到一台主机,虽然解决了容量的问题,但是共享的问题、每一台应用的数据保护问题可能需要分别对待,这是分别进行存储,后来我们产生了更大容量的企业化存储,大到可以把企业所有的数据都存在里面,而且有更好的一些通道协议把它联到很多的主机上面,可以把所有的应用主机联到一起来,实现了企业数据的统一存储。在统一的情况下就可以对数据进行统一的管理,比如说备份就很方便了,这个协议最早也是IBM做的。这样一个架构还不是最方便的,最方便的是网络存储,好比大家拿着笔记本电脑,插上网线就可以调用数据了,拔了网线就可以回家了。我们的设想是把所有的主机都列到网络中来,把所有的存储都列到网络中来,大家通过网络的方式去扩展,新增加了一个业务部门,新增加一个主机就可以了,明天新买一个盘阵,直接接到交换机上就可以了。
刚才讲到了内部阵列存储和外部阵列存储,这个架构还在用。这是NAS结构,这种方式在应对访问某个文件时是非常方便的,但是最典型的还是我们构建存储区域网,这样的话,我们就像访问本地的磁盘一样,虽然你在写数据时会写到磁盘阵列里面去。
我们再来看看这些技术,一个是分级存储。既要保证性能,我需要把数据放在高性能的介质上,为了保存大量的数据,我需要用廉价的存储磁盘来支持,每一种介质都要用。一个数据隔一段时间不用了,可以自动移到二级存储上,再不用放到三级存储上,需要的时候调用到一级存储上,这个过程是完全自动的。