Amazon云承诺:证据确凿还是夸夸其谈?
CIOAge 12年05月03日 16:59 【转载】 作者:CIOAge 核子可乐 责任编辑:王振
导读:Amazon公司认为,云计算是促成并最终引发计算行业迎来七大重要变革的必要因素。这种言论到底证据确凿还是夸夸其谈?让我们一起用现实检验这些云承诺。
Amazon云承诺第一条: 云让分布式结构变得触手可及
考虑到任何一套计算机系统都会发生故障,因此计算机科学家们多年来一直希望通过容错率更高的分布式结构回避宕机风险。不过说起来容易,真正要让这一大批分处不同数据中心且彼此隔离的服务器及网络准确同步实在是个大难题。Amazon公司CTO Werner Vogels博士认为,在云计算的帮助下,保证分布式系统的坚实可靠似乎相对容易一些。
充分发掘一套已经较为完善的云服务体系显然要比自己白手起家从零创建容易得多。凭借Amazon的服务实例,我们可以将自己的部署扩展到全球范围内的八大基础设施分区中,每个分区都包含着多个可用区域。可用区域由数个数据中心组成,每个中心都位于不同的地震板块之上,且由彼此独立的供电网络提供能源支持。Amazon公司提供的分布式服务——包括简单存储服务(简称S3)、DynamoDB NoSQL数据库服务以及Amazon关系类数据库服务(简称RDS)——则横跨多个可用区域。他们还提供分布式弹性计算云(简称EC2)处理能力及多项管理服务,例如简单工作流服务(简称SWF)、简单队列服务(简称SQS)以及简单通知服务(简称SNS)等。
能够提供全球性分布式结构的云供应商并不少见,但AWS占据了基础设施即服务市场整体份额的59%。这一来自451集团的调查结果证明,Amazon公司确实在全球范围内(至少在理论上)为客户提供了更优的全局处理能力、可扩展性、系统分布以及冗余设施保障。
实际情况对比第一条: 复杂性仍然挥之不去
Amazon公司的确做了很多工作,希望通过AWS基础设施帮助自己的客户远离创建自有高分布式系统的各种问题。然而Amazon公司自己也无法回避系统复杂性以及不可避免的系统故障。尽管拥有全球性规模设施及大量冗余设备,但他们仍然不可能让自己运行中的系统实现100%完美的运行记录。
仅在2011年一年,Amazon公司就遭遇了两次大规模宕机事件:第一次发生在去年四月份,当时整个美国东海岸数天无法正常使用服务;另一次则发生在八月,欧洲的数个可用性区域遭受断电威胁,同时位于爱尔兰都柏灵的Amazon数据中心宣告备份生成工具未能正常生效。八月事故给我们留下了极大的心理阴影,因为事实证明一个可用性区域的崩溃很可能会直接拖垮另一个区块。这一点实际上颇令人费解:照理来说,在这种高分布式、高容错率的体系中,不该发生此类情况才对。
不过令人意外的是,一向对AWS依赖程度极高的游戏网站Zynga却没有受到这一连串宕机事件的影响。事后我们了解到,他们预先部署了自己的私有云体系,并利用分布式隔离及冗余设计保障了自身系统的正常运作。Zynga网站的经历充分证明了“千好万好不如自己的好”,因此他们将交付AWS处理的任务比例由原先的80%缩减至20%。如今,他们只在游戏正式上线之前将处理任务交付公共云服务,一旦运转步入正轨,他们就会逐步将任务交给自己的内部数据中心。