您好,欢迎您来到DOIT! [ 登录 ] [ 免费注册 ]
您的位置:DOIT云计算> 风:云趋势 > 分析评论 > 正文

解读云计算中的“大数据”

硅谷动力 12年08月31日 16:28 【转载】 作者:硅谷动力 责任编辑:张文希

导读:半个世纪信息技术的发展,主要解决的是云计算中“结构性”数据的存储、处理与应用。“结构性”数据的特征有如你到银行去存取款,银行的计算机系统记录着你的名字,在名字之后是你存取款的数量、时间、类型等信息。这些数据的特征是“逻辑性强”,每个“因”都有“果”。

关键词: 云计算

数据中心正在成为新时代的“信息电厂”,成为知识经济的基础设施

  过去一年,“大数据”正在成为一个热门话题。

  半个世纪信息技术的发展,主要解决的是云计算中“结构性”数据的存储、处理与应用。“结构性”数据的特征有如你到银行去存取款,银行的计算机系统记录着你的名字,在名字之后是你存取款的数量、时间、类型等信息。这些数据的特征是“逻辑性强”,每个“因”都有“果”.

  然而现实社会中大量数据事实上没有“显现性”的因果关系,如一个时刻的交通堵塞、天气状态、人的状态(心理与物理)等,它的特征是随时、海量与弹性,如一个突变天气分析包含会有几百个PB(Petabyte, 1Petabyte=1024TB)数据。而一个社会事件如乔布斯去世瞬间所产生在互联网上的数据(微博、纪念、文章、视频等)也是突然暴发出来。

  传统的计算机设计与软件都是以解决“结构性”数据为主。对这一类新型的“非结构”要求一种新的计算架构。互联网时代,尤其是社交网络、电子商务与移动通讯把人类社会带入一个以“PB”为单位的结构与非结构数据信息的新时代,它就是“大数据(Big Data)”时代。

  大数据的企业与技术

  一个大规模生产、分享、应用数据的时代正在开启,我们每个人都成为了数据的创造者和使用者,微博、社交网络都是最好的例子。

  工业革命以后,书籍等以文字为载体的知识大约每十年可以翻一番;1970年以后,知识大约每三年就可以翻一番;如今,全球信息总量每两年就可以翻一番;2010年互联网的数据量,比之前所有年份的总和还要多。现在,人类每天可以产生数以PB的数据,从日志、微博、分享照片、传送视频,多种格式的数据实时、不断地更新。在医疗卫生、地理信息、电子商务、影视娱乐等行业,每天也都在创造着大量的数据。

  数据正在成为从工业经济向知识经济转变的重要特征,成为新时代最关键的生产要素和产品形态。

  代表着大数据时代的如Apple、Facebook、Amazon等公司正成为这场变革的推动力量。同时新企业也层出不穷,比如2007年才成立的Dropbox公司,创始人不到27岁,估值已经超过40亿美元,这是一家提供文件备份及共享服务的公司,允许用户在不同平台和设备之间同步并共享文件,Dropbox用户数量超过2500万,每天存储的文件数量2亿多个,苹果公司曾出价8亿美元想收购它未成功。

  值得一提的是,这家公司最早使用的也是Amazon的S3云计算平台,得以低成本迅速起步。Amazon云计算数据存储服务,原来只是为了利用闲置服务器资源,现在一年可以带来近10亿美元收入,并且供不应求。今年初,Amazon S3云存储服务存储文件是2620亿份,这个数字最近变成了5660亿份,翻了1倍还多。目前Amazon称自己的S3数据存储服务,担心的已经不是数据的存储成本,而是更加重要的数据处理的问题。

  云计算中的大数据有几个核心要素,如数据在云端的集合与分享、个人数据的无缝连接(随时、随地、同步)以及数据的跟踪分析和挖掘。

  源自雅虎的Hadoop这样大数据系统越来越重要,作为开源的分布式数据处理系统架构,Hadoop主要面向存储和处理成百上千TB直至PB级别的结构化、半结构化或非结构化的大数据。Hadoop提供的MapReduce能将大数据问题分解成多个子问题,将它们分配到成百上千个处理节点之上,再将结果汇集到一个小数据集当中,从而更容易分析得出最后的结果。

  Hadoop已经成为AOL、Facebook、Twitter和Netflix这些公司大数据分析的主要解决方案。比如像Facebook一天的数据要比很多大公司一年的数据还要多,他们通过Hadoop收集和存储每天生成的数百万的文件,使用开源Apache Hive数据仓库工具集中对这些数据进行分析。

  Opera Solutions这样的创新公司提供的服务更加引人注目:客户将数据上传到Opera平台,Opera就会根据用户数据池里的相关“信号”进行分析,根据每个客户的个性化需求,Opera雇佣各行业的专家来帮助他们进行数据分析,Opera Solutions的年营业额已经超过1亿美元。

  新的创业公司像MapR、Zettaset、Cloudera、HStreaming这些和Hadoop相关的大数据公司,在资本市场倍受青睐。它的快速成长将会成为下一个改变信息技术的力量。

  • 人人网
  • 转播到腾讯微博腾讯微博
  • 新浪微博
热点文章排行
  • 微软重拳推出Office 365  微软重拳推出Office 365 2011年07月08日 经过大半年的准备,微软终于在今年6月份隆重推出了云计算办公套件Office 365。那么,Office 365作为微软集成了电子邮件、协作软件、字处理软件、电子表格和演示程序的办公套件重要产品之一,Office 365对微软来说到底是福是祸,能否为微软带来实质性的营收,能否让微软在新兴的云计算领域赢得一席之地?
  • 云计算和算计云 云计算和算计云 2011年06月22日 DOIT特别专题从云的历史进程到目前实施云的厂商,逐一谈起,让读者耳目一新的了解到现在云的现状以及如何不被云所算计。
  • 云端争夺战——IT厂商的盛宴 云端争夺战——IT厂商的盛宴 2010年07月27日 云计算到底是如何发迹的似乎已经不再重要了,重要的是它确实炙手可热。