崭露头角:“大数据”开启一扇新的大门
比特网 12年05月07日 10:10 【转载】 作者:比特网 责任编辑:王振
什么是“大数据”?这当然是一个带有文化基因和营销理念的词汇,但同时也反映了科技领域中正在发展中的趋势,这种趋势为理解这个世界和作出决策的新方法开启了一扇大门。
根据科技研究公司IDC作出的估测,数据一直都在以每年50%的速度增长,换而言之,也就是每两年就增长一倍。这不是简单的数据增多的问题,而是全新的问题。举例来说,在当今全球范围内的工业设备、汽车、电子仪表和装运箱中,都有着无数的数字传感器,这些传感器能测量和交流位置、运动、震动、温度和湿度等数据,甚至还能测量空气中的化学变化。
将这些交流传感器与计算智能连接起来,那么你就会看到所谓的“物联网”(Internet of Things)或“工业互联网”(Industrial Internet)。在信息获取的问题上取得进步也是促进“大数据”趋势发展的原因之一。举例来说,政府数据——聘用数据及其他信息——一直都在稳步地向网络转移。在2009年中,美国政府通过启动Data.gov网站的方式进一步开放了数据的大门,这个网站向公众提供各种各样的政府数据。
数据不仅仅是正在变得更加可用,同时也正在变得更加容易被计算机所理解。“大数据”发展趋势中所增加的大部分数据都是在自然环境下产生的,比如说网络言论、图片和视频等不受控制的东西,以及来自于传感器的数据等。这些是所谓的“非结构化数据”,通常不能为传统的数据库所用。
但是,旨在从互联网时代非结构化数据的庞大“宝藏”中获得知识和洞察力的计算机工具正在迅速发展中。在这种工具发展的最前沿是迅速取得进步的人工智能(AI)技术,比如说自然语言处理、模式识别和机器学习等。
这些人工智能技术能应用于许多领域。举例来说,谷歌的搜索和广告业务及其实验中的机器人(19.360,0.69,3.70%)汽车都利用了很多的人工智能技术。在加利福尼亚州的公路上,谷歌的机器人汽车已经跑了数千英里的路。谷歌的这两项业务都让“大数据”时代的挑战却步,它们对数量庞大的数据进行分析,并作出瞬时的决策。
反过来,大量的新数据也正在加快计算领域的进步,这是“大数据”时代中的一个良性循环。举例来说,机器学习算法能基于数据来进行学习,数据越多机器就能学到越多。以苹果在去年秋天推出的iPhohne手机Siri语音助理服务为例,这个应用的源头可回溯至五角大楼的一个研究项目,该项目随后被分离出来,成为了一家硅谷创业公司。苹果在2010年收购了Siri,并继续向其提供更多数据。时至今日,在人们提供成百上千万条问题的环境下,Siri正在变成一种日益熟练的个人助理,能向用户提供提醒服务、天气预报、餐饮建议和对大量问题作出解答等服务。