有利即有弊 如何看待大数据前景
计世网 12年06月27日 14:00 【转载】 作者:计世网 责任编辑:王振
打破IT传统
Webb一直在加大力度开发Equifax的数据分析和协作功能,他带领1000人规模的IT小组对大数据进行了大胆研究:“如果数据的使用寿命是 2至15年,我们必须充分利用这段时间,而从现在IT小组取得的成绩来看,Equifax无疑已经通过技术创新获得了市场竞争优势。”
2011年,Equifax收购了一家商业智能工具公司和工作流软件开发商。事实上,在过去的5年中,Equifax共斥资17亿美元收购了多家数据收集和技术公司。这与Equifax在成立之初50年,一直采用纸张分类账的做法大相迳庭。
对海量数据的分析挖掘工作需要付出大量的IT成本。以往,拥有大量数据的公司需要建立大型数据仓库,并在大规模并行处理系统上运行。Brooks表 示,建立大型数据仓库所需硬件成本太高,另外关系型数据库的架构也阻碍了对非结构化数据的查询。因此,Equifax存储和检索数据的方式一反传统,它并 没有将这项工作视做处理查询,而是将它视做交付内容,将数据分布在低成本服务器集群上,由IT部门开发专有的分布式检索技术来查找信息。
Brooks说:“由于我们对数据量、交易查询量和响应时间的要求都很高,因此,我们一直小心谨慎,以免盲目跟随行业标准的做法。业内的传统做法需要建设庞大而复杂的基础设施,但如果换个角度考虑,其实这些基础设施建设就变得没有必要。”
目前,Equifax的数据专家要花时间对从公共和私人来源整合而来的数据进行重复数据删除和清洁处理,但他们不会一味地要求一个消费者只有惟一的一份信息。“上下文更重要。”他说,“实际上,他们是对的。现在,我们更多地考虑观察结果,而不是所谓的事实。”