云计算时代 企业要如何迎接大数据?
IT168 12年04月06日 09:20 【转载】 作者:yesky 责任编辑:尤佳
导读:随着云计算的落地,“大数据”已成为业界讨论最广泛的关键词之一,很多企业已经在寻找合适的BI工具来处理不同来源收集到的大数据,但尽管大家对于大数据的意识在提高,但只有少部分的企业如谷歌和Facebook这样的企业才能够真正利用大数据挖掘企业商业价值。
大数据里的语义数据模型
大数据的数据很大一部分属于非结构化数据,包括语音、视频、图片、文档、论坛、网页等,如何才能轻松的操作这些数据呢?建立一个语义数据层是一个很不错的方法,你可以从中提取可用数据在数据库之上建立一个数据语义模型层,以此来帮助你理解地下所有的信息。
从不同来源收集到数据之后,企业要将其放置在一起,然后开始分析、处理这些数据。传统的做法是建立一个数据仓库,将这些收集到的数据提取到建立好的数据仓库中并生成报告。但这是一个相当耗时的过程,而且还无法灵活进行,每次你要做修改,都必须要回到数据仓库去做修改,相当的头疼。
大数据的数据容量是如此庞大,我们需要处理一大堆相关信息,这些信息来源都不同。不同的人对同一个东西的描述也都不一样,语义技术就能够帮助判断出这些叫法是否讲的是同一个事物。例如,有人会叫IBM为“IBM”,有人则称其为“International Business Machines”,其实说的都是一个公司,其实计算机是很笨的,只有通过这个语义数据模型层就能进行很好的判断。
大数据里的风险管理
在数据管理的时候,将所有数据放在一个地方是有很大的风险的,为了数据的安全,数据应该存储不同的地方。如数值数据可以存储在数据库里,非结构化的数据则可以存储在文档或者表格里。我们看到,增加了这些不同来源的风险信息的语义描述,意味着我们可以迅速了解综合风险状况。
通过语义数据模型一个最大的好处就是,在进行修改时,无需回到数据最底层进行修改,去重写遗留系统和数据库语义。因为这个语义数据模型是在数据之上的,它的破坏性远小于其他的技术,只要我们为一个来源的数据提供一个语义定义,我们就可以直接应用到其他来源的数据之上。