Greenplum转身:Hadoop是数据库的未来

2013-03-15 07:02:02
[ BPO网导读 ] Greenplum的改造,使得Hadoop的操作更像是一个关系型数据库,让你快速地使用结构化查询语言(SQL),几十年来后者一直主导着数据库的世界。“当我们被EMC收购,我们真的相信这两个世界融合在一起

杰夫·哈梅巴赫(Jeff Hammerbacher)说,Facebook尝试了所有的(分析数据库),但没有一个能做到这家网络巨头需要它们做的。
  哈梅巴赫是哈佛大学毕业的数学家,在2006年被聘请到Facebook,他的工作是治理马克·扎克伯格(Mark Zuckerberg)的社交网络所产生的所有数据 - 弄明白人们过去在这个网站上面做些什么,并找到提高服务水平的新途径。但哈梅巴赫记得,当这项服务覆盖到数以百万计的人群,它所产生的数据,超过了该公司手边软件的分析能力:一个老式的Oracle数据库。
  当时,一长队的初创企业提供了各种新的数据库,用以存储和分析海量的数据,如 Greenplum,Vertica,和Nete​​zza。哈梅巴赫和Facebook一一尝试过,但是,它们统统不适合这项任务。
  最后,Facebook迁移到了一个鲜为人知的开源软件平台,它就是刚在雅虎落地的Hadoop,Hadoop的建立是为了利用数以千计的普通计算机服务器的威力。不同于 Greenplums和Verticas,哈梅巴赫说,Hadoop可以存储和处理迅速成为世界上最流行的社交网络所产生的不断扩大的海量数据。
  在接下来的几年中,Hadoop不仅在改造了Facebook和雅虎,也改造了许多其他Web服务的数据分析。然后一大批的商业软件供应商开始将Hadoop销售到其他领域。很快地,即使是像甲骨文和Greenplum这样的企业也在兜售Hadoop。Hadoop在这些公司仍然被视为传统数据库的一种辅助 - 作为一种工具,只适合某些类型的数据分析。但现在,这也在发生变化。
  在上周一,Greenplum - 现在为高科技巨头EMC所拥有 - 透露,该公司已经花了近两年的时间构建一个全新的Hadoop平台,它相信将把传统数据库甩在身后。这个工具被称为Pivotal HD,可以存储大量的信息,但它的设计在于让速度明显快于现有的开源平台。
  “我们认为,我们面临一个重大的转变,企业都在寻找一套规范,应用程序可以很容易地运行在现有的数据架构和关系数据库上,”Paul Martiz说,他是曾经是微软的高管,现在负责Greenplum。企业需要有新的数据架构,Maritz说,这个架构的起点就是Hadoop。
  这是一个令人惊讶的声明 - 从这样的一家公司,其原有的业务围绕着一个关系型的数据库,以整齐的行和列存储数据。但是,Greenplum和EMC只是承认了杰夫·哈梅巴赫和Facebook多年前得到的结论:Hadoop非常适合的现代企业所面临的海量数据存储和处理。
  更重要的是,Greenplum的改造,使得Hadoop的操作更像是一个关系型数据库,让你快速地使用结构化查询语言(SQL),几十年来后者一直主导着数据库的世界。“当我们被EMC收购,我们真的相信这两个世界融合在一起,”Greenplum的联合创始人Scott Yara说,“这是令人兴奋的是,如果你可以将大规模并行查询处理技术带到数据库系统中(像Greenplum),并基本上与Hadoop平台融合。”


BPO网版权及免责声明

1、凡本网注明:“BPO网”或者“原创”的所有作品,版权均属于BPO网所有,其他媒体、网站或个人转载使用时必须注明:“文章来源:BPO网”。违反上述声明者,本网将追究其法律责任。

2、凡本网注明“来源:XXX(非BPO网)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其产生的任何结果负责。

BPO公众号 BPO公众号
返回顶部