我来给你分享下我的想法 1、 hadoop开源,更容易拿到源代码等,微软等相关产品都是闭源的。Hadoop和微软就好比安卓和ios。市面上华为,小米,三星基本上都在Google开源Android的基础上二次开发成自己的rom。 2、 大数据现在是中国的十三五国家战略,大数据火啊,而Apache hadoop现在已经发展成一个庞大的生态圈。全球各地的开发者都在贡献者自己的代码。各个分支也是相当火爆,例如spark。 3、 现在普遍认为,大数据狭义的代表就是hadoop,其实并不是这样,现在大数据公司有很多, 有做大数据基础平台的,例如星环科技,MapR,Hortonwork,Cloudera,这四家应该是现在全球顶尖top4了,3家美国硅谷的,一家中国上海的。这四家都是基于开源hadoop发展起来的。 有MPP架构的DW产品,例如Teredata,GP,IBM等 有做上层数据应用的,这类公司非常多,很多需要卖人力工时。 也有现在卖数据的公司,这种公司也非常多。