10秒钟读懂吧。Hadoop 是离线计算之王。 中间计算的数据可以存储,这样如果失败了还能在错误的地方继续运行。劣势是处理小量数据不够快。 一个 job 光准备时间就要十几秒。Spark 是速度快、机器学习优势、内存计算优势。 劣势是新手容易搞死服务器。Hadoop 3. 发新闻称 将比 Spark 快 10 倍以上。