通俗的说就是
假如说你有一个篮子水果,你想知道苹果和梨的数量是多少,那么只要一个一个数就可以知道有多少了。
如果你有一个集装箱水果,这时候就需要很多人同时帮你数了,这相当于多进程或多线程。
如果你很多个集装箱的水果,这时就需要分布式计算了,也就是Hadoop。
Apache Hadoop是入门点,或者我们可以说是进入整个大数据生态系统的基础。它是大数据生态系统中大多数高级工具,应用程序和框架的基础,但是在学习Apache Hadoop时,还需要事先知道一些事情。
开始学习Apache Hadoop没有严格的先决条件。 但是,它使事情更容易,如果你想成为和Apache Hadoop的专家,这些是很好的知道的东西。
因此,Apache Hadoop的几个非常基本的先决条件是:Java Linux SQL