大数据至少要学习mr开发及hive,hive必须在linux弄,而mr开发可以在自己电脑开发调试1、安装cygwin,配置环境变量2、用eclipse中写mapreduce 及调试,项目加载hadoop 的jar3、本地单机,eclipse调试。
自己电脑 开3台虚拟机 做个伪分布式