先决条件:
Hadoop是用JAVA写的,所以首先要安装Java。
Linux是唯一支持的生产环境。Unix。Windows或者Mac OS能够作为开发环境。在Windows上安装Hadoop须要Cygwin。而且在Cygwin里要包括openssh。
在Linux上安装Hadoop
到hadoop.apache.org上下载最新的稳定版hadoop。hadoop-2.4.1.tar.gz
将其解压到某文件夹下,比如:
/home/norris/soft/hadoop-2.4.1
解压命令:tar -xvf ./hadoop-2.4.1.tar.gz
配置环境变量:
打开/home/norris/.profile文件:vi ~/.profile
我用的是Ubuntu 14.04.1,其他Linux系统的这个文件可能叫.bash_profile或.bash_login
在最后加上:
export HADOOP_INSTALL=/home/norris/soft/hadoop-2.4.1
export PATH=${PATH}:${HADOOP_INSTALL}/bin:${HADOOP_INSTALL}/sbin
保存文件。并运行使其生效:source ~/.profile
此时你的环境变量中应该有JAVA和HADOOP_INSTALL
运行:hadoop version,出现版本号信息。表示成功安装。
接下来要配置Hadoop的执行模式和HDFS,MapReduce(Yarn)