Linux下安装Hadoop完全分布式Ubuntu12.10
Hadoop 的安装非常简单 可以在官网上下载到最近的几个版本 最好使用稳定版。 本例在3台机器集群安装。 hadoop版本如下
工具/原料hadoop-0.20.2.tar.gz
Ubuntu12. 10
安装步骤
1
安装ubuntu
Ubuntu12. 10交换空间4G(内存2G) 。 具体安装过程不赘述。
用户名统一为 hadoop;
组群:hadoop;
机器名namenode(主节点),datanode1(从节点 1),datanode2(从节点2) 。
2
在Ubuntu下创建hadoop用户组和用户(也可在安装系统时通过界面配置)
1 .创建hadoop用户组;
$sudoaddgrouphadoop
记下这里为 hadoop 用户设置的密码后面使用 hadoop 用户登录时需要用到。
2.创建hadoop用户;
$sudoadduser-ingrouphadoophadoop
3.给hadoop用户添加权限 打开/etc/sudoers文件;
$sudogedit/etc/sudoers
4. 给hadoop用户赋予root用户同样的权限。
在rootALL=(ALL:ALL)ALL下添加如下内容hadoopALL=(ALL:ALL)ALL
3
在Ubuntu下安装JDK
配置环境变量
$ sudo gedit /etc/profile
在文件的末尾加上如下内容 保存并关闭文件
# for javaexport JAVA_HOME=/usr/lib/jvm/jdk1 .8.0export JRE_HOME=${JAVA_HOME} /jreexport CLASSPATH=. :${JAVA_HOME} /lib:${JRE_HOME} /libexport PATH=${JAVA_HOME}/bin:${JRE_HOME} /bin:$PATH使设置生效 到此部JDK的配置就都完成了
$ source /etc/profile
为保证正确性 进行简单的测试
$ java -version
输出javaversion 1 .8.0
Java(TM) SE Runtime Environment (build 1 .8.0)
Java HotSpot(TM) Server VM
修改默认JDKsudo update-alternatives --install /usr/bin/java java/usr/lib/jvm/jdk1 .8.0/bin/java 300sudo update-alternatives --install /usr/bin/javac javac/usr/lib/jvm/jdk1 .8.0/bin/javac 300sudo update-alternatives --install /usr/bin/jar jar/usr/lib/jvm/jdk1 .8.0/bin/jar 300
以下两句可选(最好执行) sudo update-alternatives --config javasudo update-alternatives --config javac
4
修改机器名(这步骤可以省略)
每当ubuntu安装成功时机器名都默认为 ubuntu 但为了以后集群中能够容易分辨各台服务器 需要给每台机器取个不同的名字。机器名由/etc/hostname文件决定。
1 .打开/etc/hostname文件;
$sudogedit/etc/hostname
2.将/etc/hostname文件中的ubuntu改为对应机器如主节点中修改为namenode。 重启生效。
3.修改/etc/hosts文件
$sudogedit/etc/hosts
改为如下所示 并且将每台机器的IP设置为固定IP
5
安装ssh服务
这里的 ssh不是指三大框架:spring,struts,hibernate 而是一种远程登录协议。ubuntu一般只是默认安装了 ssh-agent, 可以用如下命令查看
$sudops-ef|grepssh
如果只有 ssh-agent就需要安装openssh-server了。
$sudoapt-getinstallsshopenssh-server
6
建立ssh无密码登录本机
首先要转换成hadoop用户 执行以下命令
$sudosu-hadoopssh生成密钥有rsa和dsa两种生成方式 默认情况下采用rsa方式。
1 .创建ssh-key 这里我们采用rsa方式;
$ssh-keygen-trsa-P
请注意 ssh-kengen 是用连字符连着的千万不要分开。 问题如下
按照您的步行的程中我在ssh-keygen-t rsa -P生的小入之後端示Badescape character ygen(红字部分就是问题所在他将 ssh-keygen 分开了。 )
(注 回车后会在~/.ssh/下生成两个文件 id_rsa和id_rsa.pub这两个文件是成对出现的)
2.创建授权文件authorized_keys
进入~/.ssh/目录下 发现开始是没有authorized_keys文件的 可以使用以下两种方法
( 1) 将id_rsa.pub追加到authorized_keys授权文件中;
$cd~/.ssh
$catid_rsa.pub>>authorized_keys
(2) 复制 id_rsa.pub 为 authorized_keys
$cp~/.ssh/id_rsa.pub~/.ssh/authorized_keys
3.登录localhost;
$sshlocalhost
4. 执行退出命令(exit或CTRL+D) ;
7
安装hadoop
1 .假设 hadoop-0.20.2.tar.gz在桌面 将它复制到安装目录/usr/local/下;
$sudocphadoop-0.20.2.tar.gz/usr/local/
2.解压hadoop-0.20.2.tar.gz;
$cd/usr/local
$sudotar-zxvfhadoop-0.20.2.tar.gz
3.将解压出的文件夹改名为hadoop;
$sudomvhadoop-0.20.2hadoop
4.将该hadoop文件夹的属主用户设为hadoop
$sudochown-Rhadoop:hadoophadoop
5.打开hadoop/conf/hadoop-env.sh文件;
$sudogedithadoop/conf/hadoop-env.sh
6.配置 conf/hadoop-env.sh(找到#exportJAVA_HOME=. . . ,去掉# 然后加上本机jdk的路径) ;
exportJAVA_HOME=/usr/lib/jvm/java1 .8.0
7.打开conf/core-site.xml文件;
$sudogedithadoop/conf/core-site.xmlfs.default.namehdfs://namenode:9000
8.打开conf/mapred-site.xml文件;
$sudogedithadoop/conf/mapred-site.xmlmapred.job.trackernamenode:9001
9.打开conf/hdfs-site.xml文件;
注意 datalog1 datalog2 data1 data2文件夹最好事先建好。
10.打开conf/masters文件 添加作为secondarynamenode的主机名.
1 1 .打开conf/slaves文件 添加作为slave的主机名 一行一个。
作者设置如下
8
运行hadoop
1 .进入hadoop 目录下格式化hdfs文件系统 初次运行hadoop时一定要有该操作
$cd/usr/local/hadoop/
$bin/hadoopnamenode-format
2.启动bin/start-all.sh
进入bin 目录下 $ ./start-all.sh关闭 同目录下./stop-all.sh
3.检测hadoop是否启动成功
$ jps
4.Web查看
注意事项
集群中所有机器的登录用户名和所属组都要相同 本文用户名为hadoop 组群也为Hadoop。
每台机器的IP设置为固定IP主机名-ip需要在每一台机器里修改对应的hosts文件。
注意代码中的粗斜体为具体安装目录 要和实际目录相同。
忍耐和坚持虽是痛苦的事情 但却能渐渐地为你带来好处。 ――奥维德
稳爱云(www.wenaiyun.com)是创建于2021年的国人IDC商家,主要目前要出售香港VPS、香港独立服务器、美国高防VPS、美国CERA VPS 等目前在售VPS线路有三网CN2、CN2 GIA,该公司旗下产品均采用KVM虚拟化架构。机房采用业内口碑最好香港沙田机房,稳定,好用,数据安全。线路采用三网(电信,联通,移动)回程电信cn2、cn2 gia优质网络,延迟低,速度快。自行封装的...
华为云怎么样?华为云用在线的方式将华为30多年在ICT基础设施领域的技术积累和产品解决方案开放给客户,致力于提供稳定可靠、安全可信、可持续创新的云服务,做智能世界的“黑土地”,推进实现“用得起、用得好、用得放心”的普惠AI。华为云作为底座,为华为全栈全场景AI战略提供强大的算力平台和更易用的开发平台。本次年终聚惠618活动相当给力,1核2G内存1m云耀云服务器仅88元/年起,送主机安全基础版套餐,...
HostKvm发布了夏季特别促销活动,针对香港国际/韩国机房VPS主机提供7折优惠码,其他机房全场8折,优惠后2GB内存套餐月付仅5.95美元起。这是一家成立于2013年的国外主机服务商,主要提供基于KVM架构的VPS主机,可选数据中心包括日本、新加坡、韩国、美国、中国香港等多个地区机房,均为国内直连或优化线路,延迟较低,适合建站或者远程办公等。下面分享几款香港VPS和韩国VPS的配置和价格信息。...