精品文档
Linux下安装Hadoop完全分布式Ubuntu12. 10
Hadoop的安装非常简单可以在官网上下载到最近的几个版本最好使用稳定版。本例在3台机器集群安装。hadoop版本如下
工具/原料hadoop-0.20.2. tar.gz
Ubuntu12. 10
安装步骤
1
安装ubuntu
Ubuntu12. 10交换空间4G(内存2G) 。具体安装过程不赘述。
用户名统一为 hadoop;
组群:hadoop;
机器名 namenode(主节点) ,datanode1 (从节点
1) ,datanode2(从节点2) 。
在Ubuntu下创建hadoop用户组和用户(也可在安装系统时通过界面配置)
1.创建hadoop用户组;
$sudoaddgrouphadoop
记下这里为 hadoop用户设置的密码 后面使用
1/9
精品文档hadoop用户登录时需要用到。
.创建hadoop用户;
$sudoadduser-ingrouphadoophadoop
.给hadoop用户添加权限打开/etc/sudoers文件;
$sudogedit/etc/sudoers
.给hadoop用户赋予root用户同样的权限。
在rootALL=(ALL:ALL) ALL下添加如下内容hadoopALL=(ALL:ALL) ALL
在Ubuntu下安装JDK
配置环境变量
$ sudo gedit /etc/profile
在文件的末尾加上如下内容保存并关闭文件
# for javaexport JAVA_HOME=/usr/lib/jvm/jdk1.8.0export JRE_HOME=${JAVA_HOME}/jreexport
CLASSPATH=. :${JAVA_HOME}/l ib:${JRE_HOME}/l ibexport
PATH=${JAVA_HOME}/bin:${JRE_HOME}/bin:$PATH
使设置生效到此部JDK的配置就都完成了
$ source /etc/profile
2/9
精品文档
为保证正确性进行简单的测试
$ java -version
输出java version "1.8.0"
Java(TM) SE Runtime Environment (build 1.8.0)
Java HotSpot(TM) Server VM
修改默认JDKsudo update-alternatives --install /usr/bin/javajava /usr/lib/jvm/jdk1.8.0/bin/java00sudo update-alternatives--install /usr/bin/javacjavac /usr/lib/jvm/jdk1.8.0/bin/javac00sudo update-alternatives --install /usr/bin/jarjar /usr/lib/jvm/jdk1.8.0/bin/jar00
以下两句可选(最好执行) sudo update-alternatives --config javasudo update-alternatives --config javac
修改机器名(这步骤可以省略)
每当ubuntu安装成功时机器名都默认为 ubuntu 但为了以后集群中能够容易分辨各台服务器需要给每台机器取个不同的名字。机器名由/etc/hostname文件决定。
1.打开/etc/hostname文件;
3/9
精品文档
$sudogedit/etc/hostname
.将/etc/hostname文件中的ubuntu改为对应机器如主节点中修改为"namenode"。重启生效。
.修改/etc/hosts文件
$sudogedit/etc/hosts
改为如下所示并且将每台机器的IP设置为固定IP
安装ssh服务
这 里 的 ssh 不 是 指 三 大 框架:spring, struts,hibernate而是一种远程登录协议。ubuntu一般只是默认安装了 ssh-agent, 可以用如下命令查看
$sudops-ef|grepssh
如果只有ssh-agent就需要安装openssh-server了。
$sudoapt-getinstallsshopenssh-server
建立ssh无密码登录本机
首先要转换成hadoop用户执行以下命令
$sudosu-hadoopssh生成密钥有rsa和dsa两种生成方式默认情况下采用rsa方式。
1.创建ssh-key 这里我们采用rsa方式;
4/9
精品文档
$ssh-keygen-trsa-P""
请注意 ssh-kengen是用连字符连着的千万不要分开。 问题如下
按照您的步行的程中我在ssh -keygen -t rsa -P ""生的小入之後端示Bad escape character "ygen"(红字部分就是问题所在他将ssh-keygen分开了。 )
(注 回车后会在~/. ssh/下生成两个文件 id_rsa和id_rsa.pub这两个文件是成对出现的)
.创建授权文件authorized_keys
进入~/. ssh/目录下发现开始是没有authorized_keys文件的可以使用以下两种方法
(1)将id_rsa.pub追加到authorized_keys授权文件中;
$cd~/. ssh
$catid_rsa.pub>>authorized_keys
(2)复制id_rsa.pub为authorized_keys
$cp~/. ssh/id_rsa.pub~/. ssh/authorized_keys
.登录localhost;
$sshlocalhost
.执行退出命令(exit或CTRL+D) ;
安装hadoop
5/9
精品文档
1.假设hadoop-0. 20. 2. tar.gz在桌面将它复制到安装目录/usr/local/下;
$sudocphadoop-0. 20.2.tar.gz/usr/local/
.解压hadoop-0.20.2. tar.gz;
$cd/usr/local
$sudotar-zxvfhadoop-0. 20.2. tar.gz
.将解压出的文件夹改名为hadoop;
$sudomvhadoop-0. 20.2hadoop
.将该hadoop文件夹的属主用户设为hadoop
$sudochown-Rhadoop:hadoophadoop
.打开hadoop/conf/hadoop-env. sh文件;
$sudogedithadoop/conf/hadoop-env. sh
.配置conf/hadoop-env. sh(找到#exportJAVA_HOME=. . . ,去掉#然后加上本机jdk的路径) ;exportJAVA_HOME=/usr/l ib/jvm/java1.8.0
.打开conf/core-site.xml文件;
$sudogedithadoop/conf/core-site.xmlf s.default.namehdfs://namenode:9000
.打开conf/mapred-site.xml文件;
$sudogedithadoop/conf/mapred-site.xmlmapred. job. tracker
6/9
精品文档namenode:9001
.打开conf/hdfs-site.xml文件;
注意 datalog1 datalog2 data1 data2文件夹最好事先建好。
10. 打开 conf/masters 文件 添加作为secondarynamenode的主机名.
11.打开conf/slaves文件添加作为slave的主机名一行一个。
作者设置如下
运行hadoop
1.进入hadoop目录下格式化hdfs文件系统初次运行hadoop时一定要有该操作
$cd/usr/local/hadoop/
$bin/hadoopnamenode-format
.启动bin/start-all. sh
进入bin 目录下 $ ./start-all. sh关闭 同目录下./stop-all. sh
.检测hadoop是否启动成功
$ jps
.Web查看
注意事项
7/9
精品文档
集群中所有机器的登录用户名和所属组都要相同本文用户名为hadoop组群也为Hadoop。
每台机器的IP设置为固定IP主机名-ip需要在每一台机器里修改对应的hosts文件。
注意代码中的粗斜体为具体安装目录要和实际目录相同。
衰莫大于心死愁莫大于无志。
8/9
精品文档
感 谢 阅 读
9/9
pacificrack在最新的7月促销里面增加了2个更加便宜的,一个月付1.5美元,一个年付12美元,带宽都是1Gbps。整个系列都是PR-M,也就是魔方的后台管理。2G内存起步的支持Windows 7、10、Server 2003\2008\2012\2016\2019以及常规版本的Linux!官方网站:https://pacificrack.com支持PayPal、支付宝等方式付款7月秒杀VP...
Virmach 商家算是比较久且一直在低价便宜VPS方案中玩的不亦乐乎的商家,有很多同时期的商家纷纷关闭转让,也有的转型到中高端用户。而前一段时间也有分享过一次Virmach商家推出所谓的一次性便宜VPS主机,比如很低的价格半年时间,时间到服务器也就关闭。这不今天又看到商家有提供这样的产品。这次的活动产品包括圣何塞和水牛城两个机房,为期六个月,一次性付费用完将会取消,就这么特别的产品,适合短期玩玩...
易探云怎么样?易探云是国内一家云计算服务商家,致力香港服务器、国内外服务器租用及托管等互联网业务,目前主要地区为运作香港BGP、香港CN2、广东、北京、深圳等地区。目前,易探云推出深圳或北京地区的适合挂机和建站的云服务器,国内挂机宝云服务器(可选深圳或北京地区),独立ip;2核2G5M挂机云服务器仅330元/年起!点击进入:易探云官方网站地址易探云国内挂机宝云服务器推荐:1、国内入门型挂机云服务器...