百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术教程 > 正文

Hadoop3.1.0完全分布式集群部署(hadoop完全分布式环境部署)

mhr18 2024-10-18 06:48 25 浏览 0 评论

Hadoop3.1.0完全分布式集群部署,三台服务器部署结构如下github配置文件源码地址

#部署完成后

root@servera:/opt/hadoop/hadoop-3.1.0# jps

14056 SecondaryNameNode

14633 Jps

13706 NameNode

14317 ResourceManager

root@serverb:~# jps

5288 NodeManager

5162 DataNode

5421 Jps

root@serverc:~# jps

4545 NodeManager

4371 DataNode

4678 Jps

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

如上图,一共三台机器作为集群,servera作为master,其他两台作为worker。

2.开始部署-前期准备(三台机器都需要进行如下操作)

2.1.配置hosts文件【三台】

vim /etc/hosts

1

10.80.80.110 servera

10.80.80.111 serverb

10.80.80.112 serverc

1

2

3

2.2.jdk 安装【三台】

下载jdk

wget --no-check-certificate --no-cookies --header "Cookie: oraclelicense=accept-securebackup-cookie" http://download.oracle.com/otn-pub/java/jdk/8u172-b11/a58eab1ec242421181065cdc37240b08/jdk-8u172-linux-x64.tar.gz

1

解压

mkdir /opt/java

wget --no-check-certificate --no-cookies --header "Cookie: oraclelicense=accept-securebackup-cookie" http://download.oracle.com/otn-pub/java/jdk/8u172-b11/a58eab1ec242421181065cdc37240b08/jdk-8u172-linux-x64.tar.gz

tar -zxf jdk-8u172-linux-x64.tar.gz

mv jdk1.8.0_172/ /opt/java/

1

2

3

4

5

6

7

8

配置JAVA变量

vim /etc/profile.d/jdk-1.8.sh

1

#!/bin/sh

# Author:wangxiaolei 王小雷

# Blog: http://blog.csdn.net/dream_an

# Github: https://github.com/wangxiaoleiai

# web: www.xiaolei.wang

# Date: 2018.05

# Path: /etc/profile.d/

export JAVA_HOME=/opt/java/jdk1.8.0_172

export JRE_HOME=${JAVA_HOME}/jre

export CLASSPATH=.:${JAVA_HOME}/lib:${JRE_HOME}/lib

export PATH=${JAVA_HOME}/bin:$PATH

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

# 使环境变量生效

source /etc/profile

# 查看 Java

java --version

1

2

3

4

5

6

7

8

2.3.pdsh、ssh安装【三台】

root@servera:~# apt install ssh pdsh

1

echo ssh>/etc/pdsh/rcmd_default

1

2.4.免密码登录自身【三台】

$ ssh-keygen -t rsa -P '' -f ~/.ssh/id_rsa

$ cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys

$ chmod 0600 ~/.ssh/authorized_keys

ssh localhost(首次需输入yes)

1

2

3

4

2.5.servera免密码登录其他机器(master免密码登录worker)【单台,只需在servera上执行】

ssh-copy-id -i ~/.ssh/id_rsa.pub servera

ssh-copy-id -i ~/.ssh/id_rsa.pub serverb

ssh-copy-id -i ~/.ssh/id_rsa.pub serverc

1

2

3

3.hadoop3+配置文件 github配置文件源码地址

共需要配置/opt/hadoop/hadoop-3.1.0/etc/hadoop/下的六个个文件,分别是

hadoop-env.sh、core-site.xml、hdfs-site.xml、yarn-site.xml、mapred-site.xml、workers

3.1. hadoop-env.sh 添加如下内容

export JAVA_HOME=/opt/java/jdk1.8.0_172/

export HDFS_NAMENODE_USER="root"

export HDFS_DATANODE_USER="root"

export HDFS_SECONDARYNAMENODE_USER="root"

export YARN_RESOURCEMANAGER_USER="root"

export YARN_NODEMANAGER_USER="root"

1

2

3

4

5

6

7

3.2. core-site.xml

<configuration>

<!-- 指定hdfs的nameservice为ns1 -->

<property>

<name>fs.defaultFS</name>

<value>hdfs://ruizhia:9000</value>

</property>

<property>

<name>io.file.buffer.size</name>

<value>131072</value>

</property>

</configuration>

1

2

3

4

5

6

7

8

9

10

11

12

13

14

3.3. hdfs-site.xml

<configuration>

<!-- Configurations for NameNode: -->

<property>

<name>dfs.namenode.name.dir</name>

<value>/var/lib/hadoop/hdfs/name/</value>

</property>

<property>

<name>dfs.blocksize</name>

<value>268435456</value>

</property>

<property>

<name>dfs.namenode.handler.count </name>

<value>100</value>

</property>

<!-- Configurations for DataNode: -->

<property>

<name>dfs.datanode.data.dir</name>

<value>/var/lib/hadoop/hdfs/data/</value>

</property>

<property>

<name>dfs.replication</name>

<value>1</value>

</property>

</configuration>

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

3.4. yarn-site.xml

<configuration>

<!-- Site specific YARN configuration properties -->

<!-- Configurations for ResourceManager and NodeManager: -->

<!-- Configurations for ResourceManager: -->

<property>

<name>yarn.resourcemanager.hostname</name>

<value>servera</value>

</property>

<!-- 配置外网只需要替换外网ip为真实ip,否则默认为 localhost:8088 -->

<!-- <property>

<name>yarn.resourcemanager.webapp.address</name>

<value>外网ip:8088</value>

</property> -->

<!-- Configurations for NodeManager: -->

<property>

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

<!-- Configurations for History Server (Needs to be moved elsewhere): -->

</configuration>

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

3.5. mapred-site.xml

<configuration>

<!-- Configurations for MapReduce Applications: -->

<property>

<name>mapreduce.framework.name</name>

<value>yarn</value>

</property>

</configuration>

1

2

3

4

5

6

7

3.6. workers

serverb

serverc

1

2

4. 复制Hadoop文件到其他集群、配置Hadoop环境变量、格式化hdfs、开启集群、查看、关闭、重置集群

4.1. 将步骤3配置好的hadoop文件复制到其他同样位置的机器上

/opt/hadoop/hadoop-3.1.0

4.2 配置Hadoop环境变量【三台机器都操作】

vim /etc/profile.d/hadoop-3.1.0.sh

1

#!/bin/sh

# Author:wangxiaolei 王小雷

# Blog: http://blog.csdn.net/dream_an

# Github: https://github.com/wangxiaoleiai

# Date: 201805

# web: www.xiaolei.wang

# Path: /etc/profile.d/

export HADOOP_HOME="/opt/hadoop/hadoop-3.1.0"

export PATH="$HADOOP_HOME/bin:$PATH"

export HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop

export YARN_CONF_DIR=$HADOOP_HOME/etc/hadoop

1

2

3

4

5

6

7

8

9

10

11

12

source /etc/profile

1

4.3. 格式化HDFS [只有首次部署才可使用]【谨慎操作,只在servera上操作】

/opt/hadoop/hadoop-3.1.0/bin/hdfs namenode -format myClusterName

1

4.4. 开启 【只在servera上操作】

/opt/hadoop/hadoop-3.1.0/sbin/start-dfs.sh

/opt/hadoop/hadoop-3.1.0/sbin/start-yarn.sh

1

2

4.5. 查看 【三台】

jps

1

4.6. web端localhost:8088查看【localhost只定servera的localhost,也可以换成外网ip,在详见步骤3.4. yarn-site.xml 】

4.7. 关闭 【只在servera上操作】

/opt/hadoop/hadoop-3.1.0/sbin/stop-dfs.sh

/opt/hadoop/hadoop-3.1.0/sbin/stop-yarn.sh

1

2

4.8. 重置hadoop环境 [移除hadoop hdfs log文件] 【谨慎操作,只在servera上操作】

rm -rf /opt/hadoop/hadoop-3.1.0/logs/*

rm -rf /var/lib/hadoop/

1

2

5.遇到的坑 pdsh@servera: servera: connect: Connection refused

root@servera:/opt/hadoop/hadoop-3.1.0# sbin/start-dfs.sh

Starting namenodes on [servera]

pdsh@servera: servera: connect: Connection refused

Starting datanodes

pdsh@servera: serverc: connect: Connection refused

pdsh@servera: serverb: connect: Connection refused

Starting secondary namenodes [servera]

pdsh@servera: servera: connect: Connection refused

解决方法步骤2.3中

echo ssh>/etc/pdsh/rcmd_default

1

6.Hadoop集群部署相关文档参考

Hadoop Cluster Setup

超详细从零记录Hadoop2.7.3完全分布式集群部署过程

---------------------

作者:王小雷-多面手

来源:CSDN

原文:https://blog.csdn.net/dream_an/article/details/80258283

版权声明:本文为博主原创文章,转载请附上博文链接!

相关推荐

【预警通报】关于WebLogic存在远程代码执行高危漏洞的预警通报

近日,Oracle官方发布了2021年1月关键补丁更新公告CPU(CriticalPatchUpdate),共修复了包括CVE-2021-2109(WeblogicServer远程代码执行漏洞)...

医院信息系统突发应急演练记录(医院信息化应急演练)

信息系统突发事件应急预案演练记录演练内容信息系统突发事件应急预案演练参与人员信息科参与科室:全院各部门日期xxxx-xx-xx时间20:00至24:00地点信息科记录:xxx1、...

一文掌握怎么利用Shell+Python实现完美版的多数据源备份程序

简介:在当今数字化时代,无论是企业还是个人,数据的安全性和业务的连续性都是至关重要的。数据一旦丢失,可能会造成无法估量的损失。因此,如何有效地对分布在不同位置的数据进行备份,尤其是异地备份,成为了一个...

docker搭建系统环境(docker搭建centos)

Docker安装(CentOS7)1.卸载旧版Docker#检查已安装版本yumlistinstalled|grepdocker#卸载旧版本yumremove-ydocker.x...

基础篇:数据库 SQL 入门教程(sql数据库入门书籍推荐)

SQL介绍什么是SQLSQL指结构化查询语言,是用于访问和处理数据库的标准的计算机语言。它使我们有能力访问数据库,可与多种数据库程序协同工作,如MSAccess、DB2、Informix、M...

Java21杀手级新特性!3行代码性能翻倍

导语某券商系统用这招,交易延迟从12ms降到0.8ms!本文揭秘Oracle官方未公开的Record模式匹配+虚拟线程深度优化+向量API神操作,代码量直降70%!一、Record模式匹配(代码量↓8...

一文读懂JDK21的虚拟线程(java虚拟线程)

概述JDK21已于2023年9月19日发布,作为Oracle标准Java实现的一个LTS版本发布,发布了15想新特性,其中虚拟线程呼声较高。虚拟线程是JDK21中引入的一项重要特性,它是一种轻量级的...

效率!MacOS下超级好用的Linux虚拟工具:Lima

对于MacOS用户来说,搭建Linux虚拟环境一直是件让人头疼的事。无论是VirtualBox还是商业的VMware,都显得过于笨重且配置复杂。今天,我们要介绍一个轻巧方便的纯命令行Linux虚拟工具...

所谓SaaS(所谓三维目标一般都应包括)

2010年前后,一个科技媒体的主编写一些关于云计算的概念性问题,就可以作为头版头条了。那时候的云计算,更多的还停留在一些概念性的问题上。而基于云计算而生的SaaS更是“养在深闺人未识”,一度成为被IT...

ORA-00600 「25027」 「x」报错(报错0xc0000001)

问题现象:在用到LOB大对象的业务中,进行数据的插入,失败了,在报警文件中报错:ORA-00600:内部错误代码,参数:[25027],[10],[0],[],[],[],[],[...

安卓7源码编译(安卓源码编译环境lunch失败,uname命令找不到)

前面已经下载好源码了,接下来是下载手机对应的二进制驱动执行编译源码命令下载厂商驱动https://developers.google.com/android/drivers?hl=zh-cn搜索NGI...

编译安卓源码(编译安卓源码 电脑配置)

前面已经下载好源码了,接下来是下载手机对应的二进制驱动执行编译源码命令下载厂商驱动https://developers.google.com/android/drivers?hl=zh-cn搜索NGI...

360 Vulcan Team首战告捷 以17.5万美金强势领跑2019“天府杯“

2019年11月16日,由360集团、百度、腾讯、阿里巴巴、清华大学与中科院等多家企业和研究机构在成都联合主办了2019“天府杯”国际网络安全大赛暨2019天府国际网络安全高峰论坛。而开幕当日最激荡人...

Syslog 日志分析与异常检测技巧(syslog发送日志配置)

系统日志包含有助于分析网络设备整体运行状况的重要信息。然而,理解并从中提取有效数据往往颇具挑战。本文将详解从基础命令行工具到专业日志管理软件的全流程分析技巧,助你高效挖掘Syslog日志价值。Gr...

从Oracle演进看数据库技术的发展(从oracle演进看数据库技术的发展的过程)

数据库技术发展本质上是应用需求驱动与基础架构演进的双向奔赴,如何分析其技术发展的脉络和方向?考虑到oracle数据库仍然是这个领域的王者,以其为例,管中窥豹,对其从Oracle8i到23ai版本的核...

取消回复欢迎 发表评论: