百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术教程 > 正文

Hadoop单节点集群环境搭建(hadoop启动单个节点)

mhr18 2024-09-23 09:47 23 浏览 0 评论

【虚拟工具】

Oracle VM VirtualBox 5.1.20

【虚拟机】

CentOS 6.6 x86 64bit

【目录说明】

1、预装软件存储目录(用于存放预装软件的下载文件):

/usr/local/SoftWare

2、系统环境目录(用于存储系统运行所搭载的环境设置):

/usr/local/Env

【服务器环境搭建步骤】

[安装JDK]

[下载地址]http://www.oracle.com/technetwork/java/javase/downloads/java-archive-downloads-javase7-521261.html

[JDK版本]1.7.0_79

[安装文件]jdk-7u79-linux-x64.tar.gz

[JDK安装步骤]

1、上传JDK安装文件(jdk-7u79-linux-x64.tar.gz)至/usr/local/SoftWare/文件夹

2、生成安装目录、解压文件:

cd /usr/local/Env

mkdir java

cd /usr/local

cp SoftWare/jdk-7u79-linux-x64.tar.gz Env/java/

cd /usr/local/Env/java

tar -zxvf jdk-7u79-linux-x64.tar.gz

3、设置环境变量:

vi /etc/profile

在文件末尾追加如下内容:

#JAVA SETTING START---------

export JAVA_HOME=/usr/local/Env/java/jdk1.7.0_79

export JRE_HOME=/usr/local/Env/java/jdk1.7.0_79/jre

export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar:$JRE_HOME/lib:$CLASSPATH

export PATH=$JAVA_HOME/bin:$PATH

#JAVA SETTING STOP----------

source /etc/profile:让设置生效

4、验证JDK安装成功与否:java -version

注:若出现如下之类的错误:Error: dl failure on line 863

请执行:/usr/sbin/setenforce 0

再次验证时,显示如下正常信息:

java version "1.7.0_79"

Java(TM) SE Runtime Environment (build 1.7.0_79-b15)

Java HotSpot(TM) Client VM (build 24.79-b02, mixed mode)

【ssh无密码登录】

3)SSH无密码登录:

进入root用户所在用户目录:

cd /root

创建通讯私钥:

ssh-keygen -t rsa(后续一顿回车)

cd .ssh/

cat id_rsa.pub >> authorized_keys

【HDFS系统搭建】

[安装Hadoop]

[Hadoop版本]hadoop-2.6.0

[安装文件]hadoop-2.6.0.tar.gz

http://hadoop.apache.org/releases.html

[Hadoop安装步骤]

1、上传Hadoop安装文件(hadoop-2.6.5.tar.gz )至/usr/local/SoftWare/文件夹

2、生成安装目录、解压文件:

mkdir /usr/local/Env/Hadoop

cp /usr/local/SoftWare/hadoop-2.6.5.tar.gz /usr/local/Env/Hadoop/

cd /usr/local/Env/Hadoop/

tar -zxvf hadoop-2.6.5.tar.gz

cd hadoop-2.6.5

3、设置环境变量:

vim /etc/profile

在文件尾追加如下语句:

#HADOOP SETTING START----------

export HADOOP_HOME=/usr/local/Env/Hadoop/hadoop-2.6.5

export PATH=$PATH:$HADOOP_HOME/bin

#HADOOP SETTING STOP-----------

完成添加后保存退出,并使之生效:source /etc/profile

4、生成Hadoop工作目录

mkdir /usr/local/Env/Hadoop/HDP_WorkShop

mkdir /usr/local/Env/Hadoop/HDP_WorkShop/tmp

mkdir /usr/local/Env/Hadoop/HDP_WorkShop/hdfs

mkdir /usr/local/Env/Hadoop/HDP_WorkShop/hdfs/data //创建datanode数据存储目录

mkdir /usr/local/Env/Hadoop/HDP_WorkShop/hdfs/name //创建namenode数据存储目录

将hadoop目录的所有者更改为hduser

chown hduser:hduser -R /usr/local/Env/Hadoop/hadoop-2.6.5

5、Hadoop设置:

cd /usr/local/Env/Hadoop/hadoop-2.6.5/etc/hadoop

1)hadoop-env.sh文件:

注释掉:export JAVA_HOME=${JAVA_HOME}

新添加:export JAVA_HOME=/usr/local/Env/java/jdk1.7.0_79

export HADOOP_SSH_OPTS="-p 16022" //此行操作适用于指定SSH的使用端口号,默认为22

2)yarn-env.sh文件:

注释掉:export JAVA_HOME=/home/y/libexec/jdk1.6.0/

新添加:export JAVA_HOME=/usr/local/Env/java/jdk1.7.0_79

3)core-site.xml文件:

在文件中的<configuration></configuration>标签中插入如下语句:

<configuration>

<property>

<name>fs.default.name</name>

<value>hdfs://localhost:9000</value>

<description>The URI and Port of HDFS</description>

</property>

//hadoop.tmp.dir 是 hadoop文件系统依赖的基本配置,很多配置路径都依赖它,它的默认位置在/tmp/{$user}下面。

<property>

<name>hadoop.tmp.dir</name>

<value>/usr/local/Env/Hadoop/HDP_WorkShop/tmp</value>

<description>The tmp folder of hadoop work shop</description>

</property>

</configuration>

6)yarn-site.xml文件:

在文件中的<configuration></configuration>标签中插入如下语句:

<configuration>

<property>

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

//默认是8088端口

<property>

<name>yarn.resourcemanager.webapp.address</name>

<value>${yarn.resourcemanager.hostname}:8099</value>

</property>

</configuration>

5)mapred-site.xml文件:

cp mapred-site.xml.template mapred-site.xml

在文件中的<configuration></configuration>标签中插入如下语句:

<configuration>

<property>

<name>mapreduce.framework.name</name>

<value>yarn</value>

</property>

</configuration>

4)hdfs-site.xml文件

在文件中的<configuration></configuration>标签中插入如下语句:

<configuration>

<!—hdfs-site.xml-->

<property>

<name>dfs.replication</name>

<value>1</value>

<description>The default copy number of hdfs(Should less than 10)</description>

</property>

<property>

<name>dfs.namenode.name.dir</name>

<value>/usr/local/Env/Hadoop/HDP_WorkShop/hdfs/name</value>

<description>The path of namenode</description>

</property>

<property>

<name>dfs.datanode.data.dir</name>

<value>/usr/local/Env/Hadoop/HDP_WorkShop/hdfs/data</value>

<description>The path of datanode</description>

</property>

</configuration>

6、启动hadoop:

1)启动前检测:

命令行输入jps后,若只有JPS本身信息显示,则说明未启动,可以进行下步操作。

2)格式化namenode:

初次启动,记得格式化namenode,即在命令行输入:

cd $HADOOP_HOME/bin

hadoop namenode –format

待完成后进入下一步操作。

4)启动HDFS:启动NameNode 和 DataNode 守护进程

cd $HADOOP_HOME/sbin/

./start-dfs.sh

5)启动YARN:启动ResourceManager 和 NodeManager 守护进程

cd $HADOOP_HOME/sbin/

./start-yarn.sh

6)同时启动HDFS、YARN:./start-all.sh

备注:

问题:namenode启动不起来

查看日志:

tail -100f hadoop-root-namenode-hadoop.log

解决方案:

问题1:hadoop “util.NativeCodeLoader: Unable to load native-hadoop library for your platform”

跟系统位数有关系,我使用的是Centos 6.5 64位操作系统。

我用的是hadoop2.6,所以下载下面这个:

http://dl.bintray.com/sequenceiq/sequenceiq-bin/hadoop-native-64-2.6.0.tar

下载完以后,解压到hadoop的native目录下,覆盖原有文件即可

tar xvf hadoop-native-64-2.6.0.tar -C /usr/local/hadoop/hadoop-2.6.0/lib/native/

问题2:jps发现有部分进程未启动成功,就是datanode启不来,

查看日志发现,是由于bogon这个访问地址没有配置,因此在/etc/hosts文件中加入如下语句:

127.0.0.1 bogon.localdomain bogon

再次启动,发现OK

启动成功的标示:(进程都在)

7116 SecondaryNameNode

6947 DataNode

7572 Jps

7372 NodeManager

6852 NameNode

7282 ResourceManager

HDFS:NameNode、SecondaryNameNode、DataNode

MapReduce2(YARN):ResourceManager、NodeManager

界面:

1、Hadoop Resource-Manager Web界面

查看当前Hadoop的状态:node节点、应用程序、进程运行状态

通过

http://192.168.85.6:8099/cluster/nodes

进行访问出现界面即可。

2、namenode HDFS Web界面

检查当前HDFS与DataNode的运行情况

通过

http://192.168.85.6:50070

进行界面访问。

相关推荐

甲骨文签署多项大型云协议,其一未来可贡献超300亿美元年收入

IT之家7月1日消息,根据甲骨文Oracle当地时间6月30日向美国证券交易委员会(SEC)递交的FORM8-K文件,该企业在始于2025年6月1日的202...

甲骨文获TEMU巨额合同,后者大部分基础设施将迁移至Oracle云

IT之家6月23日消息,Oracle甲骨文创始人、董事长兼首席技术官LarryEllison(拉里埃里森)在本月早些时候的2025财年第四财季和全财年财报电话会议上表示,Oracle...

Spring Boot 自定义数据源设置,这些坑你踩过吗?

你在使用SpringBoot进行后端开发的过程中,是不是也遇到过这样的问题:项目上线后,数据库连接总是不稳定,偶尔还会出现数据读取缓慢的情况,严重影响了用户体验。经过排查,发现很大一部分原因竟然...

一个开箱即用的代码生成器(一个开箱即用的代码生成器是什么)

今天给大家推荐一个好用的代码生成器,名为renren-generator,该项目附带前端页面,可以很方便的选择我们所需要生成代码的表。首先我们通过git工具克隆下来代码(地址见文末),导入idea。...

低代码建模平台-数据挖掘平台(低代码平台的实现方式)

现在来看一下数据连接。·这里是管理数据连接的空间,点击这里可以新增一个数据连接。·输入连接名称,然后输入url,是通过gdbc的方式去连接的数据库,目前是支持mysql、oracle以及国产数据库达梦...

navicat 17.2.7连接oracle数据库提示加载oracle库失败

系统:macOS15.5navicat版本:navicatpremiumlite17.2.7连接oracle测试报错:加载oracle库失败【解决办法】:放达里面找到程序,显示简介里面勾选“使...

开源“Windows”ReactOS更新:支持全屏应用

IT之家6月17日消息,ReactOS团队昨日(6月16日)在X平台发布系列推文,公布了该系统的最新进展,包括升级Explorer组件,支持全屏应用,从Wine项目引入了...

SSL 推出采用全模拟内置混音技术的模拟调音台Oracle

英国调音台传奇品牌SolidStateLogic宣布推出Oracle——一款采用全模拟内置混音技术的调音台,在紧凑的AWS尺寸机箱内集成了大型调音台的功能。该调音台提供24输入和...

47道网络工程师常见面试题,看看有没有你不会的!

你们好,我的网工朋友。网络工程师面试的时候,都会被问到什么?这个问题其实很泛,一般来说,你肯定要先看明白岗位需求写的是什么。基本上都是围绕公司需要的业务去问的。但不可否认的是,那些最基础的概念,多少也...

汉得信息:发布EBS系统安装启用JWS的高效解决方案

e公司讯,从汉得信息获悉,近日,微软官方宣布InternetExplorer桌面应用程序将于2022年6月15日正式停用。目前大部分客户都是使用IE浏览器打开EBS的Form界面,IE停用后,只能使...

36.9K star ! 推荐一个酷炫低代码开发平台!功能太强!

前言最近在逛github,看看能不能搜罗到一些对自己有帮助的开源软件。不经意间看到一个高star的java开源项目:jeecg-boot。进入在线演示版一看,感叹实在是太牛了!此开源项目不管是给来学习...

Linux新手入门系列:Linux下jdk安装配置

本系列文章是把作者刚接触和学习Linux时候的实操记录分享出来,内容主要包括Linux入门的一些理论概念知识、Web程序、mysql数据库的简单安装部署,希望能够帮到一些初学者,少走一些弯路。注意:L...

手把手教你在嵌入式设备中使用SQLite3

摘要:数据库是用来存储和管理数据的专用软件,使得管理数据更加安全,方便和高效。数据库对数据的管理的基本单位是表(table),在嵌入式linux中有时候它也需要用到数据库,听起来好难,其实就是几个函数...

JAVA语言基础(java语言基础知识)

一、计算机的基本概念什么是计算机?计算机(Computer)全称:电子计算机,俗称电脑。是一种能够按照程序运行、自动高速处理海量数据的现代化智能电子设备。由硬件和软件组成、没有安装过任何软件的计算机称...

再见 Navicat!一款开源的 Web 数据库管理工具!

大家好,我是Java陈序员。在日常的开发工作中,常常需要与各种数据库打交道。而为了提高工作效率,常常会使用一些可视化工具进行操作数据库。今天,给大家介绍一款开源的数据库管理工具,无需下载安装软件,基...

取消回复欢迎 发表评论: