Hadoop2.X/YARN环境搭建–CentOS7.0 JDK配置

yizhihongxing

Hadoop2.X/YARN环境搭建--CentOS7.0 JDK配置

环境准备

  • 系统:CentOS 7.0
  • JDK版本:Java 1.8

JDK配置

  1. 下载JDK:在官网下载JDK安装包,或者使用yum命令安装:

sudo yum install java-1.8.0-openjdk-devel

  1. 配置环境变量:在/etc/profile文件中添加以下内容:

shell
export JAVA_HOME=/usr/lib/jvm/java-1.8.0-openjdk
export CLASSPATH=.:$JAVA_HOME/jre/lib/rt.jar:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar
export PATH=$PATH:$JAVA_HOME/bin

  1. 使配置文件生效:

source /etc/profile

  1. 验证JDK是否配置成功:

java -version

如果能够输出正确的版本信息,则说明配置成功。

Hadoop2.X/YARN环境搭建

  1. 下载并解压缩Hadoop:在官网下载Hadoop压缩包,将其解压缩到合适的目录。

shell
wget http://mirror.bit.edu.cn/apache/hadoop/common/hadoop-2.10.1/hadoop-2.10.1.tar.gz
tar -zxvf hadoop-2.10.1.tar.gz -C /usr/local/

  1. 配置环境变量:在/etc/profile文件中添加以下内容:

shell
export HADOOP_HOME=/usr/local/hadoop-2.10.1
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

  1. 修改Hadoop配置文件:

  2. 修改$HADOOP_HOME/etc/hadoop/hadoop-env.sh文件:

    shell
    export JAVA_HOME=/usr/lib/jvm/java-1.8.0-openjdk

  3. 修改$HADOOP_HOME/etc/hadoop/core-site.xml文件:

    xml
    <configuration>
    <property>
    <name>fs.defaultFS</name>
    <value>hdfs://localhost:9000</value>
    </property>
    <property>
    <name>hadoop.tmp.dir</name>
    <value>/usr/local/hadoop-2.10.1/tmp</value>
    </property>
    </configuration>

  4. 修改$HADOOP_HOME/etc/hadoop/hdfs-site.xml文件:

    xml
    <configuration>
    <property>
    <name>dfs.replication</name>
    <value>1</value>
    </property>
    <property>
    <name>dfs.namenode.name.dir</name>
    <value>file:/usr/local/hadoop-2.10.1/dfs/name</value>
    </property>
    <property>
    <name>dfs.datanode.data.dir</name>
    <value>file:/usr/local/hadoop-2.10.1/dfs/data</value>
    </property>
    </configuration>

  5. 修改$HADOOP_HOME/etc/hadoop/mapred-site.xml文件:如果没有该文件,则需要自己创建。

    xml
    <configuration>
    <property>
    <name>mapreduce.framework.name</name>
    <value>yarn</value>
    </property>
    <property>
    <name>yarn.app.mapreduce.am.env</name>
    <value>HADOOP_MAPRED_HOME=/usr/local/hadoop-2.10.1</value>
    </property>
    </configuration>

  6. 修改$HADOOP_HOME/etc/hadoop/yarn-site.xml文件:

    xml
    <configuration>
    <property>
    <name>yarn.resourcemanager.hostname</name>
    <value>localhost</value>
    </property>
    <property>
    <name>yarn.nodemanager.aux-services</name>
    <value>mapreduce_shuffle</value>
    </property>
    <property>
    <name>yarn.nodemanager.aux-services.mapreduce_shuffle.class</name>
    <value>org.apache.hadoop.mapred.ShuffleHandler</value>
    </property>
    </configuration>

  7. 格式化HDFS:在命令行输入以下命令:

shell
hdfs namenode -format

  1. 启动Hadoop:在命令行输入以下命令:

shell
start-all.sh

  1. 验证Hadoop是否启动成功:在浏览器中输入http://localhost:8088/,可以看到YARN的信息页面。

示例说明:

示例1:上传文件到HDFS

假设现在要上传一个文件到HDFS上,可以使用以下命令:

hdfs dfs -put /本地文件路径 /HDFS文件路径

例如上传一个文件test.txt到HDFS的/data/input目录下:

hdfs dfs -put ~/test.txt /data/input

示例2:运行Hadoop自带的WordCount例子

Hadoop自带一个WordCount例子程序,可以用于统计文本中各单词出现的次数。

首先需要将例子程序拷贝到HDFS上:

hadoop jar $HADOOP_HOME/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.10.1.jar wordcount /data/input /data/output

上述命令的含义是运行Hadoop自带的WordCount程序,输入文件为HDFS上的/data/input目录,输出文件为HDFS上的/data/output目录。

然后查看输出结果:

hdfs dfs -cat /data/output/*

输出结果为每个单词以及其出现的次数。

本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:Hadoop2.X/YARN环境搭建–CentOS7.0 JDK配置 - Python技术站

(0)
上一篇 2023年6月27日
下一篇 2023年6月27日

相关文章

  • iOS 14.2修订版更新 固件内部版本号为18B111

    iOS 14.2修订版更新攻略 1. 简介 iOS 14.2修订版是苹果公司发布的最新操作系统版本,固件内部版本号为18B111。该版本修复了一些问题并引入了一些新功能和改进。本攻略将详细介绍如何更新到iOS 14.2修订版。 2. 更新前准备 在开始更新之前,请确保完成以下准备工作: 备份数据:在更新之前,建议您备份所有重要的数据,以防更新过程中出现意外情…

    other 2023年8月3日
    00
  • vant中的toast层级改变操作

    Vant中的Toast层级改变操作攻略 简介 Toast(提示框)是Vant中常用的组件之一,可以用来显示短暂的提示信息。在某些情况下,我们可能需要调整Toast的层级,以确保它在其他浮动元素之上或之下显示。本攻略将详细介绍在Vant中如何改变Toast的层级。 步骤 步骤一:导入Toast组件 首先,确保在代码中正确导入Toast组件,可以使用如下代码进行…

    other 2023年6月28日
    00
  • Springboot 使用maven release插件执行版本管理及打包操作

    Spring Boot使用Maven Release插件执行版本管理及打包操作攻略 Maven Release插件是一个用于管理项目版本和执行发布操作的工具。它可以帮助我们自动化版本号的管理、打包和发布过程,提高开发效率。下面是使用Maven Release插件进行版本管理和打包操作的详细攻略。 步骤一:配置Maven Release插件 在项目的pom.x…

    other 2023年8月3日
    00
  • Win7安装和配置Apache2.4服务器的详细方法

    以下是详细讲解“Win7安装和配置Apache2.4服务器的详细方法”的攻略: 准备工作 在开始安装和配置Apache2.4服务器之前,需要先进行一些准备工作。 下载Apache2.4的安装程序(apachehaus)。 下载VC运行库(Visual C++ Redistributable for Visual Studio 2015)。 关闭防火墙和杀毒软…

    other 2023年6月27日
    00
  • node.js 使用ejs模板引擎时后缀换成.html

    Node.js使用EJS模板引擎时后缀换成.html的攻略 EJS(Embedded JavaScript)是一种流行的JavaScript模板引擎,它允许在服务器端生成动态的HTML页面。默认情况下,EJS模板文件的后缀是.ejs,但是有时候我们可能需要将后缀更改为.html,以便与其他文件类型保持一致。下面是详细的攻略,教你如何在Node.js中使用EJ…

    other 2023年8月5日
    00
  • android侧边栏(使用supportlibrary4提供的扩展组件)

    以下是关于使用supportlibrary4提供的扩展组件实现Android侧边栏的完整攻略,包括基本介绍、实现步骤、示例说明等内容。 1. 基本介绍 Android侧边栏是一种常见的UI设计模式,可以让用户快速访问应用程序的不同部分。使用supportlibrary4提供的扩展组件,我们可以轻松地实现Android侧边栏。在使用侧边栏时,我们需要注意布局和…

    other 2023年5月10日
    00
  • visual studio2015中怎么自定义创建vb控件?

    自定义创建VB控件需要经历以下步骤: 步骤1. 创建控件项目 在Visual Studio 2015中创建控件项目,可以选择VB类库或VB用户控件。这里我们以VB用户控件为例。 在Visual Studio 2015中选择“新建项目”。 选择“Visual Basic” > “Windows桌面” > “Windows窗体控件库” 在“新建窗体控…

    other 2023年6月27日
    00
  • 史上最牛X秘笈 只需3秒搞定TBI格式批量转换为JPG图片

    史上最牛X秘笈 只需3秒搞定TBI格式批量转换为JPG图片攻略 简介 本攻略将详细介绍如何使用史上最牛X秘笈,只需3秒搞定TBI格式批量转换为JPG图片。该秘笈可以帮助用户快速、高效地将TBI格式的图片批量转换为JPG格式,节省时间和精力。 步骤 步骤一:准备工作 在开始之前,确保你已经安装了以下软件和工具:- 史上最牛X秘笈软件(版本号)- TBI格式图片…

    other 2023年8月6日
    00
合作推广
合作推广
分享本页
返回顶部