Hadoop2.X/YARN环境搭建–CentOS7.0 JDK配置

Hadoop2.X/YARN环境搭建--CentOS7.0 JDK配置

环境准备

  • 系统:CentOS 7.0
  • JDK版本:Java 1.8

JDK配置

  1. 下载JDK:在官网下载JDK安装包,或者使用yum命令安装:

sudo yum install java-1.8.0-openjdk-devel

  1. 配置环境变量:在/etc/profile文件中添加以下内容:

shell
export JAVA_HOME=/usr/lib/jvm/java-1.8.0-openjdk
export CLASSPATH=.:$JAVA_HOME/jre/lib/rt.jar:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar
export PATH=$PATH:$JAVA_HOME/bin

  1. 使配置文件生效:

source /etc/profile

  1. 验证JDK是否配置成功:

java -version

如果能够输出正确的版本信息,则说明配置成功。

Hadoop2.X/YARN环境搭建

  1. 下载并解压缩Hadoop:在官网下载Hadoop压缩包,将其解压缩到合适的目录。

shell
wget http://mirror.bit.edu.cn/apache/hadoop/common/hadoop-2.10.1/hadoop-2.10.1.tar.gz
tar -zxvf hadoop-2.10.1.tar.gz -C /usr/local/

  1. 配置环境变量:在/etc/profile文件中添加以下内容:

shell
export HADOOP_HOME=/usr/local/hadoop-2.10.1
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

  1. 修改Hadoop配置文件:

  2. 修改$HADOOP_HOME/etc/hadoop/hadoop-env.sh文件:

    shell
    export JAVA_HOME=/usr/lib/jvm/java-1.8.0-openjdk

  3. 修改$HADOOP_HOME/etc/hadoop/core-site.xml文件:

    xml
    <configuration>
    <property>
    <name>fs.defaultFS</name>
    <value>hdfs://localhost:9000</value>
    </property>
    <property>
    <name>hadoop.tmp.dir</name>
    <value>/usr/local/hadoop-2.10.1/tmp</value>
    </property>
    </configuration>

  4. 修改$HADOOP_HOME/etc/hadoop/hdfs-site.xml文件:

    xml
    <configuration>
    <property>
    <name>dfs.replication</name>
    <value>1</value>
    </property>
    <property>
    <name>dfs.namenode.name.dir</name>
    <value>file:/usr/local/hadoop-2.10.1/dfs/name</value>
    </property>
    <property>
    <name>dfs.datanode.data.dir</name>
    <value>file:/usr/local/hadoop-2.10.1/dfs/data</value>
    </property>
    </configuration>

  5. 修改$HADOOP_HOME/etc/hadoop/mapred-site.xml文件:如果没有该文件,则需要自己创建。

    xml
    <configuration>
    <property>
    <name>mapreduce.framework.name</name>
    <value>yarn</value>
    </property>
    <property>
    <name>yarn.app.mapreduce.am.env</name>
    <value>HADOOP_MAPRED_HOME=/usr/local/hadoop-2.10.1</value>
    </property>
    </configuration>

  6. 修改$HADOOP_HOME/etc/hadoop/yarn-site.xml文件:

    xml
    <configuration>
    <property>
    <name>yarn.resourcemanager.hostname</name>
    <value>localhost</value>
    </property>
    <property>
    <name>yarn.nodemanager.aux-services</name>
    <value>mapreduce_shuffle</value>
    </property>
    <property>
    <name>yarn.nodemanager.aux-services.mapreduce_shuffle.class</name>
    <value>org.apache.hadoop.mapred.ShuffleHandler</value>
    </property>
    </configuration>

  7. 格式化HDFS:在命令行输入以下命令:

shell
hdfs namenode -format

  1. 启动Hadoop:在命令行输入以下命令:

shell
start-all.sh

  1. 验证Hadoop是否启动成功:在浏览器中输入http://localhost:8088/,可以看到YARN的信息页面。

示例说明:

示例1:上传文件到HDFS

假设现在要上传一个文件到HDFS上,可以使用以下命令:

hdfs dfs -put /本地文件路径 /HDFS文件路径

例如上传一个文件test.txt到HDFS的/data/input目录下:

hdfs dfs -put ~/test.txt /data/input

示例2:运行Hadoop自带的WordCount例子

Hadoop自带一个WordCount例子程序,可以用于统计文本中各单词出现的次数。

首先需要将例子程序拷贝到HDFS上:

hadoop jar $HADOOP_HOME/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.10.1.jar wordcount /data/input /data/output

上述命令的含义是运行Hadoop自带的WordCount程序,输入文件为HDFS上的/data/input目录,输出文件为HDFS上的/data/output目录。

然后查看输出结果:

hdfs dfs -cat /data/output/*

输出结果为每个单词以及其出现的次数。

本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:Hadoop2.X/YARN环境搭建–CentOS7.0 JDK配置 - Python技术站

(0)
上一篇 2023年6月27日
下一篇 2023年6月27日

相关文章

  • 使用MockMvc进行controller层单元测试 事务自动回滚的完整案例

    以下是关于使用MockMvc进行controller层单元测试的完整攻略,包含两个示例说明: 1. 添加依赖 首先,您需要在项目的pom.xml文件中添加MockMvc和JUnit的依赖。示例: <dependencies> <!– 添加MockMvc依赖 –> <dependency> <groupId>…

    other 2023年10月19日
    00
  • Rcpp和RcppArmadillo创建R语言包的实现方式

    创建R语言包是一项将R语言代码打包,以供其他用户使用的过程。Rcpp和RcppArmadillo是近年来在R语言社区中非常流行的工具,使得R语言程序员可以用C++编写快速高效的代码,并且与R语言进行无缝的交互。本攻略将为你提供使用Rcpp和RcppArmadillo创建R语言包的完整步骤。 步骤一:创建Rcpp项目 首先,我们需要在自己的电脑上安装Rcpp和…

    other 2023年6月26日
    00
  • CentOS下重启Mysql的各种方法(推荐)

    CentOS下重启Mysql的各种方法(推荐) 在CentOS中,经常需要重启Mysql服务,本攻略将针对这种情况给出以下重启Mysql的各种方式和方法。 方法一:使用service命令重启Mysql服务 service mysqld restart 该命令将会重启Mysql服务,该方法适用于CentOS 6及之前的版本,但CentOS 7不再推荐使用ser…

    other 2023年6月27日
    00
  • 分布式Netty源码分析概览

    《分布式Netty源码分析概览》是一篇介绍分布式技术如何应用于Netty的文章。该文重点介绍了Netty中的分布式架构、设计原则、核心组件及其使用方法。 分布式架构 文章首先介绍了分布式架构的基本概念和常见特点,包括数据分布、容错性、负载均衡等,随后分析了Netty中分布式应用的基本结构,包括Netty Server、Netty Client和Netty P…

    other 2023年6月27日
    00
  • 设置高级NTFS权限的工具 XCACLS.vbs

    关于“设置高级NTFS权限的工具 XCACLS.vbs”的完整攻略,我们来分步骤说明: 1. 下载XCACLS.vbs工具 1.1 打开官方网站“Mark Russinovich’s Technical Blog”:https://docs.microsoft.com/en-us/sysinternals/downloads/xcacls。 1.2 点击“D…

    other 2023年6月27日
    00
  • yum和apt-get的区别详解

    yum和apt-get的区别详解 介绍 yum和apt-get都是常见的包管理工具,用于在Linux系统中安装、更新和卸载软件包。它们在不同的Linux发行版中使用,并具有一些区别。 yum yum是CentOS、Fedora和RHEL等Red Hat系列发行版中的包管理工具。它使用RPM包管理系统,可以从软件仓库中下载和安装软件包。 示例:使用yum安装n…

    other 2023年10月14日
    00
  • 给交换机设置管理性IP地址和网关地址

    给交换机设置管理性IP地址和网关地址的步骤如下: 首先,通过串行控制台或SSH等方式登录到交换机的命令行界面。 进入全局配置模式,输入以下命令: enable configure terminal 设置交换机的管理性IP地址,输入以下命令: interface vlan 1 ip address <IP地址> <子网掩码> 例如,如果…

    other 2023年7月30日
    00
  • iso文件的意思以及ISO文件打开方法

    ISO文件是一种光盘映像文件,它包含了光盘的完整内容,包括文件系统、文件和目录结构等。ISO文件通常用于光盘的备份、复制和分发。在打开ISO文件之前,你需要了解ISO文件的打开方法。 以下是打开ISO文件的两种常见方法的示例说明: 方法一:使用虚拟光驱软件 下载并安装虚拟光驱软件,例如Daemon Tools、Virtual CloneDrive等。 双击运…

    other 2023年8月6日
    00
合作推广
合作推广
分享本页
返回顶部