Hadoop2.X/YARN环境搭建–CentOS7.0 JDK配置

Hadoop2.X/YARN环境搭建--CentOS7.0 JDK配置

环境准备

  • 系统:CentOS 7.0
  • JDK版本:Java 1.8

JDK配置

  1. 下载JDK:在官网下载JDK安装包,或者使用yum命令安装:

sudo yum install java-1.8.0-openjdk-devel

  1. 配置环境变量:在/etc/profile文件中添加以下内容:

shell
export JAVA_HOME=/usr/lib/jvm/java-1.8.0-openjdk
export CLASSPATH=.:$JAVA_HOME/jre/lib/rt.jar:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar
export PATH=$PATH:$JAVA_HOME/bin

  1. 使配置文件生效:

source /etc/profile

  1. 验证JDK是否配置成功:

java -version

如果能够输出正确的版本信息,则说明配置成功。

Hadoop2.X/YARN环境搭建

  1. 下载并解压缩Hadoop:在官网下载Hadoop压缩包,将其解压缩到合适的目录。

shell
wget http://mirror.bit.edu.cn/apache/hadoop/common/hadoop-2.10.1/hadoop-2.10.1.tar.gz
tar -zxvf hadoop-2.10.1.tar.gz -C /usr/local/

  1. 配置环境变量:在/etc/profile文件中添加以下内容:

shell
export HADOOP_HOME=/usr/local/hadoop-2.10.1
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

  1. 修改Hadoop配置文件:

  2. 修改$HADOOP_HOME/etc/hadoop/hadoop-env.sh文件:

    shell
    export JAVA_HOME=/usr/lib/jvm/java-1.8.0-openjdk

  3. 修改$HADOOP_HOME/etc/hadoop/core-site.xml文件:

    xml
    <configuration>
    <property>
    <name>fs.defaultFS</name>
    <value>hdfs://localhost:9000</value>
    </property>
    <property>
    <name>hadoop.tmp.dir</name>
    <value>/usr/local/hadoop-2.10.1/tmp</value>
    </property>
    </configuration>

  4. 修改$HADOOP_HOME/etc/hadoop/hdfs-site.xml文件:

    xml
    <configuration>
    <property>
    <name>dfs.replication</name>
    <value>1</value>
    </property>
    <property>
    <name>dfs.namenode.name.dir</name>
    <value>file:/usr/local/hadoop-2.10.1/dfs/name</value>
    </property>
    <property>
    <name>dfs.datanode.data.dir</name>
    <value>file:/usr/local/hadoop-2.10.1/dfs/data</value>
    </property>
    </configuration>

  5. 修改$HADOOP_HOME/etc/hadoop/mapred-site.xml文件:如果没有该文件,则需要自己创建。

    xml
    <configuration>
    <property>
    <name>mapreduce.framework.name</name>
    <value>yarn</value>
    </property>
    <property>
    <name>yarn.app.mapreduce.am.env</name>
    <value>HADOOP_MAPRED_HOME=/usr/local/hadoop-2.10.1</value>
    </property>
    </configuration>

  6. 修改$HADOOP_HOME/etc/hadoop/yarn-site.xml文件:

    xml
    <configuration>
    <property>
    <name>yarn.resourcemanager.hostname</name>
    <value>localhost</value>
    </property>
    <property>
    <name>yarn.nodemanager.aux-services</name>
    <value>mapreduce_shuffle</value>
    </property>
    <property>
    <name>yarn.nodemanager.aux-services.mapreduce_shuffle.class</name>
    <value>org.apache.hadoop.mapred.ShuffleHandler</value>
    </property>
    </configuration>

  7. 格式化HDFS:在命令行输入以下命令:

shell
hdfs namenode -format

  1. 启动Hadoop:在命令行输入以下命令:

shell
start-all.sh

  1. 验证Hadoop是否启动成功:在浏览器中输入http://localhost:8088/,可以看到YARN的信息页面。

示例说明:

示例1:上传文件到HDFS

假设现在要上传一个文件到HDFS上,可以使用以下命令:

hdfs dfs -put /本地文件路径 /HDFS文件路径

例如上传一个文件test.txt到HDFS的/data/input目录下:

hdfs dfs -put ~/test.txt /data/input

示例2:运行Hadoop自带的WordCount例子

Hadoop自带一个WordCount例子程序,可以用于统计文本中各单词出现的次数。

首先需要将例子程序拷贝到HDFS上:

hadoop jar $HADOOP_HOME/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.10.1.jar wordcount /data/input /data/output

上述命令的含义是运行Hadoop自带的WordCount程序,输入文件为HDFS上的/data/input目录,输出文件为HDFS上的/data/output目录。

然后查看输出结果:

hdfs dfs -cat /data/output/*

输出结果为每个单词以及其出现的次数。

本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:Hadoop2.X/YARN环境搭建–CentOS7.0 JDK配置 - Python技术站

(0)
上一篇 2023年6月27日
下一篇 2023年6月27日

相关文章

  • vue添加自定义右键菜单的完整实例

    首先我们需要了解一下什么是自定义右键菜单。在Vue项目中,浏览器默认的右键菜单可能不够符合我们的需求,此时我们可以自定义一个右键菜单,实现更加灵活的交互效果。下面就是一个完整的Vue自定义右键菜单实例: 步骤1:html模板中定义右键菜单组件 使用定义一个ContextMenu(右键菜单)组件: <template> <div v-show…

    other 2023年6月27日
    00
  • sql server获得新记录标识列值的二种方法

    SQL Server获得新记录标识列值的两种方法 在SQL Server中,标识列是一种特殊的列,用于自动生成唯一的数值标识符。当插入新记录时,我们经常需要获取这个新记录的标识列值。下面将介绍两种常用的方法来获得新记录标识列值。 方法一:使用SCOPE_IDENTITY函数 SCOPE_IDENTITY函数是SQL Server提供的一个内置函数,用于返回最…

    other 2023年7月29日
    00
  • js解码urlencode编码

    当我们在JavaScript中使用URL时,有时需要对URL进行编码和解码。URL编码是将URL中的特殊字符转换为十六进制编码的过程,而URL解码是将十六进制编码的字符转换回原始字符的过程。在JavaScript中,可以使用encodeURIComponent()和decodeURIComponent()函数来进行URL编码和解码。 URL编码 在JavaS…

    other 2023年5月7日
    00
  • 如何让32位Win7完美使用4G内存的方法介绍

    如何让32位Win7完美使用4G内存的方法介绍 由于32位的Windows 7操作系统默认只能使用3.2GB的内存,如果你想让它完美地使用4GB内存,你可以按照以下步骤进行设置。 步骤一:检查操作系统版本 首先,确保你的Windows 7是32位版本。你可以通过以下步骤来检查: 点击开始菜单,选择“计算机”。 右键点击“计算机”,选择“属性”。 在“系统”窗…

    other 2023年7月28日
    00
  • c中的fseek函数使用

    C中的fseek函数使用 在C语言中,访问文件是很常见的操作,而文件通常是一段连续的字节流。为了向前或向后读取文件的数据,我们就需要通过控制文件的指针来实现了。为了方便管理文件指针,C标准库提供了fseek函数,可以实现文件指针的定位和控制。 fseek函数的语法 fseek函数的语法如下: int fseek(FILE *stream, long int …

    其他 2023年3月29日
    00
  • jshidden属性

    当然,我可以为您提供详细的“jshidden属性”的完整攻略,包括两个示例说明。 jshidden属性 在HTML中,jshidden属性用于隐藏元素使其在页面上不可见。在本教程中,将介绍jshidden属性的用法和示例。 语法 jshidden属性语法如下: <div jshidden></div> 示例 以下是两个示例,说明如何在…

    other 2023年5月7日
    00
  • 浅谈angular4生命周期钩子

    浅谈 Angular 4 生命周期钩子 在 Angular 中,每个组件都有一个生命周期,即从组件创建到销毁的整个过程。在这个过程中,Angular 4 提供了一系列的生命周期钩子,可以帮助我们了解组件的状态以及做一些相应的操作。 生命周期钩子介绍 Angular 4 中常用的生命周期钩子有以下几个: ngOnChanges :在组件每次实例变化时被调用,主…

    other 2023年6月27日
    00
  • Qt创建项目实战之手把手创建第一个Qt项目

    创建Qt项目的步骤如下: 1. 打开Qt Creator 在Qt目录下,找到Qt Creator程序并打开。 2. 创建项目 在Qt Creator中,点击”File”->”New File or Project”,弹出”New Project”对话框。 3. 选择项目类型 在”New Project”对话框中,选择”Application”项目类型,…

    other 2023年6月27日
    00
合作推广
合作推广
分享本页
返回顶部