详解搭建ubuntu版hadoop集群

详解搭建Ubuntu版Hadoop集群

Hadoop是一个分布式计算框架,能够快速处理海量数据。本文将介绍如何在Ubuntu上搭建Hadoop集群。

环境准备

在开始搭建之前,我们需要准备以下环境:

  • 3台Ubuntu Server,分别作为Master和两个Slave
  • JDK 1.8
  • Hadoop 3.3.1

安装JDK

Hadoop运行需要JDK的支持。我们可以通过以下命令安装JDK 1.8:

sudo apt-get update
sudo apt-get install openjdk-8-jdk

安装Hadoop

  1. 下载Hadoop

我们到Hadoop官网下载Hadoop 3.3.1

wget https://archive.apache.org/dist/hadoop/common/hadoop-3.3.1/hadoop-3.3.1.tar.gz
  1. 解压Hadoop
tar -zxvf hadoop-3.3.1.tar.gz
  1. 配置Hadoop环境变量
sudo nano /etc/profile

在文件结尾处添加:

export HADOOP_HOME=/usr/local/hadoop
export PATH=$PATH:$HADOOP_HOME/bin
export PATH=$PATH:$HADOOP_HOME/sbin
  1. 配置Hadoop

进入Hadoop目录并编辑配置文件:

cd hadoop-3.3.1/etc/hadoop/
sudo nano hadoop-env.sh

找到以下行,将JAVA_HOME设置为已经安装的JDK路径:

#export JAVA_HOME=${JAVA_HOME}
export JAVA_HOME=/usr/lib/jvm/java-8-openjdk-amd64/

打开core-site.xml配置文件并添加以下内容:

<configuration>
<property>
<name>fs.default.name</name>
<value>hdfs://master:9000</value>
</property>
</configuration>

打开hdfs-site.xml并添加以下内容:

<configuration>
<property>
<name>dfs.replication</name>
<value>2</value>
</property>
<property>
<name>dfs.namenode.name.dir</name>
<value>/usr/local/hadoop/data/nameNode</value>
</property>
<property>
<name>dfs.datanode.data.dir</name>
<value>/usr/local/hadoop/data/dataNode</value>
</property>
<property>
<name>dfs.permissions.enabled</name>
<value>false</value>
</property>
</configuration>

打开mapred-site.xml并添加以下内容:

<configuration>
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
</configuration>

打开yarn-site.xml并添加以下内容:

<configuration>
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
<property>
<name>yarn.resourcemanager.hostname</name>
<value>master</value>
</property>
</configuration>
  1. 将Hadoop安装到Slave机器上

将Hadoop解压到Slave节点上,将master节点中的Hadoop配置文件拷贝到Slave节点上。

  1. 启动Hadoop

在Master节点上启动Hadoop:

start-all.sh

检查集群是否正常运行:

jps

如果输出以下信息,则表示Hadoop集群正常运行:

16209 NameNode
16354 ResourceManager
16420 SecondaryNameNode

示例1:上传文件至Hadoop集群

我们可以使用Hadoop自带的命令行工具hdfs将一个本地文件上传到Hadoop集群中。

  1. 在Master节点上创建输入文件夹:
hadoop fs -mkdir input
  1. 将本地文件上传到Hadoop集群:
hadoop fs -put /home/user/input/sample.txt input
  1. 查看上传的文件内容:
hadoop fs -cat input/sample.txt

输出以下内容,则表示上传成功:

Hello Hadoop!

示例2:运行Hadoop示例

Hadoop自带的wordcount示例可以帮助我们快速了解Hadoop集群的运作方式。

  1. 准备输入文件

在本地创建输入文件sample.txt,内容如下:

Hello Hadoop!
Hello MapReduce!
  1. 上传输入文件

与示例1相同,上传文件至Hadoop集群。

  1. 运行wordcount示例
hadoop jar /usr/local/hadoop/share/hadoop/mapreduce/hadoop-mapreduce-examples-3.3.1.jar wordcount input/ output/

示例会自动运行MapReduce任务并将输出文件保存至output文件夹。

  1. 查看输出文件
hadoop fs -cat output/part-r-00000

输出以下内容,则表示示例运行成功:

Hadoop!     1
Hello       2
MapReduce!  1

本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:详解搭建ubuntu版hadoop集群 - Python技术站

(0)
上一篇 2023年5月24日
下一篇 2023年5月24日

相关文章

  • Linux下使用pure-ftpd建立匿名ftp访问的方法

    下面我将为您详细讲解如何在Linux系统下使用pure-ftpd建立匿名ftp访问的方法。 准备工作 在安装pure-ftpd之前,需要先安装依赖包,可以使用以下命令进行安装: sudo apt-get update sudo apt-get install build-essential libssl-dev libpam0g-dev 安装pure-ftp…

    Linux 2023年5月14日
    00
  • 关于CentOs系统自带python和yum卸载后的解决办法

    关于CentOS系统自带的Python和yum卸载后的解决方案,可以采取如下步骤: 1. 查看系统是否安装了Python和yum 在命令行中运行以下指令可以检查系统是否安装了Python和yum: rpm -qa|grep python rpm -qa|grep yum 2. 卸载Python和yum 如果系统安装了Python和yum,可以使用以下命令卸载…

    Linux 2023年5月14日
    00
  • 如何在Linux系统上安装和配置文件同步工具?

    在Linux系统上安装和配置文件同步工具,我们可以使用rsync这个工具来实现。rsync是一个快速、可靠的文件同步工具,它可以在本地或网络之间同步、备份和复制文件以及目录。 以下是在Linux系统上安装和配置rsync的完整攻略: 步骤一:安装rsync 在多数Linux系统上,rsync已经预装了。但如果你的Linux系统没有预装rsync,那么请使用如…

    Linux 2023年4月19日
    00
  • Ubuntu配置软件镜像源

    ​    主机系统:Ubuntu 22.04.1 LTS _Jammy Jellyfish_ – Release amd64   Ubuntu如何配置软件镜像源?   在网速可以的情况下,有时我们在使用 apt-get update 指令时会发现更新软件列表的速度很慢,一般出现这个问题的原因是用来更新软件源的服务器距离太远。    在这里,我们就需要通过添加…

    Linux 2023年5月2日
    00
  • VmWare安装Centos后配置Net网络SSH链接问题及解决

    下面是“VmWare安装Centos后配置Net网络SSH链接问题及解决”的完整攻略: 1. 安装Centos 首先,我们需要在VmWare中安装Centos操作系统。在安装过程中,我们需要注意选择“Bridged”模式,这样可以让Centos虚拟机获得局域网内的IP地址。 2. 确认网络连接情况 安装完Centos后,我们需要确认网络连接情况。可以通过以下…

    Linux 2023年5月24日
    00
  • centos8安装图解(超详细教程)

    下面是“centos8安装图解(超详细教程)”的完整攻略,分为以下几个部分: 1. 下载CentOS 8 镜像文件 首先,在 CentOS 官网 下载 CentOS 8 的安装镜像文件,选择需要的版本和镜像文件格式。 2. 制作 CentOS 8 启动盘 将下载好的 CentOS 8 镜像文件写入到 U 盘中,制作启动盘。可以使用 rufus 等第三方制作工…

    Linux 2023年5月14日
    00
  • 在VMware+centOS 8上基于http协议搭建Git服务的方法

    下面是详细讲解在VMware+CentOS 8上基于http协议搭建Git服务的方法的完整攻略: 准备工作 首先需要确认VMware虚拟机已经安装好了CentOS 8操作系统,可以通过网卡配置好网络通讯。此外还需要确认已经安装了Git和httpd服务。 创建Git仓库 创建一个新的Git仓库: bash git init –bare /opt/git/de…

    Linux 2023年5月24日
    00
  • linux下使用命令修改IP地址

    使用root用户登录,打开终端 在终端中输入:vi /etc/sysconfig/network-scripts/ifcfg-eth0 (最后的eth0是网卡名,我的是Auto_eth0) 回车后, 开始编辑,填写ip地址、子网掩码、网关、DNS等。其中“红框内的信息”是必须得有的。 编辑完成后,保存退出 重启网络服务 service network res…

    Linux 2023年4月12日
    00
合作推广
合作推广
分享本页
返回顶部