云计算分布式大数据Hadoop实战高手之路第七讲Hadoop图文训练课程：通过HDFS的心跳来测试replication具体的工作机制和流程

2023年4月11日上午2:51 • 云计算

这一讲主要深入使用HDFS命令行工具操作Hadoop分布式集群，主要是通过实验的配置hdfs-site.xml文件的心跳来测试replication具体的工作和流程。

通过HDFS的心跳来测试replication具体的工作机制和流程的PDF版本请猛击这里。

王家林的“云计算分布式大数据Hadoop实战高手之路”之完整发布目录

云计算分布式大数据实战技术Hadoop交流群：312494188，每天都会在群中发布云计算实战性资料，欢迎大家加入！

云计算分布式大数据Hadoop实战高手之路第七讲Hadoop图文训练课程：通过HDFS的心跳来测试replication具体的工作机制和流程

当我们上传文件时候文件会保存2份副本：

云计算分布式大数据Hadoop实战高手之路第七讲Hadoop图文训练课程：通过HDFS的心跳来测试replication具体的工作机制和流程

下面我们通过实验的方式探究replication属性配置的作用。

首先关闭集群：

云计算分布式大数据Hadoop实战高手之路第七讲Hadoop图文训练课程：通过HDFS的心跳来测试replication具体的工作机制和流程

然后修改hadoop.main这台机器上的hdfs-site.xml配置文件：

在这个配置文件中加入新的配置信息：

云计算分布式大数据Hadoop实战高手之路第七讲Hadoop图文训练课程：通过HDFS的心跳来测试replication具体的工作机制和流程

保存退出。

新加入的配置信息：

云计算分布式大数据Hadoop实战高手之路第七讲Hadoop图文训练课程：通过HDFS的心跳来测试replication具体的工作机制和流程

的具体含义是当DataNode和NameNode的心跳失去连接的时间超过15秒之后，Hadoop系统就会认为这个DataNode已经死亡，此时Hadoop会把这个DataNode标记为不能工作的状态，以后如果客户端去访问数据的时候，Hadoop就不会尝试到这个DataNode去获取数据。

下面看一下其工作的具体方式：

首先启动HDFS:

云计算分布式大数据Hadoop实战高手之路第七讲Hadoop图文训练课程：通过HDFS的心跳来测试replication具体的工作机制和流程

进入HDFS的Web监控台的Node页面：

云计算分布式大数据Hadoop实战高手之路第七讲Hadoop图文训练课程：通过HDFS的心跳来测试replication具体的工作机制和流程

我们发现hadoop.main和hadoop.slave这两个DataNode均在正常的工作中。

我们观察到“Last Contact”选项的数据，该数据是表明DataNode和NameNode最近联系的心跳成功的时间，我们再次刷新页面看一下这个数据：

云计算分布式大数据Hadoop实战高手之路第七讲Hadoop图文训练课程：通过HDFS的心跳来测试replication具体的工作机制和流程

我们发现这个具体的数据时比较低的。

此时我们通过命令行工作查看datanode进程：

云计算分布式大数据Hadoop实战高手之路第七讲Hadoop图文训练课程：通过HDFS的心跳来测试replication具体的工作机制和流程

我们发现hadoop.main上运行的DataNode节点的进程是16228，我们把这个DataNode杀掉：

云计算分布式大数据Hadoop实战高手之路第七讲Hadoop图文训练课程：通过HDFS的心跳来测试replication具体的工作机制和流程

我们再次刷新HDFS的Node的控制台：

云计算分布式大数据Hadoop实战高手之路第七讲Hadoop图文训练课程：通过HDFS的心跳来测试replication具体的工作机制和流程

继续刷新：

云计算分布式大数据Hadoop实战高手之路第七讲Hadoop图文训练课程：通过HDFS的心跳来测试replication具体的工作机制和流程

继续刷新：

云计算分布式大数据Hadoop实战高手之路第七讲Hadoop图文训练课程：通过HDFS的心跳来测试replication具体的工作机制和流程

可以发现第一个DataNode的心跳时间不断的在增加，同时在第三次刷新的时候心跳间隔时间为25，这个数据超过我们配置文件中的15，再刷新一次：

云计算分布式大数据Hadoop实战高手之路第七讲Hadoop图文训练课程：通过HDFS的心跳来测试replication具体的工作机制和流程

此时发现只有一个正在服务的DataNode，因为我们的Hadoop.main中的DataNode心跳间隔时间超过了15秒，Hadoop此时把把该节点标记为无效节点。

我们返回文件系统页面看一下我们上传的文件存储信息：

云计算分布式大数据Hadoop实战高手之路第七讲Hadoop图文训练课程：通过HDFS的心跳来测试replication具体的工作机制和流程

此外发现文件的可访问信息只是存放在了hadoop.slave这个节点中了，当然，此时我们还是可以正常的访问文件，虽然只有一份可用副本，这就是replication节点的作用，我们在配置该节点的时候把值设置为2，表明同一个文件在HDFS中有两个副本，当一个运行DataNode的进程因为某些原因不能工作的时候，我们依旧可以使用剩余的一份副本工作，这不会影响客户端对数据的访问。

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：云计算分布式大数据Hadoop实战高手之路第七讲Hadoop图文训练课程：通过HDFS的心跳来测试replication具体的工作机制和流程 - Python技术站

赞 (0)

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

王家林的“云计算分布式大数据Hadoop实战高手之路—从零开始”的第十讲Hadoop图文训练课程：剖析Hadoop的重要配置文件

上一篇 2023年4月11日

王家林亲授的上海7月6-7日云计算分布式大数据Hadoop深入浅出案例驱动实战报名信息

下一篇 2023年4月11日

使用vSphere Update Manager 升级 ESXi 主机

使用vSphere Update Manager 升级 ESXi 主机 vSphere Update Manager vSphere Update Manager 是用于升级、迁移、更新和修补群集主机、虚拟机和客户机操作系统的软件。 vSphere Update Manager 可协调主机和虚拟机的升级。如果站点使用 vSphere Update Mana…

云计算 2023年4月17日
000
云原生时代顶流消息中间件Apache Pulsar部署实操之轻量级计算框架

本篇逐层递进了解Pulsar Functions的基本概念和理论，如工作原理、处理保证模式、窗口函数；进一步搭建Pulsar函数运行环境，一步步操作演示函数也包括窗口函数的示例使用，最后通过Java语言实现原生语言接口和Pulsar函数SDK两种方式的代码示例、打包、部署和结果验证。 @ 目录 Pulsar Functions(轻量级计算框架) 基础定义工…

云计算 2023年4月13日
000
浅谈ASP.Net Core WebApi几种版本控制对比

浅谈ASP.NET Core WebApi几种版本控制对比概述版本控制是软件开发中非常重要的一项工作，它可以保证软件的可维护性、可扩展性和安全性等方面的要求。在ASP.NET Core WebApi中，有多种版本控制方式可供选择，本文将浅谈几种版本控制方式的优缺点及实现方法。 URL版本控制 URL版本控制是一种比较简单直观的版本控制方式，它将版本号直接…

云计算 2023年5月17日
000
Python量化交易详细简介

Python量化交易详细简介 Python作为一种全能编程语言，已经被广泛用于各个领域，量化交易也不例外。Python量化交易是指使用Python编程语言进行交易策略开发和量化分析。本文将详细介绍Python量化交易的方法和步骤。量化交易量化交易是指运用计算机科学、数学和统计学等知识对交易策略进行分析、建模和演化，通过程序自动化执行交易。使用量化交易可以…

云计算 2023年5月18日
000
java8 Stream大数据量List分批处理切割方式

请看下文详细讲解。 Java8 Stream大数据量List分批处理切割方式前言在实际的开发过程中，我们经常会遇到处理大数据量的情况。而处理大数据量时，有一种常用的处理方式就是将数据拆分成多个批次进行处理，这样可以使处理更加高效。在Java8中，Steam API提供了一种方便的方式来处理大数据量的集合，本文将会详细讲解如何使用Java8 Stream …

云计算 2023年5月18日
000
阿里云弹性计算性能测试负责人三年实战复盘 | 性能测试没那么简单

我是阿里云弹性计算性能测试负责人西邪。我从 2018 年开始组建阿里云弹性计算的性能测试团队，从要一周完成一组性能测试，到只需 1 分钟就可以触发一组全自动性能测试，到最后结果整理一键搞定，内部命名为开天斧。现在开天斧已经承担整个弹性计算所有的性能测试工作：新技术、新设备、新规格等等，保证了线上的性能稳定性。在性能测试的同时，还要负责解决客户的性能问题。…

云计算 2023年4月13日
000
一台虚拟机基于docker搭建大数据HDP集群的思路详解

一台虚拟机基于docker搭建大数据HDP集群思路详解 1. 前置条件一台Linux操作系统虚拟机，建议使用CentOS 7.x版本。 Docker环境已经安装并启动，如果未安装可以先参考官网文档安装：https://docs.docker.com/get-docker/ 准备好HDP镜像文件，例如”hortonworks/hdp:3.1.4.0-cent…

云计算 2023年5月18日
000
linux云计算集群架构学习笔记:rhel7基本命令操作

1-3-RHEL7基本命令操作 1.1Linux终端介绍 Shell提示符 Bash Shell基本语法。 1.2基本命令的使用：ls、pwd、cd。 1.3查看系统和BIOS硬件时间。 1.4 Linux如何获得帮助，Linux关机命令：shutdown、init等。 1.5 Linux 7个启动级别，设置服务器在来电后自动开机。单词整理： Termi…

云计算 2023年4月13日
000

合作推广

合作推广

返回顶部