王家林的“云计算分布式大数据Hadoop实战高手之路—从零开始”的第九讲Hadoop图文训练课程：剖析NameNode和Secondary NameNode的工作机制和流程

2023年4月11日上午2:50 • 云计算

本讲主要剖析SecondaryNameNode。

“云计算分布式大数据Hadoop实战高手之路”之完整发布目录

云计算分布式大数据实战技术Hadoop交流群：312494188，每天都会在群中发布云计算实战性资料，欢迎大家加入！

Hadoop在启动的时候，会启动SecondaryNameNode，我们使用JPS命令查看一下查看一下Hadoop启动时启动了那些进程：

王家林的“云计算分布式大数据Hadoop实战高手之路---从零开始”的第九讲Hadoop图文训练课程：剖析NameNode和Secondary NameNode的工作机制和流程

在我们讲解SecondaryNameNode的具体作用之前，我们先看一看NameNode的工作特点和具体作用：

1，在Hadoop的集群中，有NameNode和DataNode之分，在运行时DataNode可以有很多个，但NameNode只有一个；

2，NameNode保存的是Hadoop集群的metadata，即文件系统的元数据，包含整个文件系统的目录结构，每一个目录有哪些文件，每个文件有哪些分块，每个分块保存在哪一个DataNode上面；

3，NameNode在内存中保存metadata，这样可以快速的处理客户端对数据的“读请求”；

4，但是内存中的数据是容易丢失的，例如掉电时，所以我们必须在磁盘上有metadata的副本；

5，当有“写请求”到来时，即要改变Hadoop的文件系统时，NameNode会首先写editlog并主动同步到磁盘，成功后才会修改内存中的metadata，并且返回给客户端，客户端在收到成功返回的信息后才会写数据到具体的DataNode上去；

6，Hadoop会在磁盘上维护一个fsimage的文件，该文件是NameNode中metedata的镜像；

7，fsimage不会随时与NameNode中的metedata保持一致，而是每隔一段时间通过合并editlog中的内容来更新；

8，合并的过程是比较消耗内存和CPU的操作，所以Hadoop就是用SecondaryNameNode专门用于更新fsimage文件；

下面我们看看SecondaryNameNode的工作流程：

1，SecondaryNameNode通知PrimaryNameNode切换editlog；

2，SecondaryNameNode通过HTTP协议从PrimaryNameNode获得fsimage和editlog；

3，SecondaryNameNode将fsimage载入内存，然后开始合并editlog的操作；

4，SecondaryNameNode将合并后的新的fsimage发给PrimaryNameNode；

5，PrimaryNameNode收到SecondaryNameNode发过来的新的fsimage后会用新的fsimage替换旧的fsimage；

SecondaryNameNode合适触发上述的工作流程呢？或者说checkpoint是什么呢？满足以下的任何条件都会触发SecondaryNameNode的工作流程：

1，fs.checkpoint.period 指定两次checkpoint之间最大时间间隔，默认时间为3600秒，即一个小时；

2，fs.checkpoint.size规定editlog文件的最大值，该文件的默认大小是64M，一旦超过这个值则强制触发SecondaryNameNode的工作流程；

从Hadoop 2.X开始推出了Active-Backup NameNode的模式，即同时具有两个NameNode：Active NameNode和Backup NameNode，当Acitive NameNode不能够正常提供服务是时候，Backup NameNode就可以接替Acitive NameNode继续为客户端提供服务，这样就会更有力的保证Hadoop服务不会中断。

大家可以看出在Hadoop 1.X的版本时，整个Hadoop的正常工作极端的依赖于单一的Primary NameNode，当Primary NameNode出现问题的时候，整个Hadoop的文件系统就无法给客户端提供服务了，这对一些非常关键的应用是难以接受的，所以运行NameNode节点的机器的硬件需要非常好，例如磁盘的IO速度要非常快；

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：王家林的“云计算分布式大数据Hadoop实战高手之路—从零开始”的第九讲Hadoop图文训练课程：剖析NameNode和Secondary NameNode的工作机制和流程 - Python技术站

云计算

0 0 打赏

微信扫一扫

支付宝扫一扫

王家林的“云计算分布式大数据Hadoop实战高手之路—从零开始”的第十一讲Hadoop图文训练课程：MapReduce的原理机制和流程图剖析

上一篇 2023年4月11日

王家林的“云计算分布式大数据Hadoop实战高手之路—从零开始”的第十讲Hadoop图文训练课程：剖析Hadoop的重要配置文件

下一篇 2023年4月11日

详解Python读取和写入操作CSV文件的方法

下面是Python读取和写入操作CSV文件的方法的完整攻略。概述 CSV是一种简单的文件格式，常用于存储和交换表格数据。Python提供了许多方便的库来读取和写入CSV文件，比如csv、pandas等。这篇攻略将介绍如何使用csv库读取和写入CSV文件。读取CSV文件使用csv库读取CSV文件的步骤如下：导入csv库。打开CSV文件。创建一个cs…

云计算 2023年5月18日
000
阿里巴巴云计算面试

c++基础：虚函数自己实现一个栈，push pop getMin 时间复杂度 O（1）方式：用另外一个栈 minStack来维护当前元素对应的最小值 push 插入元素的时候直接插入 dataStack 如果 newNum < minStack.top ， minStack.push(newNum) 否则 minStack.push(minSt…

云计算 2023年4月9日
000
一波低价日本VPS主机乱谈与推荐

一波低价日本VPS主机乱谈与推荐低价VPS主机的优缺点低价VPS主机的优点：价格便宜，适合个人或小型团队使用，可以自己搭建网站或者进行二次开发。低价VPS主机的缺点：配置不高，硬件资源较少，安全性不高，维护需要自己解决等问题。日本VPS主机的特点日本VPS主机的特点：地理位置相对中国来说比较近，一般有千兆网络，可以适应对速度有比较高要求的用户。推荐…

云计算 2023年5月17日
000
云计算浅谈之一:云计算介绍

　　微软前一段通知，微软的云计算平台windows azure在中国的服务将会于10月1日开通。微软承诺未来90%的开发人员将从事云计算方面的工作。在这个重要的时刻，是时候提醒更多的开发人员做技术上的更新。上月有机会受邀为某培训机构的软件专业暑期班开设云计算讲座,遂将过去的工作总结了一下,发现自己都获益匪浅.现在以连载方式的发表(共五讲),以润读者. …

云计算 2023年4月11日
000
JavaScript操作元素实例大全

JavaScript操作元素实例大全本文将提供一个完整的攻略，包括如何使用JavaScript操作元素实例。以下是详细步骤：步骤1：获取元素在使用JavaScript操作元素之前，我们需要先获取元素。可以使用document对象的方法来获取元素。以下是一个示例说明，演示如何获取元素： // 通过id获取元素 const elementById = do…

云计算 2023年5月16日
000
云计算设计模式（九）——联合身份模式

验证委托给外部身份提供者。这种模式可以简化开发，最大限度地减少对用户管理的要求，并提高了应用程序的用户体验。背景和问题用户通常需要使用由提供，并通过与它们有商业关系的不同组织主持的多个应用程序一起工作。但是，这些用户可能被迫使用特定的（和不同的）的凭证，每一个。这可以： •原因脱节的用户体验。用户经常忘记登录凭据时，他们有很多不同的的。 •暴露安全漏洞…

云计算 2023年4月11日
000
云计算应用的五个特性和四种部署方式

云计算的五个关键特性，用了“SALES”概括，包含了未来的商业模式，服务模式的内涵。如果满足这几个方面，我们就可以说他叫做“云”：第一个是按需自助服务(On Demand Self-Service)，前面讲的技术跟业务之间有一个矛盾，如果业务部门可以自助做一些工作，IT压力会减少很多。第二个就是泛网的访问(Broad Network Access) ，无…

云计算 2023年4月13日
000
angular6根据environments配置文件更改开发所需要的环境的方法

在 Angular6 中，我们可以使用 environments 配置文件来配置不同的环境变量，例如开发环境、测试环境和生产环境等。在本文中，我们将详细讲解如何根据 environments 配置文件更改开发所需要的环境。步骤 1. 创建 environments 配置文件在 Angular6 项目中，我们可以通过在 src 目录下创建 environm…

云计算 2023年5月16日
000

王家林的“云计算分布式大数据Hadoop实战高手之路—从零开始”的第九讲Hadoop图文训练课程：剖析NameNode和Secondary NameNode的工作机制和流程

相关文章