HDFS的读写流程图

@[TOC](

HDFS的读写流程

)

1) hdfs的数据写入流程:

1. 客户端发送写入请求给namenode2. namenode接收到请求, 然后首先判断当前操作的用户是否具有写入的权限, 如果没有,直接报错 如果有权限, 接着判断要写入的数据目录下是否存在这个文件, 如果存在, 直接报错, 如果不存在, 此时就会给客户端返回可以写入的状态3. 当客户端获取可以写入的状态后, 开始对文件执行切割操作, 默认情况下, 会按照128M方式来切割文件4. 客户端拿着第一个block再次请求namenode, 让namenode为这个blcok分配datanode地址列表5. namenode会根据datanode的块信息,以及根据 机架感知原理, 网络拓扑关系 和 副本信息 来挑选出最合适的datanode地址, 将这些地址按照由近到远的顺序放置到列表中返回客户端6. 客户端根据列表中第一个地址连接指定的datanode, 然后由这个datanode连接下一次, 然后由下一个连接下一个依次类推,由此形成一个pipeline的管道 , 同时反向还会形成一条ack的校验管道7. 客户端开始写入. 数据以数据包的形成进行传输, 一个数据包为64kb, 当第一个datanode接收到, 接着传输给下一个, 依次类推同时,每一个接收到数据后, 都要在ack校验通道中进行记录8. 第一个datanode, 将ack中校验信息收集起来, 统计发送给客户端,由客户端校验此数据包是否全部都接收到了9. 客户端一次次的开始传输, 一次次进行校验, 直到将第一个block传输完成, 接下来拿的第二个block再次请求namenode, 获取block要存储在那些datanode上, 接下来执行第6~8 , 直到将所有的block传输完成, 到此写入流程结束了

2)hdfs的数据读取流程

1) 客户端发起数据读取的请求2) namenode接收到数据读取的请求, 首先判断要读取的文件是否存在, 如果不存在, 直接报错, 如果存在, 接着会判断当前操作的用户是否具备读取数据的权限, 如果没有 直接报错, 如果有权限, namenode 会根据 block信息, 机架感知原理, 网络拓扑关系, 副本信息 ,本地原则, 返回这个文件部分或者全部的block的地址3) 客户端拿到block部分或者全部地址, 接下来, 采用并行读取策略, 将block数据全部读取到客户端4) 如果namenode之前返回的部分的block地址, 此时客户端接着再次请求namenode, 获取下一批的block地址,执行第四步以此类推, 直到将所有的block全部的读取到客户端5) 客户端将读取到block数据按照顺序, 依次拼接 形成最终的文件 返回给用户

来源:https://www.icode9.com/content-4-798151.html

(0)

相关推荐

  • 大数据开发之HDFS分布式文件存储系统详解

    HDFS(Hadoop Distributed File System)分布式文件存储系统,主要为各类分布式计算框架如Spark.MapReduce等提供海量数据存储服务,同时HBase.Hive底层 ...

  • hdfs的读写流程分析总结

    HDFS采用的是master/slaves这种主从的结构模型管理数据,这种结构模型主要由四个部分组成,分别是Client(客户端).Namenode(名称节点).Datanode(数据节点)和Seco ...

  • Hadoop_HDFS_02

    Hadoop_HDFS_02

  • hdfs读写文件过程

    文件参考:https://www.cnblogs.com/tgzhu/p/5788634.html 以写入100M文件为例: Client将FileA按64M分块.分成两块,block1和Block2 ...

  • HDFS的读写流程

    一.简介 HDFS(Hadoop Distributed File System)是GFS的开源实现. 1.优点: 能够运行在廉价机器上,硬件出错常态,需要具备高容错性 流式数据访问,而不是随机读写 ...

  • 画流程图工具:用它可以直接套用流程图模板

    最近,我因为工作原因,需要绘制一份公司管理业务的流程图,但个人是刚踏出校园的大学生,在画流程图方面并没有多少经验,因此有点发愁.不过好在我所在办公室部门有一些乐于助人的同事,他们推荐了一个好方法给我, ...

  • 干货!超详细的化工装置流程图!

    异构化装置流程图 异构化装置类似普通的加氢精制装置. 以丁烷异构化为例(见图),丁烷进料经脱异丁烷塔分离出异丁烷,塔底主要是正丁烷,与氢混合后经加热进入反应器.反应压力约2.1-2.8MPa,温度 1 ...

  • 药物研发流程图PPT

    免责声明:文章版权归原作者所有.如涉及作品内容.版权和其它问题,请跟我们联系删除!文章内容为作者个人观点,并不代表本公众号赞同或支持其观点.本公众号拥有对此声明的最终解释权.

  • 【读写吧】怀念吃过“派饭”的人

    继承传统  阅读写作 编辑书签 在新中国的建设史上,曾经有过这么一批人,他们代表党和政府,以工作队的方式,进驻农村乡镇,一边参加劳动,一边指导当地党建工作.由于当时的条件限制,他们总是一家一户地吃&q ...

  • 【读写吧】这样给孩子改作文(1)

    批改手记 原文:<最美逆行者>(附后) 作者:王梓鉴(5年级) 修改后:<2020年的爷爷>(附后) ◎为什么把题目改成了<2020年的爷爷>? 答:原文题目是&l ...

  • 【读写吧】和妈妈要蛋糕的孩子

    本期语录 控制与被控制是和谐共存的自然法则,而由于能力不足导致的方向性控制错误是危险的.它不亚于一场肆意蔓延的新冠病毒,侵蚀肌体,危及民生. --七月 ◎本期语录 ◎如此作文 ◎初中生作文欣赏 如此作 ...