与服务器一起的日子

  • mysql
  • linux
  • 高可用
  • nginx
HDFS
hadoop

HDFS——使用心得

HDFS是Hadoop应用程序使用的主要分布式存储。 HDFS集群主要由管理文件系统元数据的NameNode和存储实际数据的DataNode组成。 “HDFS体系结构指南”详细介绍了HDFS。HDFS体系结构图描述了NameNode,DataNode和客户端之间的基本交互。 客户联系NameNode文件元数据或文件修改,并直接与DataNode执行实际的文件I / O。 以下是许多用户可能感兴趣的一些显着特性。 Hadoop,包括HDFS,非常适合使用商品硬件的分布式存储和分布式处理。 它具有容错性,可扩展性,并且…

2017年11月28日 0条评论 441点热度 0人点赞 jhin 阅读全文
HDFS

hadoop技术探秘03——HDFS命名空间和数据稳定性

命名空间的持久化 HDFS名称空间由NameNode存储。 NameNode使用名为EditLog的事务日志来持久记录文件系统元数据发生的每一个变化。 例如,在HDFS中创建一个新文件会产生NameNode向EditLog中写入一条记录,记录这一点。同样,复制因子更改文件会导致将新记录写入到EditLog中。 NameNode使用其本地主机OS文件系统中的文件来存储EditLog。 整个文件系统名称空间(包括块到文件和文件系统属性的映射)存储在一个名为FsImage的文件中。 FsImage也作为文件存储在Name…

2017年11月24日 0条评论 799点热度 0人点赞 jhin 阅读全文
hadoop

HDFS高可用性QJM——原理

目的 本文使用仲裁日志管理器(QJM)功能概述了HDFS高可用性(HA)功能以及如何配置和管理HA HDFS群集。 本文假设读者对HDFS集群中的通用组件和节点类型有一个大体的了解。 注意:使用仲裁日志管理器或常规共享存储 本指南讨论如何使用仲裁日志管理器(QJM)配置和使用HDFS HA以共享活动和备用NameNode之间的编辑日志。 背景 在Hadoop 2.0.0之前,NameNode是HDFS集群中的单点故障(SPOF)问题所在。 每个群集都有一个NameNode,如果该机器或进程不可用,整个群集将不可用,…

2017年11月22日 0条评论 874点热度 0人点赞 jhin 阅读全文
HDFS

hadoop技术探秘03——HDFS数据复制深入探究

副本的放置:第一个创世块 对于HDFS的数据块,原文标题是Replica Placement: The First Baby Steps,在这里我翻译为创世块,以前我研究“区块链”,里面有“创世块”的说法,就是第一个块,这样拿来就用,虽然不够准确但是足够我现在应急了(笑)。 副本的放置对HDFS的可靠性和性能至关重要。 优化副本放置将HDFS与大多数其他分布式文件系统区分开来。 这是一个需要大量调整和经验的功能。 机架感知机制对于复制品放置的策略提高数据可靠性、可用性和网络带宽利用率。 大型HDFS集群运行在通常分…

2017年11月18日 0条评论 859点热度 0人点赞 jhin 阅读全文
HDFS

hadoop技术探秘02——什么是HDFS

HADOOP DISTRIBUTED FILE SYSTEM,简称HDFS,是一个分布式文件系统。它是谷歌的GFS提出之后出现的另外一种文件系统。它有一定高度的容错性,而且提供了高吞吐量的数据访问,非常适合大规模数据集上的应用。HDFS 提供了一个高度容错性和高吞吐量的海量数据存储解决方案。 关于容错性: 首先,节点失效将被看成是正常情况,而不再视为异常情况。整个文件系统包含了几百个或者几千个由廉价的普通机器组成的存储机器,而且这些机器是被与之匹配数量的客户端机器访问。这些节点的质量和数量都实际上都确定了在任意给定…

2017年11月13日 0条评论 539点热度 0人点赞 jhin 阅读全文
hadoop

hadoop技术探秘01——hadoop环境搭建04

上一篇文章文章写到了单机版的配置,现在开始搭建我们的集群,开启我们的六台机器,准备搞事情!!! 声明:1,这篇文章只能搭建一个普通的hadoop集群,没有涉及到高可用。 ====================================== 现在可以准备搭建集群了,记得我们的六个节点(centos虚拟机)吗?先搭建一个普通的HDFS集群,说实话,和搭建单机版没什么区别,只要改变几个参数就可以了。 现在,我们先去规划一下我们的节点,我们的各个节点负责什么呢? 为了保证以后高可用的实现,本集群只设置了三台主机。 …

2017年10月28日 0条评论 507点热度 0人点赞 jhin 阅读全文
centos

hadoop技术探秘01——hadoop环境搭建03

上一篇当中,我们的准备工作做的差不多了,现在是时候开始我们的大数据之旅了;但是我们要规划一下我们的旅行路线。我们的六个节点(大数据的主机被称为节点)如何使用? 一:hadoop是由HDFS(分布式文件系统)提供数据存储,它会将数据切分成块进行存储,每个块由我们自己定义,比如我们可以把块定义为128M一个,当然hadoop作为离线的数据分析平台,处理的数据量很大(PB或者ZB级别数据),所以,实际生产环境一个块一般存储为处理数据的百分之一左右(这个看数据读写速度,机械硬盘的IOPS小,所以要考虑磁盘IO性能,涉及到了…

2017年9月27日 0条评论 543点热度 0人点赞 jhin 阅读全文

COPYRIGHT © 2024 与服务器一起的日子. ALL RIGHTS RESERVED.

Theme Kratos Made By Seaton Jiang