数据湖

  • HDFS详解(2)——HDFS中的读写数据流大数据

    1.文件的读取 在客户端执行读取操作时,客户端和HDFS交互过程以及NameNode和各DataNode之间的数据流是怎样的?下面将围绕图1进行具体讲解。           图 …

    大数据 2021年7月19日
  • Hadoop配置参数详解大数据

    Hadoop的配置文件解释 hadoop-env.sh: 用于定义hadoop运行环境相关的配置信息,比如配置JAVA_HOME环境变量、为hadoop的JVM指定特定的选项、指定…

    大数据 2021年7月19日
  • Hadoop生态系统详解大数据

    以下图1是hadoop生态图,通俗的说,就是hadoop核心模块和衍生的子项目。         &…

    大数据 2021年7月19日
  • Hadoop 项目及结构详解大数据

    现在 Hadoop 已经发展成为包含多个子项目的集合。虽然其核心内容是 MapReduce 和Hadoop 分布式文件系统(HDFS),但 Hadoop 下的Common 、Avr…

    大数据 2021年7月19日
  • Hadoop体系结构详解大数据

    HDFS和Mapreduce是Hadoop的两大核心。整个Hadoop的体系结构主要是通过HDFS来实现分布式存储的底层支持,MapReduce来实现分布式并行任务处理的程序支持。…

    大数据 2021年7月19日
  • MapReduce工作机制详解大数据

    MapReduce任务执行总流程 以下图5 是MapReduce作业详细的执行流程图。        &nbs…

    大数据 2021年7月19日
  • HDFS详解(1)大数据

    HDFS(Hadoop Distributed File System)是Hadoop项目的核心子项目,是Hadoop主要应用的一个分布式文件系统。实际上,Hadoop中有一个综合…

    大数据 2021年7月19日
  • HDFS详解(3)——HDFS文件结构大数据

    HDFS中的NameNode、DataNode、Secondery NameNode是如何在磁盘上组织和存储持久化数据的?下面将分别进行介绍。 注意,这里主要介绍的是Hadoop …

    大数据 2021年7月19日
  • Hadoop shell详解大数据

    常用管理命令   Hadoop管理员的常用命令。  启动Hadoop 进入HADOOP_HOME目录。 执行sh bin/start-all.sh 关…

    大数据 2021年7月19日
  • HDFS的shell操作详解大数据

    既然HDFS 是存取数据的分布式文件系统,那么对HDFS的操作,就是对文件系统的基本操作,比如文件的创建、修改、删除、修改权限等,文件夹的创建、删除、重命名等。对 HDFS 的操作…

    大数据 2021年7月19日