数据治理

  • 高可用Hadoop平台-启航详解大数据

    1.概述   在上篇博客中,我们搭建了《配置高可用Hadoop平台》,接下来我们就可以驾着Hadoop这艘巨轮在大数据的海洋中遨游了。工欲善其事,必先利其器。是的,没错;我们开发需…

    大数据 2021年7月19日
  • 解读Secondary NameNode的功能详解大数据

    1.概述   最近有朋友问我Secondary NameNode的作用,是不是NameNode的备份?是不是为了防止NameNode的单点问题?确实,刚接触Hadoop,从字面上看…

    大数据 2021年7月19日
  • 高可用Hadoop平台-探索详解大数据

    1.概述   上篇《高可用Hadoop平台-启航》博客已经让我们初步了解了Hadoop平台;接下来,我们对Hadoop做进一步的探索,一步一步的揭开Hadoop的神秘面纱。下面,我…

    大数据 2021年7月19日
  • Hive基本操作详解大数据

    1.概述   上一章《那些年使用Hive踩过的坑》介绍了Hive的基本架构及原理,加下来介绍Hive的基本操作和一些注意事项。 2.基本操作 2.1Create Table 2.1…

    大数据 2021年7月19日
  • Hive性能优化详解大数据

    1.概述   继续《那些年使用Hive踩过的坑》一文中的剩余部分,本篇博客赘述了在工作中总结Hive的常用优化手段和在工作中使用Hive出现的问题。下面开始本篇文章的优化介绍。 2…

    大数据 2021年7月19日
  • 高可用Hadoop平台-运行MapReduce程序详解大数据

    1.概述   最近有同学反应,如何在配置了HA的Hadoop平台运行MapReduce程序呢?对于刚步入Hadoop行业的同学,这个疑问却是会存在,其实仔细想想,如果你之前的语言功…

    大数据 2021年7月19日
  • 高可用Hadoop平台-集成Hive HAProxy详解大数据

    1.概述   这篇博客是接着《高可用Hadoop平台》系列讲,本篇博客是为后面用 Hive 来做数据统计做准备的,介绍如何在 Hadoop HA 平台下集成高可用的 Hive 工具…

    大数据 2021年7月19日
  • 高可用Hadoop平台-实战详解大数据

    1.概述   今天继续《高可用的Hadoop平台》系列,今天开始进行小规模的实战下,前面的准备工作完成后,基本用于统计数据的平台都拥有了,关于导出统计结果的文章留到后面赘述。今天要…

    大数据 2021年7月19日
  • 高可用Hadoop平台-实战尾声篇详解大数据

    1.概述   今天这篇博客就是《高可用Hadoop平台》的尾声篇了,从搭建安装到入门运行 Hadoop 版的 HelloWorld(WordCount 可以称的上是 Hadoop …

    大数据 2021年7月19日
  • 高可用Hadoop平台-答疑篇详解大数据

    1.概述   这篇博客不涉及到具体的编码,只是解答最近一些朋友心中的疑惑。最近,一些朋友和网友纷纷私密我,我总结了一下,疑问大致包含以下几点: 我学 Hadoop 后能从事什么岗位…

    大数据 2021年7月19日