数据中台

  • 高可用Hadoop平台-Oozie工作流详解大数据

    1.概述   在开发Hadoop的相关应用使用,在业务不复杂,任务不多的情况下,我们可以直接使用Crontab去完成相关应用的调度。今天给大家介绍的是统一管理各种调度任务的系统,下…

    大数据 2022年1月11日
  • 高可用Hadoop平台-Oozie工作流之Hadoop调度详解大数据

    1.概述   在《高可用Hadoop平台-Oozie工作流》一篇中,给大家分享了如何去单一的集成Oozie这样一个插件。今天为大家介绍如何去使用Oozie创建相关工作流运行与Had…

    大数据 2022年1月11日
  • MapReduce业务 - 图片关联计算详解大数据

    1.概述   最近在和人交流时谈到数据相似度和数据共性问题,而刚好在业务层面有类似的需求,今天和大家分享这类问题的解决思路,分享目录如下所示: 业务背景 编码实践 预览截图   下…

    大数据 2022年1月11日
  • HDFS-Architecture剖析详解大数据

    1.概述   从HDFS的应用层面来看,我们可以非常容易的使用其API来操作HDFS,实现目录的创建、删除,文件的上传下载、删除、追加(Hadoop2.x版本以后开始支持)等功能。…

    大数据 2022年1月11日
  • Hadoop-调优剖析详解大数据

    1.概述   其实,在从事过调优相关的工作后,会发现其实调优是一项较为复杂的工作。而对于Hadoop这样复杂且庞大的系统来说,调优更是一项巨大的工作,由于Hadoop包含Commo…

    大数据 2022年1月11日
  • MapReduce-深度剖析详解大数据

    1.概述   在接触了第一代MapReduce和第二代MapReduce之后,或许会有这样的疑惑,我们从一些书籍和博客当中获取MapReduce的一些原理和算法,在第一代当中会有J…

    大数据 2022年1月11日
  • Hadoop2.x源码-编译剖析详解大数据

    1.概述   最近,有小伙伴涉及到源码编译。然而,在编译期间也是遇到各种坑,在求助于搜索引擎,技术博客,也是难以解决自身所遇到的问题。笔者在被询问多次的情况下,今天打算为大家来写一…

    大数据 2022年1月11日
  • Hadoop – 任务调度系统比较详解大数据

    1.概述   在Hadoop应用,随着业务指标的迭代,而使其日趋复杂化的时候,管理Hadoop的相关应用会变成一件头疼的事情,如:作业的依赖调度,任务的运行情况的监控,异常问题的排…

    大数据 2022年1月11日
  • Hadoop – 实时查询Drill详解大数据

    1.概述   在现实业务当中,存在这样的业务场景,需要实时去查询HDFS上的相关存储数据,普通的查询(如:Hive查询),时延较高。那么,是否存在时延较小的查询组件。在业界目前较为…

    大数据 2022年1月11日
  • Hadoop-Drill深度剖析详解大数据

    1.概述   在《Hadoop – 实时查询Drill》一文当中,笔者给大家介绍如何去处理实时查询这样的业务场景,也是简略的提了一下如何去实时查询HDFS,然起相关细节…

    大数据 2022年1月11日