数据中台

  • Hadoop2.x源码-编译剖析详解大数据

    1.概述   最近,有小伙伴涉及到源码编译。然而,在编译期间也是遇到各种坑,在求助于搜索引擎,技术博客,也是难以解决自身所遇到的问题。笔者在被询问多次的情况下,今天打算为大家来写一…

    大数据 2021年7月19日
  • Hadoop – 任务调度系统比较详解大数据

    1.概述   在Hadoop应用,随着业务指标的迭代,而使其日趋复杂化的时候,管理Hadoop的相关应用会变成一件头疼的事情,如:作业的依赖调度,任务的运行情况的监控,异常问题的排…

    大数据 2021年7月19日
  • Hadoop – 实时查询Drill详解大数据

    1.概述   在现实业务当中,存在这样的业务场景,需要实时去查询HDFS上的相关存储数据,普通的查询(如:Hive查询),时延较高。那么,是否存在时延较小的查询组件。在业界目前较为…

    大数据 2021年7月19日
  • Hadoop-Drill深度剖析详解大数据

    1.概述   在《Hadoop – 实时查询Drill》一文当中,笔者给大家介绍如何去处理实时查询这样的业务场景,也是简略的提了一下如何去实时查询HDFS,然起相关细节…

    大数据 2021年7月19日
  • HBase – Phoenix剖析详解大数据

    1.概述   在《Hadoop-Drill深度剖析》一文当中,给大家介绍了Drill的相关内容,就实时查询来说,Drill基本能够满足要求,同时还可以做一个简单业务上的聚合,如果在…

    大数据 2021年7月19日
  • Hadoop – Ambari集群管理剖析详解大数据

    1.Overview   Ambari是Apache推出的一个集中管理Hadoop的集群的一个平台,可以快速帮助搭建Hadoop及相关以来组件的平台,管理集群方便。这篇博客记录Am…

    大数据 2021年7月19日
  • Hadoop – Kylin On OLAP详解大数据

    1.概述   Apache Kylin是一个开源的分布式分析引擎,提供SQL接口并且用于OLAP业务于Hadoop的大数据集上,该项目由eBay贡献于Apache。 2.What …

    大数据 2021年7月19日
  • Hadoop – Zeppelin 使用心得详解大数据

    1.概述   在编写 Flink,Spark,Hive 等相关作业时,要是能快速的将我们所编写的作业能可视化在我们面前,是件让人兴奋的时,如果能带上趋势功能就更好了。今天,给大家介…

    大数据 2021年7月19日
  • Hadoop – Azkaban 作业调度详解大数据

    1.概述   在调度 Hadoop 的相关作业时,有以下几种方式: 基于 Linux 系统级别的 Crontab。 Java 应用级别的 Quartz。 第三方的调度系统…

    大数据 2021年7月19日
  • Kafka – SQL 引擎分享详解大数据

    1.概述   大多数情况下,我们使用 Kafka 只是作为消息处理。在有些情况下,我们需要多次读取 Kafka 集群中的数据。当然,我们可以通过调用 Kafka 的 API 来完成…

    大数据 2021年7月19日