开源大数据平台

  • Hadoop – Ambari集群管理剖析详解大数据

    1.Overview   Ambari是Apache推出的一个集中管理Hadoop的集群的一个平台,可以快速帮助搭建Hadoop及相关以来组件的平台,管理集群方便。这篇博客记录Am…

    大数据 2021年7月19日
  • Hadoop – Kylin On OLAP详解大数据

    1.概述   Apache Kylin是一个开源的分布式分析引擎,提供SQL接口并且用于OLAP业务于Hadoop的大数据集上,该项目由eBay贡献于Apache。 2.What …

    大数据 2021年7月19日
  • Hadoop – Zeppelin 使用心得详解大数据

    1.概述   在编写 Flink,Spark,Hive 等相关作业时,要是能快速的将我们所编写的作业能可视化在我们面前,是件让人兴奋的时,如果能带上趋势功能就更好了。今天,给大家介…

    大数据 2021年7月19日
  • Hadoop – Azkaban 作业调度详解大数据

    1.概述   在调度 Hadoop 的相关作业时,有以下几种方式: 基于 Linux 系统级别的 Crontab。 Java 应用级别的 Quartz。 第三方的调度系统…

    大数据 2021年7月19日
  • Kafka – SQL 引擎分享详解大数据

    1.概述   大多数情况下,我们使用 Kafka 只是作为消息处理。在有些情况下,我们需要多次读取 Kafka 集群中的数据。当然,我们可以通过调用 Kafka 的 API 来完成…

    大数据 2021年7月19日
  • Kafka – SQL 代码实现详解大数据

    1.概述   上次给大家分享了关于 Kafka SQL 的实现思路,这次给大家分享如何实现 Kafka SQL。要实现 Kafka SQL,在上一篇《Kafka – S…

    大数据 2021年7月19日
  • Spark 实时计算整合案例详解大数据

    1.概述   最近有同学问道,除了使用 Storm 充当实时计算的模型外,还有木有其他的方式来实现实时计算的业务。了解到,在使用 Storm 时,需要编写基于编程语言的代码。比如,…

    大数据 2021年7月19日
  • Flink 剖析详解大数据

    1.概述   在如今数据爆炸的时代,企业的数据量与日俱增,大数据产品层出不穷。今天给大家分享一款产品—— Apache Flink,目前,已是 Apache 顶级项目之一。那么,接…

    大数据 2021年7月19日
  • Hadoop 生态系统详解大数据

    1.概述   最近收到一些同学和朋友的邮件,说能不能整理一下 Hadoop 生态圈的相关内容,然后分享一些,我觉得这是一个不错的提议,于是,花了一些业余时间整理了 Hadoop 的…

    大数据 2021年7月19日
  • Flink 案例整合详解大数据

    1.概述   Flink 1.1.0 版本已经在官方发布了,官方博客于 2016-08-08 更新了 Flink 1.1.0 的变动。在这 Flink 版本的发布,添加了 SQL …

    大数据 2021年7月19日