数据中台

  • Kafka Eagle 源码解读详解大数据

    1.概述   在《Kafka 消息监控 – Kafka Eagle》一文中,简单的介绍了 Kafka Eagle这款监控工具的作用,截图预览,以及使用详情。今天笔者通过…

    大数据 2021年7月19日
  • Apache Beam 剖析详解大数据

    1.概述   在大数据的浪潮之下,技术的更新迭代十分频繁。受技术开源的影响,大数据开发者提供了十分丰富的工具。但也因为如此,增加了开发者选择合适工具的难度。在大数据处理一些问题的时…

    大数据 2021年7月19日
  • Kafka 源码剖析详解大数据

    1.概述   在对Kafka使用层面掌握后,进一步提升分析其源码是极有必要的。纵观Kafka源码工程结构,不算太复杂,代码量也不算大。分析研究其实现细节难度不算太大。今天笔者给大家…

    大数据 2021年7月19日
  • 分布式系统选举算法剖析详解大数据

    1.概述   我们在了解分布式选举算法之前,我们需要这样一种算法产生的背景。在一个分布式系统中,因为各种意外的因素,有的服务器可能会崩溃或变得不可靠,它就不能和其他服务器达成一致状…

    大数据 2021年7月19日
  • Kafka 存储机制和副本详解大数据

    1.概述   Kafka 快速稳定的发展,得到越来越多开发者和使用者的青睐。它的流行得益于它底层的设计和操作简单,存储系统高效,以及充分利用磁盘顺序读写等特性,和其实时在线的业务场…

    大数据 2021年7月19日
  • Kafka Streams 剖析详解大数据

    1.概述   Kafka Streams 是一个用来处理流式数据的库,属于Java类库,它并不是一个流处理框架,和Storm,Spark Streaming这类流处理框架是明显不一…

    大数据 2021年7月19日
  • Zeppelin源码详解大数据

    1.概述   在大数据应用场景中,处理数据分析方面,由于开发者的水平不一样,使用的编程语言也不尽相同,可能会涉及到R、Python、Java、Scala等,数据计算模型也估计不一样…

    大数据 2021年7月19日
  • HBase流量限制和表负载均衡剖析详解大数据

    1.概述   在HBase-1.1.0之前,HBase集群中资源都是全量的。用户、表这些都是没有限制的,看似完美实则隐患较大。今天,笔者就给大家剖析一下HBase的流量限制和表的负…

    大数据 2021年7月19日
  • HBase存储剖析与数据迁移详解大数据

    1.概述   HBase的存储结构和关系型数据库不一样,HBase面向半结构化数据进行存储。所以,对于结构化的SQL语言查询,HBase自身并没有接口支持。在大数据应用中,虽然也有…

    大数据 2021年7月19日
  • Kylin与CDH兼容性剖析详解大数据

    1. 概述   Apache Kylin™是一个开源的分布式分析引擎,提供Hadoop之上的SQL查询接口及多维分析(OLAP)能力以支持超大规模数据,最初由eBay Inc. 开…

    大数据 2021年7月19日