数据分析

  • 基于Kafka的实时计算引擎如何选择Flink or Spark详解大数据

    1.前言 目前实时计算的业务场景越来越多,实时计算引擎技术及生态也越来越成熟。以Flink和Spark为首的实时计算引擎,成为实时计算场景的重点考虑对象。那么,今天就来聊一聊基于K…

    大数据 2021年7月19日
  • 万亿数据下Hadoop的核心竞争力详解大数据

    1.前言 在大数据时代,Hadoop有着得天独厚的优势。然而,每个企业的技术储备和需求特点不同,他们希望从海量的客户数据中挖掘真正的商业价值,像Google、Facebook、Tw…

    大数据 2021年7月19日
  • Kafka Eagle V1.3.4更新预览详解大数据

    1.概述 Kafka Eagle是一款开源的Kafka集群监控系统,源代码托管在Github。目前Kafka Eagle已更新到V1.3.4版本,域名已经统一更新为IT虾米网,之前…

    大数据 2021年7月19日
  • HBase数据迁移到Kafka实战详解大数据

    1.概述 在实际的应用场景中,数据存储在HBase集群中,但是由于一些特殊的原因,需要将数据从HBase迁移到Kafka。正常情况下,一般都是源数据到Kafka,再有消费者处理数据…

    大数据 2021年7月19日
  • Hive On HBase实战详解大数据

    1.概述 HBase是一款非关系型、分布式的KV存储数据库。用来存储海量的数据,用于键值对操作。目前HBase是原生是不包含SQL操作,虽然说Apache Phoenix可以用来操…

    大数据 2021年7月19日
  • Kafka日志压缩剖析详解大数据

    1.概述 最近有些同学在学习Kafka时,问到Kafka的日志压缩(Log Compaction)问题,对于Kafka的日志压缩有些疑惑,今天笔者就为大家来剖析一下Kafka的日志…

    大数据 2021年7月19日
  • Flink消费Kafka到HDFS实现及详解大数据

    1.概述 最近有同学留言咨询,Flink消费Kafka的一些问题,今天笔者将用一个小案例来为大家介绍如何将Kafka中的数据,通过Flink任务来消费并存储到HDFS上。 2.内容…

    大数据 2021年7月19日
  • 如何构建推荐系统详解大数据

    1.概述 最近有被咨询到一些关于推荐系统的问题,今天笔者将为大家分享一些关于如何构建一个推荐系统。 2.内容 2.1 什么是推荐系统? 推荐系统是一种信息过滤系统,它旨在预测用户对…

    大数据 2021年7月19日
  • Kafka SSL安装与配置详解大数据

    1.概述 最近有同学咨询说,Kafka的SSL安全认证如何安装与使用?今天笔者将通过以下几个方面来介绍Kafka的SSL: Kafka 权限介绍 Kafka SSL的安装与使用 K…

    大数据 2021年7月19日
  • 基于用户的协同过滤来构建推荐系统详解大数据

    1.概述 之前介绍了如何构建一个推荐系统,今天给大家介绍如何基于用户的协同过滤来构建推荐的实战篇。 2.内容 协同过滤技术在推荐系统中应用的比较广泛,它是一个快速发展的研究领域。它…

    大数据 2021年7月19日