数据中台
-
数据迁移之Sqoop详解大数据
一 简介 Apache Sqoop(TM)是一种用于在Apache Hadoop和结构化数据存储(如关系数据库)之间高效传输批量数据的工具 。 官方下载地址:http:/…
-
Flume配置案例详解大数据
问题导读1.什么是flume2.flume的官方网站在哪里?3.flume有哪些术语?4.如何配置flume数据源码? 一、什么是Flume? flume 作为 clouder…
-
HBase性能优化方法总结(一)详解大数据
一 表的设计 1.1 Pre-Creating Regions 默认情况下,在创建HBase表的时候会自动创建一个region分区,当导入数据的时候,所有的HBase客户…
-
Linux命令大全详解大数据
第一章、linux 的介绍和安装 1.1 linux 操作系统介绍 linux 的创始人 Linus torvalds。 linux 与 GNU 和 minix…
-
协调服务之Zookeeper3.4.10详解大数据
一 Zookeeper概述 1.1 概述 Zookeeper是Google的Chubby一个开源的实现。它是一个针对大型分布式系统的可靠协调系统,提供的功能包括:配置维护、名字服务…
-
Hadoop集群群启脚本详解大数据
一 启动服务 zookeeper hadoop hbase 二 脚本 1 启动集群脚本start-cluster.sh #!/bin/bash echo “************…
-
CentOS7.5之Sqoop1.4.7的安装使用详解大数据
一 Sqoop简介 Apache Sqoop(TM)是一种旨在有效地在 Apache Hadoop 和诸如关系数据库等结构化数据存储之间传输大量数据的工具。 Sqoop 于 201…
-
大数据数据库之HBase1.2.6详解大数据
一 HBaes 介绍 1.1 HBase 的起源 HBase 的原型是 Google 的 BigTa…
-
Spark性能优化指南—基础篇详解大数据
前言 在大数据计算领域,Spark已经成为了越来越流行、越来越受欢迎的计算平台之一。Spark的功能涵盖了大数据领域的离线批处理、SQL类处理、流式/实时计算、机器学习、图计算等各…
-
Spark性能优化指南—高级篇详解大数据
前言 继基础篇讲解了每个Spark开发人员都必须熟知的开发调优与资源调优之后,本文作为《Spark性能优化指南》的高级篇,将深入分析数据倾斜调优与shuffle调优,以解决更加棘手…