数据湖
-
mysql存储过程详解大数据
1. 存储过程简介 我们常用的操作数据库语言SQL语句在执行的时候需要要先编译,然后执行,而存储过程(St…
-
CentOS7.5之Hadoop2.7.6完全分布式集群搭建详解大数据
一 完全分布式集群搭建 Hadoop官方地址:http://hadoop.apache.org/ 1 准备3台客户机 1.2 关闭防火墙,设置静态IP,主机名…
-
编辑器之Sublime Text3、Notepad++详解大数据
Sublime text 3 破解版是一款极其强大的代码编辑器,又是一款可以代替记事本的文本编辑器。Sublime text 3拥有着美观的界面和实用的功能,既能够完成代码的编辑又…
-
Hive的基本操作详解大数据
一 Hive数据类型 1.1 基本数据类型 Hive数据类型 Java数据类型 长度 例子 TINYINT byte 1byte有符号整数 20 SMALINT short 2by…
-
Hive数据仓库与企业级优化详解大数据
一 数据仓库 1 什么是数据仓库 数据仓库,英文名称为Data Warehouse,可简写为DW或DWH。数据仓库,是为企业所有级别的决策制定过程,提供所有类型数据支持的战略集合。…
-
Flume1.7用户手册详解大数据
一 介绍 1.1 概述 Apache Flume是为有效收集聚合和移动大量来自不同源到中心数据存储而设计的可分布,可靠的,可用的系统。 Apache Flume的用途不仅限于日志数…
-
数据迁移之Sqoop详解大数据
一 简介 Apache Sqoop(TM)是一种用于在Apache Hadoop和结构化数据存储(如关系数据库)之间高效传输批量数据的工具 。 官方下载地址:http:/…
-
Flume配置案例详解大数据
问题导读1.什么是flume2.flume的官方网站在哪里?3.flume有哪些术语?4.如何配置flume数据源码? 一、什么是Flume? flume 作为 clouder…
-
HBase性能优化方法总结(一)详解大数据
一 表的设计 1.1 Pre-Creating Regions 默认情况下,在创建HBase表的时候会自动创建一个region分区,当导入数据的时候,所有的HBase客户…
-
Linux命令大全详解大数据
第一章、linux 的介绍和安装 1.1 linux 操作系统介绍 linux 的创始人 Linus torvalds。 linux 与 GNU 和 minix…