数据分析
-
Hbase(一)基础知识详解大数据
一、Hbase数据库介绍 1、简介 HBase 是 BigTable 的开源 java …
-
Hive(六)hive执行过程实例分析与hive优化策略详解大数据
一、Hive 执行过程实例分析 1、join 对于 join 操作: SELECT pv.pageid, u.age&n…
-
Hive(五)hive的高级应用详解大数据
一、视图 视图:享用基本表的数据,不会生成另外一份数据创建视图: create view view_name as select …
-
Hive(四)hive函数与hive shell详解大数据
一、hive函数 1、hive内置函数 (1…
-
Hive(三)hive的高级操作详解大数据
一、hive的各种join操作 语法结构: join_table: table_reference JOIN table_factor […
-
Hive(二)hive的基本操作详解大数据
一、DDL操作(定义操作) 1、创建表 (1)建表语法结构 CREATE [EXTERN…
-
Hive(一)基础知识详解大数据
一、Hive的基本概念 (安装的是Apache hive 1.2.1) 1、hive简介  …
-
MapReduce(五) mapreduce的shuffle机制 与 Yarn详解大数据
一、shuffle机制 1、概述 (1)MapReduce 中, map 阶段处理的数据如何传递给 reduce 阶段,是 MapReduce 框架中最关…
-
MapReduce(四) 典型编程场景(二)详解大数据
一、MapJoin-DistributedCache 应用 1、mapreduce join 介绍 在各种实际业务场景中,按照某个关键字对两…
-
MapReduce(三) 典型场景(一)详解大数据
一、mapreduce多job串联 1、需求 一个稍复杂点的处理逻辑往往需要多个 mapreduce 程序串联处理,多 job …