区块链
-
Hive学习之路 (十)Hive的高级操作详解大数据
一、负责数据类型 1、array 现有数据如下: 1 huangbo guangzhou,xianggang,shenzhen a1:30,a2:20,a3:100 b…
-
Hive学习之路 (十一)Hive的5个面试题详解大数据
一、求单月访问次数和总访问次数 1、数据说明 数据字段说明 用户名,月份,访问次数 数据格式 A,2015-01,5 A,2015-01,15 B,2015-01,5 A,2015…
-
Hive学习之路 (十二)Hive SQL练习之影评案例详解大数据
案例说明 现有如此三份数据:1、users.dat 数据格式为: 2::M::56::16::70072, 共有6040条数据对应字段为:UserID BigInt, Gender…
-
Hive学习之路 (十三)Hive分析窗口函数(一) SUM,AVG,MIN,MAX详解大数据
数据准备 数据格式 cookie1,2015-04-10,1 cookie1,2015-04-11,5 cookie1,2015-04-12,7 cookie1,2015-04-1…
-
Hive学习之路 (十四)Hive分析窗口函数(二) NTILE,ROW_NUMBER,RANK,DENSE_RANK详解大数据
概述 本文中介绍前几个序列函数,NTILE,ROW_NUMBER,RANK,DENSE_RANK,下面会一一解释各自的用途。 注意: 序列函数不支持WINDOW子句。(ROWS B…
-
Hive学习之路 (十五)Hive分析窗口函数(三) CUME_DIST和PERCENT_RANK详解大数据
这两个序列分析函数不是很常用,这里也练习一下。 数据准备 数据格式 cookie3.txt d1,user1,1000 d1,user2,2000 d1,user3,3…
-
Hive学习之路 (十六)Hive分析窗口函数(四) LAG、LEAD、FIRST_VALUE和LAST_VALUE详解大数据
数据准备 数据格式 cookie4.txt cookie1,2015-04-10 10:00:02,url2 cookie1,2015-04-10 10:00:00,url1 co…
-
Hive学习之路 (十七)Hive分析窗口函数(五) GROUPING SETS、GROUPING__ID、CUBE和ROLLUP详解大数据
概述 GROUPING SETS,GROUPING__ID,CUBE,ROLLUP 这几个分析函数通常用于OLAP中,不能累加,而且需要根据不同维度上钻和下钻的指标统计,比如,分小…
-
Hive学习之路 (十八)Hive的Shell操作详解大数据
一、Hive的命令行 1、Hive支持的一些命令 Command Description quit Use quit or exit to leave the interactiv…
-
Hive学习之路 (十九)Hive的数据倾斜详解大数据
1、什么是数据倾斜? 由于数据分布不均匀,造成数据大量的集中到一点,造成数据热点 2、Hadoop 框架的特性 A、不怕数据大,怕数据倾斜 B、Jobs 数比较多的作业运行…