大数据
-
Apache Beam程序向导4
Apache Beam程序向导4 今天在集群上实验Beam On Spark的时候,遇到一个坑爹的问题,这个问题总结起来是一个java.lang.NoClassDefFoundError 错误,具体错误如下图1所示 图1 错误提示 该错误提示SparkStreamingConte…
-
Docker镜像导致centos-root根分区容量爆满
当虚拟机服务器运行Docker久了后,发现Docker的文件越来越大,某天发现此台机上的数据库访问不了了,再重启数据库等日志,提示空间不足,查看磁盘空间: root分区满载啊,前段时间还有不少空间的,查下什么…
-
hadoop的安装与配置
Hadoop版本 Hadoop 有两个主要版本,Hadoop 1.x.y 和 Hadoop 2.x.y 系列.1.x.y大数公司已经更新Hadoop 2.x 版本,本教程均可适用. 基本环境:Centos 6.5 jdk1.7.0_67 hadoop2.5.1 一、配置jdk 1)下载j…
-
学大数据需要什么编程基础?大数据学习步骤是什么?
学大数据需要什么编程基础?大数据学习步骤是什么? 大数据是什么? 有很多朋友问过我,大数据到底是什么?一句话来… 学大数据需要什么编程基础?大数据学习步骤是什么? 学大数据需要什么编程基础?大数据学习步骤…
-
webdriver打开失败方法---chrome与chromedrvier版本对应关系
在运行selenium脚本时,有时突然会碰到提示webdriver打开失败,这个时候极大可能是 Chrome浏览器更新了,与你之前的chromedriver版本出现不兼容,导致selenium调用不了 谷歌浏览器,这个时候就需要升…
-
spark之master与worker通信模型讲解
通信模型架构图 master 端代码 import akka.actor.{Actor, ActorSystem, Props} import com.typesafe.config.ConfigFactory // 需要导入这2个包 封装一些属性。 class Mas…
-
数据中台技术的利与弊
伴随信息时代的发展,新技术、新框架、新语言层出不穷,解决问题的技术视角其实从来没有改变。所有应用都需要和存储系统相关联,无论存储是 SQL 还是 NOSQL 的。业务系统和数据库遵循不同的开发规范,为了让开发更…
-
大数据平台一键安装OS【搭建脚本篇】
定制化大数据平台一键安装OS 大数据平台一键安装OS系列 大数据平台一键安装OS【定制化OS镜像制作】 搭建脚本篇 脚本命名随便,只要能看懂就行 镜像包说明 os1.1.iso 用于安装服务端和客户端操作系统 hdp.iso…
-
层次图和HIPO图---描绘软件结构的图形工具
层次图和HIPO图 层次图用来描述软件的层次结构。虽然层次图的形式和描绘数据结构的层次方框图相同,但是表现的内容却完全不同。层次图中的一个矩形框代表一个模块,方框间的连线表示调用关系而不像层次方框图那样表…
-
MapReduce提交到Yarn上大体执行流程
启动申请提交一个job(wordcount.jar和程序中的配置参数和数据切片规划文件)运行进程为runjar ResouceManager 会在一台节点NodeManager上先启动客户提交的wordcount.jar的主管进程MRAppMasster 由主管进程(MRAppMass…