Hadoop:CCAH及CCA系列认证

一、CCAH Administrator Hadoop管理员认证

认证准备建议:Hadoop管理员培训

考试形式:90分钟;70%通过;60道多项选择题(会提示是单选or多选)

培训内容

通过讲师在课堂上的讲解,以及实操练习,学员将学习以下内容:

Cloudera Manager管理机群的特性,譬如日志汇总、配置管理、报告、报警及服务管理。 YARN、MapReduce、Spark及HDFS的工作原理。

如何为你的机群选取合适的硬件和架构。

如何将 Hadoop 机群和企业已有的系统进行无缝集成。

如何使用Flume 进行实时数据采集以及如何使用Sqoop在RDBMS和Hadoop机群之间进行数据导入导出。

如何配置公平调度器为Hadoop上的多用户提供服务级别保障。

产品环境中Hadoop机群的最佳运维实践。

Hadoop机群排错、诊断问题和性能调优。

培训对象及学员基础

“面向系统管理员和IT 经理,需具备Linux 经验,无需Apache Hadoop 基础。

认证 “结束本课程培训后,我们建议学员准备并注册参加Cloudera 认证 Hadoop 管理员考试(CCAH)。通过并获取该证书是向公司及客户证明个人在Hadoop 领域的技术和专长的有力依据。

 

二、CCA Spark and Hadoop Developer开发者认证

认证准备建议:Spark andHadoop开发者培训

考试形式:120分钟;70%通过;解决10~12基于CDH5机群上需通过实际操作的问题

培训内容

通过讲师在课堂上的讲解,以及实操练习,学员将学习以下内容:

在 Hadoop 机群上进行分布式存储和处理数据。

在 Hadoop 机群上编写、配置和部署 Apache Spark 应用。

使用 Spark shell 进行交互式数据分析。

使用 Spark SQL 查询处理结构化数据。  

使用 Spark Streaming 处理流式数据。

使用 Flume 和 Kafka 为 Spark Streaming 采集流式数据。

培训对象及学员基础

本课程适合于具有编程经验的开发员及工程师。无需 Apache Hadoop 基础,培训内容中对 Apache Spark 的介绍所涉及的代码及练习使用 Scala 和Python,因此需至少掌握这两个编程语言中的一种。需熟练掌握 Linux 命令行。对 SQL 有基本了解。

 

三、CCA Data Analyst数据分析师认证

认证准备建议:DataAnalyst数据分析师培训

考试形式:120分钟;70%通过;解决10~12个客户问题,对于每一个问题,考生必须给出一个满足所有要求的精确的技术解决方案。考生可在群集上使用任何工具或组合使用工具。

培训内容

通过讲师在课堂上的讲解,以及实操练习,学员将熟悉Hadoop生态系统, 学习主题包括:

Pig、Hive 和 Impala 针对数据采集、存储和分析而提供的功能。

Apache Hadoop的基本原理,以及使用Hadoop工具进行数据ETL(提取、

转换和加载)、撷取和处理。

Pig、Hive 和 Impala 是如何提高典型分析任务的处理效率的。

联接多种多样的数据集,以获得有价值的商业洞察力。

执行实时、复杂的数据集查询。

培训对象和学员基础

本课程是专为数据分析师、商业智能专家、开发人员、系统架构师和数据库管理员开发的。培训学员需具备一定的SQL知识水平,且基本熟悉 Linux 命令行。培训学员至少熟悉一种脚本语言知识(例如,Bash 脚本编程、 Perl、Python和 Ruby)将会更有帮助,但不是必需的。此外,培训学员不需要具备Apache Hadoop知识。

原创文章,作者:Maggie-Hunter,如若转载,请注明出处:https://blog.ytso.com/tech/opensource/196975.html

(0)
上一篇 2021年11月17日 01:45
下一篇 2021年11月17日 01:45

相关推荐

发表回复

登录后才能评论