cloudera 授权 Apache Hadoop 管理员培训

Administrator Training for Apache Hadoop

cloudera-hadoop-training

Cloudera 的 Apache Hadoop 培训和认证使你的知识迈上新台阶

Cloudera University 的 Apache Hadoop 四天管理员培训课程为参加者提供了操作和维护 Hadoop 集群必要步骤的全面理解。从安装配置到负载平衡优化,Cloudera 培训课程都是 Hadoop 管理员应对实时挑战最好的准备。

使用 Hadoop

通过指导性的讨论互动和实践,学员将使用 Hadoop 生态系统学习到如下内容:
MapReduce 和 HDFS 的内置及如何搭建 Hadoop 框架
通过合适的集群配置和部署集成系统与数据中心的硬件
如何使用 Flume 加载动态生成文件及使用 Sqoop 连接关系数据库
配置 FairScheduler 为集群多用户提供服务级别协议
为集群安装和实施基于 Kerberos 的安全性
准备和维护 Apache Hadoop
排错,诊断,调优和解决 Hadoop 问题

管理员认证

完成培训的学员将获得 Cloudera Certified Administrator for Apache Hadoop (CCAH) 模拟考试机会,这个认证会帮助你成为这个领域的领导者,给雇主和客户带去切实的技术和专长上的验证

参训相关信息

课程时长:4天

学员基础

本课程适合于具备 linux 简单经验的系统管理员和 IT 经理,无需 Apache Hadoop 经验

授课形式

采取教师讲解和学员上机操作相结合的形式。上机实验有机地穿插在重要课题讲解后,学员能马上学以致用,巩固刚刚所学的概念和知识,转化为自身的技能应用到实战中。我们鼓励学员在课堂上大胆自由地提问,和授课教师进行互动,获得最大的收益。

认证考试

Cloudera Apache Hadoop 资格管理员考试提供业界进行 Hadoop 安装部署及管理调优领域里唯一且最具权威性、并得到全球认可的认证。为企业提供了高质量可以依赖的 Hadoop 管理员,保障了海量数据存储和处理计算平台系统的高质量;为工程师技术人员提供了最新的技术装备,开拓了职业发展。

课程内容纲要

Apache Hadoop 的应用案例

Why Hadoop?
A Brief History of Hadoop
Core Hadoop Components
Fundamental Concepts

Hadoop 分布式文件系统

HDFS Features
Writing and Reading Files
NameNode Considerations
Overview of HDFS Security
Using the Namenode Web UI
Using the Hadoop File Shell

Hadoop 数据载入

Ingesting Data from External Sources with
Flume
Ingesting Data from Relational
Databases with Sqoop
REST Interfaces
Best Practices for Importing Data

MapReduce

What Is MapReduce?
Features of MapReduce
Basic Concepts
Architectural Overview
MapReduce Version 2
Failure Recovery
Using the JobTracker Web UI

规划 Hadoop 机群

General Planning Considerations
Choosing the Right Hardware
Network Considerations
Configuring Nodes
Planning for Cluster Management

Hadoop 安装和基本配置

Deployment Types
Installing Hadoop
Specifying the Hadoop Configuration
Performing Initial HDFS Configuration
Performing Initial MapReduce Configuration
Log File Locations

安装配置 Hive,Impala 和 Pig

Hive
Impala
Pig

Hadoop 客户端

What is a Hadoop Client?
Installing and Configuring Hadoop Clients
Installing and Configuring Hue
Hue Authentication and Configuration

Cloudera 经理

The Motivation for Cloudera Manager
Cloudera Manager Features
Standard and Enterprise

高级配置

Advanced Configuration Parameters
Configuring Hadoop Ports
Explicitly Including and Excluding Hosts
Configuring HDFS for Rack Awareness
Configuring HDFS High Availability

Hadoop 安全

Why Hadoop Security Is Important
Hadoop’s Security System Concepts
What Kerberos Is and How it Works
Securing a Hadoop Cluster with Kerberos

管理和调度作业

Managing Running Jobs
Scheduling Hadoop Jobs
Configuring the FairScheduler

机群维护

Checking HDFS Status
Copying Data Between Clusters
Adding and Removing Cluster Nodes
Rebalancing the Cluster
NameNode Metadata Backup
Cluster Upgrading

机群监测和排错

General System Monitoring
Managing Hadoop’s Log Files
Monitoring Hadoop Clusters
Common Troubleshooting Issues