<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Eddic Training Center &#187; Hadoop</title>
	<atom:link href="http://www.eddic.cn/main/tag/hadoop/feed/" rel="self" type="application/rss+xml" />
	<link>http://www.eddic.cn/main</link>
	<description></description>
	<lastBuildDate>Fri, 18 Mar 2022 11:04:32 +0000</lastBuildDate>
	<language>en-US</language>
		<sy:updatePeriod>hourly</sy:updatePeriod>
		<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.8.1</generator>
	<item>
		<title>Cloudera Training for Hive &amp; Pig</title>
		<link>http://www.eddic.cn/main/cloudera-training-for-hive-pig/</link>
		<comments>http://www.eddic.cn/main/cloudera-training-for-hive-pig/#comments</comments>
		<pubDate>Fri, 01 Apr 2016 12:39:14 +0000</pubDate>
		<dc:creator><![CDATA[Eddic Training Center]]></dc:creator>
				<category><![CDATA[课程 Courses]]></category>
		<category><![CDATA[Hadoop]]></category>
		<category><![CDATA[IT 服务管理]]></category>

		<guid isPermaLink="false">http://www.eddic.cn/main/?p=1047</guid>
		<description><![CDATA[cloudera 授权 Hive 和 Pig 培训 Cloudera Training for Hive &#038; Pig Cloudera 的 Apache Hadoop 培训和认证使你的知识迈上新台阶 专门为数据分析和数据挖掘人员量身定做的培训科目。学员将学习和掌握使用高级脚本语言或类 SQL 语言来编写 MapReduce 任务，而无需掌握 Java 编程语言和熟悉 Hadoop API。通过掌握 Hive 和/或 Pig，将极大缩短数据分析人员设计编写和调试常见数据分析问题的周期，提高工作效率；从而为企业节省费用，缩短分析结果市场化的周期。 主要内容 Hive 如何扩展 MapReduce 如何使用 Hive 创建和操作表 Hive 基本和高级数据类型 对数据进行分区和分组 高级 Hive 特性 如何用 Pig 加载和操作数据 PigLatin 编程语言的特性 用 Pig 解决实际数据分析问题 参训相关信息 课程时长：2天 学员基础 应具备基本 SQL(...)]]></description>
				<content:encoded><![CDATA[<h3>cloudera 授权 Hive 和 Pig 培训</h3>
<h1>Cloudera Training for Hive &#038; Pig</h1>
<p><img src="http://www.eddic.cn/main/wp-content/uploads/2016/04/cloudera-hadoop-training7.jpg" alt="cloudera-hadoop-training" width="1956" height="640" class="alignnone size-full wp-image-2175" /></p>
<div class="w768">
<h4 style="font-size:24px; color:#14AECF; margin-bottom:24px;">Cloudera 的 Apache Hadoop 培训和认证使你的知识迈上新台阶</h4>
<p>专门为数据分析和数据挖掘人员量身定做的培训科目。学员将学习和掌握使用高级脚本语言或类 SQL 语言来编写 MapReduce 任务，而无需掌握 Java 编程语言和熟悉 Hadoop API。通过掌握 Hive 和/或 Pig，将极大缩短数据分析人员设计编写和调试常见数据分析问题的周期，提高工作效率；从而为企业节省费用，缩短分析结果市场化的周期。</p>
<h3>主要内容</h3>
<p>Hive 如何扩展 MapReduce<br />
如何使用 Hive 创建和操作表<br />
Hive 基本和高级数据类型<br />
对数据进行分区和分组<br />
高级 Hive 特性<br />
如何用 Pig 加载和操作数据<br />
PigLatin 编程语言的特性<br />
用 Pig 解决实际数据分析问题
</p></div>
<h2>参训相关信息</h2>
<div class="w768">
<h3>课程时长：2天</h3>
<h3>学员基础</h3>
<p>应具备基本 SQL 或者高级脚本语言编程经验；对 Hadoop 组成和工作原理有基本了解。</p>
<h3>授课形式</h3>
<p>采取教师讲解和学员上机操作相结合的形式。上机实验有机地穿插在重要课题讲解后，学员能马上学以致用，巩固刚刚所学的概念和知识，转化为自身的技能应用到实战中。我们鼓励学员在课堂上大胆自由地提问，和授课教师进行互动，获得最大的收益。
</p></div>
<h2>课程内容纲要</h2>
<div class="w768">
<h3>Hive 导引</h3>
<p>什么是 Hadoop<br />
Hive 的动机</p>
<h3>将数据导入到 Hive</h3>
<p>Hive 体系结构<br />
创建 Hive 表<br />
导入数据<br />
创建不同的数据库<br />
上机实验</p>
<h3>Hive 数据操作</h3>
<p>使用 SELECT 语句检索数据<br />
合并表格<br />
将查询结果存入 HDFS<br />
基本 Hive 函数<br />
上机实验</p>
<h3>对数据进行分区和分组</h3>
<p>数据分区<br />
数据分组<br />
上机实验</p>
<h3>Hive 高级特性</h3>
<p>更多高级 HiveQL 表<br />
Hive 变量<br />
创建用户自定义函数<br />
跟踪调试 Hive 查询</p>
<h3>Hive 最佳实践</h3>
<p>配置共享元数据<br />
处理日期<br />
使用 SerDes</p>
<h3>Pig 读写数据</h3>
<p>加载数据<br />
Pig 数据结构<br />
写数据<br />
上机实验</p>
<h3>PigLatin 深入</h3>
<p>数据过滤<br />
数据分组和排序<br />
Pig 表达式和函数<br />
合并多个数据集<br />
验证数据集<br />
高级性能（例如 COGROUP 和 STREAM）<br />
上机实验</p>
<h3>调试 Pig 代码</h3>
<p>调试 Pig 程序策略<br />
处理坏数据<br />
使用 ILLUSTRATE</p>
<h3>Pig 最佳实践</h3>
<p>一般性实战经验<br />
产品化 Pig 代码性能优化</p>
<h3>发挥 Hive 和 Pig 优势</h3>
<p>什么情况下使用 Hive<br />
什么情况下使用 Pig
</p></div>
<div id="themify_builder_content-1047" data-postid="1047" class="themify_builder_content themify_builder_content-1047 themify_builder themify_builder_front">
	
	
</div>
<!-- /themify_builder_content -->]]></content:encoded>
			<wfw:commentRss>http://www.eddic.cn/main/cloudera-training-for-hive-pig/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Cloudera Training for Apache HBase</title>
		<link>http://www.eddic.cn/main/cloudera-training-for-apache-hbase/</link>
		<comments>http://www.eddic.cn/main/cloudera-training-for-apache-hbase/#comments</comments>
		<pubDate>Fri, 01 Apr 2016 10:30:41 +0000</pubDate>
		<dc:creator><![CDATA[Eddic Training Center]]></dc:creator>
				<category><![CDATA[课程 Courses]]></category>
		<category><![CDATA[Hadoop]]></category>
		<category><![CDATA[IT 服务管理]]></category>

		<guid isPermaLink="false">http://www.eddic.cn/main/?p=2177</guid>
		<description><![CDATA[cloudera 授权 Apache HBase 培训 Cloudera Training for Apache HBase Cloudera 的 Apache Hadoop 培训和认证使你的知识迈上新台阶 Cloudera University 四天的 Apache HBase 培训课程使学员能够储存和访问大量多结构数据及完成每秒数以百计的运行。 提升你的生态系统技术 Apache HBase 是一个机遇 Apache Hadoop 的分布式、可扩展、非关系型数据库。HBase 可以在由数十亿行和数以百万计列组成的大量表格里储存数据，实时为用户和应用提供数据，实现快速随机的读写访问。 使用 Hadoop 通过指导性的讨论互动和实践，学员将使用 Hadoop 生态系统学习到如下内容： HBase、Hadoop、RDBMS 的应用案例和使用场合 如何使用 HBase shell 来直接操作 HBase 数据 如何优化设计 HBase schemas 来进行有效的数据存储和恢复 学习使用 HBase 的 Java API 如何发现和解决性能问题 HBase 认证 完成培训的学员将获得(...)]]></description>
				<content:encoded><![CDATA[<h3>cloudera 授权 Apache HBase 培训</h3>
<h1>Cloudera Training for Apache HBase</h1>
<p><img src="http://www.eddic.cn/main/wp-content/uploads/2016/04/cloudera-hadoop-training6.jpg" alt="cloudera-hadoop-training" width="1956" height="640" class="alignnone size-full wp-image-2174" /></p>
<div class="w768">
<h4 style="font-size:24px; color:#14AECF; margin-bottom:24px;">Cloudera 的 Apache Hadoop 培训和认证使你的知识迈上新台阶</h4>
<p>Cloudera University 四天的 Apache HBase 培训课程使学员能够储存和访问大量多结构数据及完成每秒数以百计的运行。</p>
<h3>提升你的生态系统技术</h3>
<p>Apache HBase 是一个机遇 Apache Hadoop 的分布式、可扩展、非关系型数据库。HBase 可以在由数十亿行和数以百万计列组成的大量表格里储存数据，实时为用户和应用提供数据，实现快速随机的读写访问。</p>
<h3>使用 Hadoop</h3>
<p>通过指导性的讨论互动和实践，学员将使用 Hadoop 生态系统学习到如下内容：<br />
HBase、Hadoop、RDBMS 的应用案例和使用场合<br />
如何使用 HBase shell 来直接操作 HBase 数据<br />
如何优化设计 HBase schemas 来进行有效的数据存储和恢复<br />
学习使用 HBase 的 Java API<br />
如何发现和解决性能问题</p>
<h3>HBase 认证</h3>
<p>完成培训的学员将获得 Cloudera Certified Specialist in Apache HBase (CCSHB) 模拟考试机会，这个认证会帮助你成为这个领域的领导者，给雇主和客户带去切实的技术和专长上的验证。
</p></div>
<h2>参训相关信息</h2>
<div class="w768">
<h3>课程时长：4天</h3>
<h3>学员基础</h3>
<p>本课程适合于准备使用 HBase 的开发员和系统管理员；<br />
具备数据库和数据建模的基础和经验将对本课程的学习有所帮助，但不是必需的；<br />
具备 Java 基础和经验将有所帮助，无需 Hadoop 经验；<br />
Cloudera 的 Hadoop 开发员培训可以作为前序课程。</p>
<h3>授课形式</h3>
<p>采取教师讲解和学员上机操作相结合的形式。上机实验有机地穿插在重要课题讲解后，学员能马上学以致用，巩固刚刚所学的概念和知识，转化为自身的技能应用到实战中。我们鼓励学员在课堂上大胆自由地提问，和授课教师进行互动，获得最大的收益。
</p></div>
<h2>课程内容纲要</h2>
<div class="w768">
<h3>Hadoop 介绍</h3>
<p>What Is Big Data?<br />
Introducing Hadoop<br />
Hadoop Components</p>
<h3>HBase 介绍</h3>
<p>What Is HBase?<br />
Why Use HBase?<br />
HBase and RDBMS<br />
The Give and Take of HBase</p>
<h3>HBase 基本概念</h3>
<p>HBase Concepts<br />
Working with HBase</p>
<h3>HBase 管理 API</h3>
<p>HBase Shell<br />
Creating Tables<br />
HBase Java API<br />
Administration Calls</p>
<h3>HBase 数据访问 API (1)</h3>
<p>API Usage<br />
Getting Data from the Shell, Java API, and Thrift API<br />
Adding and Updating Data in the Shell<br />
Driving Data from the Shell, Java API, and Thrift API</p>
<h3>HBase 数据访问 API (2)</h3>
<p>Adding and Updating Data with the API<br />
The Scan API<br />
Advanced API<br />
Working with Eclipse</p>
<h3>HBase 体系结构 (1)</h3>
<p>Cluster Components<br />
How HBase Scales</p>
<h3>HBase 体系结构 (2)</h3>
<p>HBase Write Paths<br />
HBase Read Paths<br />
Compactions and Splits</p>
<h3>HBase 安装和配置</h3>
<p>HBase Installation<br />
Hardware Considerations<br />
HBase Configuration<br />
MapReduce and HBase Clusters<br />
Replication and Disaster Recovery</p>
<h3>HBase Row Key 设计</h3>
<p>From RDBMS to HBase Schema Design<br />
Application-Centric Design<br />
Row Key Design</p>
<h3>HBase Schema 设计</h3>
<p>Column Families<br />
Schema Design Considerations<br />
Hotspotting</p>
<h3>HBase 生态系统介绍</h3>
<p>OpenTSDB<br />
Kiji<br />
HBase and Hive
</p></div>
<div id="themify_builder_content-2177" data-postid="2177" class="themify_builder_content themify_builder_content-2177 themify_builder themify_builder_front">
	
	
</div>
<!-- /themify_builder_content -->]]></content:encoded>
			<wfw:commentRss>http://www.eddic.cn/main/cloudera-training-for-apache-hbase/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Cloudera Data Analyst Training: Using Pig, Hive and Impala with Hadoop</title>
		<link>http://www.eddic.cn/main/cloudera-data-analyst-training-using-pig-hive-and-impala-with-hadoop/</link>
		<comments>http://www.eddic.cn/main/cloudera-data-analyst-training-using-pig-hive-and-impala-with-hadoop/#comments</comments>
		<pubDate>Fri, 01 Apr 2016 08:09:55 +0000</pubDate>
		<dc:creator><![CDATA[Eddic Training Center]]></dc:creator>
				<category><![CDATA[课程 Courses]]></category>
		<category><![CDATA[Hadoop]]></category>
		<category><![CDATA[IT 服务管理]]></category>

		<guid isPermaLink="false">http://www.eddic.cn/main/?p=2164</guid>
		<description><![CDATA[cloudera 授权 Apache Hadoop 数据分析员培训 Cloudera Data Analyst Training:Using Pig, Hive and Impala with Hadoop Cloudera 的 Apache Hadoop 培训和认证使你的知识迈上新台阶 Cloudera University 三天的数据分析员课程会教你把传统数据分析和商业智能技术应用于大数据。Cloudera 展示专业数据工具来访问，操纵和分析使用 SQL 和常见脚本语言的复杂数据集。 提升你的生态系统技术 Apache Hive 使得分析师、数据库管理员和其他无 Java 编程技术的人能使用多结构数据。Apache Pig 把常见脚本语言的基础原则应用于 hadoop 集群。Cloudera Impala 使得实时交互式数据分析通过本地 SQL 存储在 hadoop。 使用 Hadoop 通过指导性的讨论互动和实践，学员将使用 Hadoop 生态系统学习到如下内容： Apache Hadoop 基础及数据 ETL（包括数据提取、转换及加载）、Hadoop 相关工具使用 如何使用 Apache Pig 对多数据集进行(...)]]></description>
				<content:encoded><![CDATA[<h3>cloudera 授权 Apache Hadoop 数据分析员培训</h3>
<h1>Cloudera Data Analyst Training:<br />Using Pig, Hive and Impala with Hadoop</h1>
<p><img src="http://www.eddic.cn/main/wp-content/uploads/2016/04/cloudera-hadoop-training.jpg" alt="cloudera-hadoop-training" width="1956" height="640" class="alignnone size-full wp-image-2146" /></p>
<div class="w768">
<h4 style="font-size:24px; color:#14AECF; margin-bottom:24px;">Cloudera 的 Apache Hadoop 培训和认证使你的知识迈上新台阶</h4>
<p>Cloudera University 三天的数据分析员课程会教你把传统数据分析和商业智能技术应用于大数据。Cloudera 展示专业数据工具来访问，操纵和分析使用 SQL 和常见脚本语言的复杂数据集。</p>
<h3>提升你的生态系统技术</h3>
<p>Apache Hive 使得分析师、数据库管理员和其他无 Java 编程技术的人能使用多结构数据。Apache Pig 把常见脚本语言的基础原则应用于 hadoop 集群。Cloudera Impala 使得实时交互式数据分析通过本地 SQL 存储在 hadoop。</p>
<h3>使用 Hadoop</h3>
<p>通过指导性的讨论互动和实践，学员将使用 Hadoop 生态系统学习到如下内容：<br />
Apache Hadoop 基础及数据 ETL（包括数据提取、转换及加载）、Hadoop 相关工具使用<br />
如何使用 Apache Pig 对多数据集进行 join 操作以及分析独立数据<br />
如何使用 Apache Hive：通过定义合适的表来组织数据、执行各种数据变换、简化复杂查询<br />
如何使用 Impala 来对存储在 HDFS 里的大规模数据进行实时和交互式的分析查询<br />
如何根据数据分析任务来选择合适的数据分析工具
</p></div>
<h2>参训相关信息</h2>
<div class="w768">
<h3>课程时长：3天</h3>
<h3>学员基础</h3>
<p>本课程适合于具备 SQL、基本 UNIX/Linux 命令经验的 数据分析员、商业分析员以及系统管理员，无需 Apache Hadoop 经验</p>
<h3>授课形式</h3>
<p>采取教师讲解和学员上机操作相结合的形式。上机实验有机地穿插在重要课题讲解后，学员能马上学以致用，巩固刚刚所学的概念和知识，转化为自身的技能应用到实战中。我们鼓励学员在课堂上大胆自由地提问，和授课教师进行互动，获得最大的收益。
</p></div>
<h2>课程内容纲要</h2>
<div class="w768">
<h3>Hadoop 基础</h3>
<p>The Motivation for Hadoop<br />
Hadoop Overview<br />
HDFS<br />
MapReduce<br />
The Hadoop Ecosystem<br />
Lab Scenario Explanation<br />
Hands-On Exercise: Data Ingest with</p>
<h3>Pig 介绍</h3>
<p>What Is Pig?<br />
Pig’s Features<br />
Pig Use Cases<br />
Interacting with Pig</p>
<h3>使用 Pig 进行简单数据分析</h3>
<p>Pig Latin Syntax<br />
Loading Data<br />
Simple Data Types<br />
Field Definitions<br />
Data Output<br />
Viewing the Schema<br />
Filtering and Sorting Data<br />
Commonly-Used Functions<br />
Hands-On Exercise: Using Pig for ETL Processing </p>
<h3>使用 Pig 处理复杂数据</h3>
<p>Storage Formats<br />
Complex/Nested Data Types<br />
Grouping<br />
Built-in Functions for Complex Data<br />
Iterating Grouped Data<br />
Hands-On Exercise: Analyzing Ad Campaign Data with Pig</p>
<h3>使用 Pig 分析处理多数据集</h3>
<p>Techniques for Combining Data Sets<br />
Joining Data Sets in Pig<br />
Set Operations<br />
Splitting Data Sets<br />
Hands-On Exercise: Analyzing Disparate Data Sets with Pig</p>
<h3>扩展 Pig</h3>
<p>Adding Flexibility with Parameters<br />
Macros and Imports<br />
UDFs<br />
Contributed Functions<br />
Using Other Languages to Process Data with Pig<br />
Hands-On Exercise: Extending Pig with Streaming and UDFs</p>
<h3>Pig 排错和优化</h3>
<p>Troubleshooting Pig<br />
Logging<br />
Using Hadoop’s Web UI<br />
Optional Demo: Troubleshooting a Failed Job with the Web UI<br />
Data Sampling and Debugging<br />
Performance Overview<br />
Understanding the Execution Plan<br />
Tips for Improving the Performance of Your Pig Jobs</p>
<h3>Hive 介绍</h3>
<p>What Is Hive?<br />
Hive Schema and Data Storage<br />
Comparing Hive to Traditional Databases<br />
Hive vs. Pig<br />
Hive Use Cases<br />
Interacting with Hive</p>
<h3>使用 Hive 进行数据分析</h3>
<p>Hive Databases and Tables<br />
Basic HiveQL Syntax<br />
Data Types<br />
Joining Data Sets<br />
Common Built-in Functions<br />
Hands-On Exercise: Running Hive<br />
Queries on the Shell, Scripts, and Hue</p>
<h3>Hive 数据管理</h3>
<p>Hive Data Formats<br />
Creating Databases and Hive-Managed Tables<br />
Loading Data into Hive<br />
Altering Databases and Tables<br />
Self-Managed Tables<br />
Simplifying Queries with Views<br />
Storing Query Results<br />
Controlling Access to Data<br />
Hands-On Exercise: Data Management</p>
<h3>使用 Hive 分析处理文本数据</h3>
<p>Overview of Text Processing<br />
Important String Functions<br />
Using Regular Expressions in Hive<br />
Sentiment Analysis and N-Grams<br />
Hands-On Exercise (Optional): Gaining Insight with Sentiment<br />
Analysis</p>
<h3>Hive 优化</h3>
<p>Understanding Query Performance<br />
Controlling Job Execution Plan<br />
Partitioning<br />
Bucketing<br />
Indexing Data</p>
<h3>扩展 Hive</h3>
<p>SerDes<br />
Data Transformation with Custom Scripts<br />
User-Defined Functions<br />
Parameterized Queries<br />
Hands-On Exercise: Data Transformation with Hive</p>
<h3>Impala 介绍</h3>
<p>What is Impala?<br />
How Impala Differs from Hive and Pig<br />
How Impala Differs from Relational Databases<br />
Limitations and Future Directions<br />
Using the Impala Shell</p>
<h3>使用 Impala 进行数据分析</h3>
<p>Basic Syntax<br />
Data Types<br />
Filtering, Sorting, and Limiting Results<br />
Joining and Grouping Data<br />
Improving Impala Performance<br />
Hands-On Exercise: Interactive Analysis with Impala</p>
<h3>如何选取数据分析工具</h3>
<p>Comparing MapReduce, Pig, Hive, Impala, and Relational Databases<br />
Which to Choose?
</p></div>
<div id="themify_builder_content-2164" data-postid="2164" class="themify_builder_content themify_builder_content-2164 themify_builder themify_builder_front">
	
	
</div>
<!-- /themify_builder_content -->]]></content:encoded>
			<wfw:commentRss>http://www.eddic.cn/main/cloudera-data-analyst-training-using-pig-hive-and-impala-with-hadoop/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Cloudera Administrator Training for Apache Hadoop</title>
		<link>http://www.eddic.cn/main/administrator-training-for-apache-hadoop/</link>
		<comments>http://www.eddic.cn/main/administrator-training-for-apache-hadoop/#comments</comments>
		<pubDate>Fri, 01 Apr 2016 07:46:19 +0000</pubDate>
		<dc:creator><![CDATA[Eddic Training Center]]></dc:creator>
				<category><![CDATA[课程 Courses]]></category>
		<category><![CDATA[Hadoop]]></category>
		<category><![CDATA[IT 服务管理]]></category>

		<guid isPermaLink="false">http://www.eddic.cn/main/?p=2160</guid>
		<description><![CDATA[cloudera 授权 Apache Hadoop 管理员培训 Administrator Training for Apache Hadoop Cloudera 的 Apache Hadoop 培训和认证使你的知识迈上新台阶 Cloudera University 的 Apache Hadoop 四天管理员培训课程为参加者提供了操作和维护 Hadoop 集群必要步骤的全面理解。从安装配置到负载平衡优化，Cloudera 培训课程都是 Hadoop 管理员应对实时挑战最好的准备。 使用 Hadoop 通过指导性的讨论互动和实践，学员将使用 Hadoop 生态系统学习到如下内容： MapReduce 和 HDFS 的内置及如何搭建 Hadoop 框架 通过合适的集群配置和部署集成系统与数据中心的硬件 如何使用 Flume 加载动态生成文件及使用 Sqoop 连接关系数据库 配置 FairScheduler 为集群多用户提供服务级别协议 为集群安装和实施基于 Kerberos 的安全性 准备和维护 Apache Hadoop 排错，诊断，调优和解决 Hadoop 问题(...)]]></description>
				<content:encoded><![CDATA[<h3>cloudera 授权 Apache Hadoop 管理员培训</h3>
<h1>Administrator Training for Apache Hadoop</h1>
<p><img src="http://www.eddic.cn/main/wp-content/uploads/2016/04/cloudera-hadoop-training2.jpg" alt="cloudera-hadoop-training" width="1956" height="640" class="alignnone size-full wp-image-2168" /></p>
<div class="w768">
<h4 style="font-size:24px; color:#14AECF; margin-bottom:24px;">Cloudera 的 Apache Hadoop 培训和认证使你的知识迈上新台阶</h4>
<p>Cloudera University 的 Apache Hadoop 四天管理员培训课程为参加者提供了操作和维护 Hadoop 集群必要步骤的全面理解。从安装配置到负载平衡优化，Cloudera 培训课程都是 Hadoop 管理员应对实时挑战最好的准备。</p>
<h3>使用 Hadoop</h3>
<p>通过指导性的讨论互动和实践，学员将使用 Hadoop 生态系统学习到如下内容：<br />
MapReduce 和 HDFS 的内置及如何搭建 Hadoop 框架<br />
通过合适的集群配置和部署集成系统与数据中心的硬件<br />
如何使用 Flume 加载动态生成文件及使用 Sqoop 连接关系数据库<br />
配置 FairScheduler 为集群多用户提供服务级别协议<br />
为集群安装和实施基于 Kerberos 的安全性<br />
准备和维护 Apache Hadoop<br />
排错，诊断，调优和解决 Hadoop 问题</p>
<h3>管理员认证</h3>
<p>完成培训的学员将获得 Cloudera Certified Administrator for Apache Hadoop (CCAH) 模拟考试机会，这个认证会帮助你成为这个领域的领导者，给雇主和客户带去切实的技术和专长上的验证
</p></div>
<h2>参训相关信息</h2>
<div class="w768">
<h3>课程时长：4天</h3>
<h3>学员基础</h3>
<p>本课程适合于具备 linux 简单经验的系统管理员和 IT 经理，无需 Apache Hadoop 经验</p>
<h3>授课形式</h3>
<p>采取教师讲解和学员上机操作相结合的形式。上机实验有机地穿插在重要课题讲解后，学员能马上学以致用，巩固刚刚所学的概念和知识，转化为自身的技能应用到实战中。我们鼓励学员在课堂上大胆自由地提问，和授课教师进行互动，获得最大的收益。</p>
<h3>认证考试</h3>
<p>Cloudera Apache Hadoop 资格管理员考试提供业界进行 Hadoop 安装部署及管理调优领域里唯一且最具权威性、并得到全球认可的认证。为企业提供了高质量可以依赖的 Hadoop 管理员，保障了海量数据存储和处理计算平台系统的高质量；为工程师技术人员提供了最新的技术装备，开拓了职业发展。
</p></div>
<h2>课程内容纲要</h2>
<div class="w768">
<h3>Apache Hadoop 的应用案例</h3>
<p>Why Hadoop?<br />
A Brief History of Hadoop<br />
Core Hadoop Components<br />
Fundamental Concepts</p>
<h3>Hadoop 分布式文件系统</h3>
<p>HDFS Features<br />
Writing and Reading Files<br />
NameNode Considerations<br />
Overview of HDFS Security<br />
Using the Namenode Web UI<br />
Using the Hadoop File Shell</p>
<h3>Hadoop 数据载入</h3>
<p>Ingesting Data from External Sources with<br />
Flume<br />
Ingesting Data from Relational<br />
Databases with Sqoop<br />
REST Interfaces<br />
Best Practices for Importing Data</p>
<h3>MapReduce</h3>
<p>What Is MapReduce?<br />
Features of MapReduce<br />
Basic Concepts<br />
Architectural Overview<br />
MapReduce Version 2<br />
Failure Recovery<br />
Using the JobTracker Web UI</p>
<h3>规划 Hadoop 机群</h3>
<p>General Planning Considerations<br />
Choosing the Right Hardware<br />
Network Considerations<br />
Configuring Nodes<br />
Planning for Cluster Management</p>
<h3>Hadoop 安装和基本配置</h3>
<p>Deployment Types<br />
Installing Hadoop<br />
Specifying the Hadoop Configuration<br />
Performing Initial HDFS Configuration<br />
Performing Initial MapReduce Configuration<br />
Log File Locations</p>
<h3>安装配置 Hive,Impala 和 Pig</h3>
<p>Hive<br />
Impala<br />
Pig</p>
<h3>Hadoop 客户端</h3>
<p>What is a Hadoop Client?<br />
Installing and Configuring Hadoop Clients<br />
Installing and Configuring Hue<br />
Hue Authentication and Configuration</p>
<h3>Cloudera 经理</h3>
<p>The Motivation for Cloudera Manager<br />
Cloudera Manager Features<br />
Standard and Enterprise</p>
<h3>高级配置</h3>
<p>Advanced Configuration Parameters<br />
Configuring Hadoop Ports<br />
Explicitly Including and Excluding Hosts<br />
Configuring HDFS for Rack Awareness<br />
Configuring HDFS High Availability</p>
<h3>Hadoop 安全</h3>
<p>Why Hadoop Security Is Important<br />
Hadoop’s Security System Concepts<br />
What Kerberos Is and How it Works<br />
Securing a Hadoop Cluster with Kerberos</p>
<h3>管理和调度作业</h3>
<p>Managing Running Jobs<br />
Scheduling Hadoop Jobs<br />
Configuring the FairScheduler</p>
<h3>机群维护</h3>
<p>Checking HDFS Status<br />
Copying Data Between Clusters<br />
Adding and Removing Cluster Nodes<br />
Rebalancing the Cluster<br />
NameNode Metadata Backup<br />
Cluster Upgrading</p>
<h3>机群监测和排错</h3>
<p>General System Monitoring<br />
Managing Hadoop’s Log Files<br />
Monitoring Hadoop Clusters<br />
Common Troubleshooting Issues
</p></div>
<div id="themify_builder_content-2160" data-postid="2160" class="themify_builder_content themify_builder_content-2160 themify_builder themify_builder_front">
	
	
</div>
<!-- /themify_builder_content -->]]></content:encoded>
			<wfw:commentRss>http://www.eddic.cn/main/administrator-training-for-apache-hadoop/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Cloudera Developer Training for Apache Hadoop</title>
		<link>http://www.eddic.cn/main/developer-training-for-apache-hadoop/</link>
		<comments>http://www.eddic.cn/main/developer-training-for-apache-hadoop/#comments</comments>
		<pubDate>Fri, 01 Apr 2016 04:44:02 +0000</pubDate>
		<dc:creator><![CDATA[Eddic Training Center]]></dc:creator>
				<category><![CDATA[课程 Courses]]></category>
		<category><![CDATA[Hadoop]]></category>
		<category><![CDATA[IT 服务管理]]></category>

		<guid isPermaLink="false">http://www.eddic.cn/main/?p=2140</guid>
		<description><![CDATA[cloudera 授权 Apache Hadoop 开发员培训 Developer Training for Apache Hadoop Cloudera 的 Apache Hadoop 培训和认证使你的知识迈上新台阶 Cloudera University 四天的开发员培训课程传达了关键概念和技术，给学员创造使用 Hadoop 的稳健数据分析处理应用。从工作流实现和 APIs 工作到写 MapReduce 代码，Cloudera 的培训课程都是 Hadoop 开发员应对实时挑战最好的准备。 使用 Hadoop 通过指导性的讨论互动和实践，学员将使用 Hadoop 生态系统学习到如下内容： MapReduce 和 HDFS 核心以及如何书写 MapReduce 代码 Hadoop 发展，调试，工作流实现和常见算法的实践 如何平衡 Hive，Pig，Sqoop，Flume，Oozie，Mahout 和其他 Hadoop 生态系统项目 最佳硬件配置和网络把 hadoop 嵌入数据中心 如何用 MapReduce 来联结数据集 实时数据分析的先进 hadoop API 主题(...)]]></description>
				<content:encoded><![CDATA[<h3>cloudera 授权 Apache Hadoop 开发员培训</h3>
<h1>Developer Training for Apache Hadoop</h1>
<p><img src="http://www.eddic.cn/main/wp-content/uploads/2016/04/cloudera-hadoop-training1.jpg" alt="cloudera-hadoop-training" width="1956" height="640" class="alignnone size-full wp-image-2166" /></p>
<div class="w768">
<h4 style="font-size:24px; color:#14AECF; margin-bottom:24px;">Cloudera 的 Apache Hadoop 培训和认证使你的知识迈上新台阶</h4>
<p>Cloudera University 四天的开发员培训课程传达了关键概念和技术，给学员创造使用 Hadoop 的稳健数据分析处理应用。从工作流实现和 APIs 工作到写 MapReduce 代码，Cloudera 的培训课程都是 Hadoop 开发员应对实时挑战最好的准备。</p>
<h3>使用 Hadoop</h3>
<p>通过指导性的讨论互动和实践，学员将使用 Hadoop 生态系统学习到如下内容：<br />
MapReduce 和 HDFS 核心以及如何书写 MapReduce 代码<br />
Hadoop 发展，调试，工作流实现和常见算法的实践<br />
如何平衡 Hive，Pig，Sqoop，Flume，Oozie，Mahout 和其他 Hadoop 生态系统项目<br />
最佳硬件配置和网络把 hadoop 嵌入数据中心<br />
如何用 MapReduce 来联结数据集<br />
实时数据分析的先进 hadoop API 主题</p>
<h3>开发员认证</h3>
<p>完成培训的学员将获得 Cloudera Certified Developer for Apache Hadoop (CCDH) 模拟考试机会，这个认证会帮助你成为这个领域的领导者，给雇主和客户带去切实的技术和专长上的验证。
</p></div>
<h2>参训相关信息</h2>
<div class="w768">
<h3>课程时长：4天</h3>
<h3>学员基础</h3>
<p>本课程适合于具备编程经验的开发员和工程师，尤其需要 Java 方面的技能和经验</p>
<h3>授课形式</h3>
<p>采取教师讲解和学员上机操作相结合的形式。上机实验有机地穿插在重要课题讲解后，学员能马上学以致用，巩固刚刚所学的概念和知识，转化为自身的技能应用到实战中。我们鼓励学员在课堂上大胆自由地提问，和授课教师进行互动，获得最大的收益。</p>
<h3>认证考试</h3>
<p>Cloudera Apache Hadoop 资格开发员考试提供 Hadoop 上软件开发在业界唯一且最具权威性、并得到全球认可的认证。为企业提供高质量保证的 Hadoop 开发人员；为工程师技术人员提供了最新的技术装备，开拓了职业发展。
</p></div>
<h2>课程内容纲要</h2>
<div class="w768">
<h3>Hadoop 动机</h3>
<p>Problems with Traditional<br />
Large-Scale Systems<br />
Introducing Hadoop<br />
Hadoopable Problems</p>
<h3>Hadoop 基本概念和 HDFS</h3>
<p>The Hadoop Project and Hadoop Components<br />
The Hadoop Distributed File System</p>
<h3>MapReduce 介绍</h3>
<p>MapReduce Overview<br />
Example: WordCount<br />
Mappers<br />
Reducers</p>
<h3>Hadoop 集群和 Hadoop 生态系统</h3>
<p>Hadoop Cluster Overview<br />
Hadoop Jobs and Tasks<br />
Other Hadoop Ecosystem Components</p>
<h3>使用 Java 编写 MapReduce 程序</h3>
<p>Basic MapReduce API Concepts<br />
Writing MapReduce Drivers, Mappers, and Reducers in Java<br />
Speeding Up Hadoop Development by Using Eclipse<br />
Differences Between the Old and New MapReduce APIs</p>
<h3>使用 Streaming 编写 MapReduce 程序</h3>
<p>Writing Mappers and Reducers with the Streaming API</p>
<h3>MapReduce 单元测试</h3>
<p>Unit Testing<br />
The JUnit and MRUnit Testing Frameworks<br />
Writing Unit Tests with MRUnit<br />
Running Unit Tests</p>
<h3>深入 Hadoop API</h3>
<p>Using the ToolRunner Class<br />
Setting Up and Tearing Down Mappers and Reducers<br />
Decreasing the Amount of Intermediate Data with Combiners<br />
Accessing HDFS Programmatically<br />
Using The Distributed Cache<br />
Using the Hadoop API’s Library of Mappers, Reducers and Partitioners</p>
<h3>开发技巧</h3>
<p>Strategies for Debugging MapReduce Code<br />
Testing MapReduce Code Locally by Using LocalJobRunner<br />
Writing and Viewing Log Files<br />
Retrieving Job Information with Counters<br />
Reusing Objects<br />
Creating Map-Only MapReduce Jobs</p>
<h3>Reducer 和 Partitioner</h3>
<p>How Partitioners and Reducers Work Together<br />
Determining the Optimal Number of Reducers for a Job<br />
Writing Customer Partitioners</p>
<h3>数据输入/输出</h3>
<p>Creating Custom Writable and Writable-Comparable Implementations<br />
Saving Binary Data Using SequenceFile and Avro Data Files<br />
Issues to Consider When Using File Compression<br />
Implementing Custom InputFormats and OutputFormats
</p></div>
<div id="themify_builder_content-2140" data-postid="2140" class="themify_builder_content themify_builder_content-2140 themify_builder themify_builder_front">
	
	
</div>
<!-- /themify_builder_content -->]]></content:encoded>
			<wfw:commentRss>http://www.eddic.cn/main/developer-training-for-apache-hadoop/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>大数据培训课程</title>
		<link>http://www.eddic.cn/main/big-data-training/</link>
		<comments>http://www.eddic.cn/main/big-data-training/#comments</comments>
		<pubDate>Tue, 01 Mar 2016 04:47:31 +0000</pubDate>
		<dc:creator><![CDATA[Eddic Training Center]]></dc:creator>
				<category><![CDATA[课程 Courses]]></category>
		<category><![CDATA[Hadoop]]></category>
		<category><![CDATA[IT 服务管理]]></category>

		<guid isPermaLink="false">http://www.eddic.cn/main/?p=2121</guid>
		<description><![CDATA[大数据培训课程 课程介绍 培训对象： 对云计算、分布式数据存储于处理、大数据等感兴趣的朋友 传统的数据库，例如 Oracle、MaySQL、DB2 等的管理人员 Java、C 等任意一门编程语言的开发者 网站服务器端的开发人员 在校大学生、中专生或者刚毕业的学生 云计算大数据从业者 熟悉 Hadoop 生态系统，想了解和学习 Hadoop 与 Spark 整合在企业应用实战案例的朋友 系统架构师、系统分析师、高级程序员、资深开发人员 牵涉到大数据处理的数据中心运行、规划、设计负责人 政府机关，金融保险、移动和互联网等大数据来源单位的负责人 高校、科研院所涉及到大数据与分布式数据处理的项目负责人 数据仓库管理人员、建模人员，分析和开发人员、系统管理人员、数据库管理人员以及对数据仓库感兴趣的其他人员 培训目标： 了解大数据时代的基础技术和思维 体会大数据驱动下的营销变革与实战分享 能从电子商务等新型企业的大数据应用情况和案例中理解大数据价值 分享大数据应用案例，培养听众对大数据挖掘与分析的认识 掌握以 Hadoop 为代表的大数据平台实现技术能力 课程内容纲要 第1个主题：大数据生态圈和案例介绍 1. 认识大数据（大数据时代的思维，价值体现是什么，大数据应用的热点、发展、展望） 2. 大数据与云计算（大数据与云计算的关系是什么，大数据云计算的应用和领域） 3. 大数据技术概述（大数据技术的分类有哪些，大数据的主流技术有哪些） 4. 国外、国内大数据应用情况现状以及发展方向（其他行业大数据案例分享，国内大型互联网公司案例分享） 第2个主题：Hadoop 三问（彻底理解 Hadoop） 1. Hadoop 为什么是云计算分布式大数据的事实开源标准软件框架？ 2. Hadoop 的具体是如何工作？ 3. Hadoop 的生态架构和每个模块具体的功能是什么？ 第3个主题：彻底掌握(...)]]></description>
				<content:encoded><![CDATA[<p><img src="http://www.eddic.cn/main/wp-content/uploads/2016/03/banner-big-data.jpg" alt="banner-big-data" width="1956" height="640" class="alignnone size-full wp-image-2126" /></p>
<h1>大数据培训课程</h1>
<h2>课程介绍</h2>
<div class="w768">
<h3>培训对象：</h3>
<p>对云计算、分布式数据存储于处理、大数据等感兴趣的朋友<br />
传统的数据库，例如 Oracle、MaySQL、DB2 等的管理人员<br />
Java、C 等任意一门编程语言的开发者<br />
网站服务器端的开发人员<br />
在校大学生、中专生或者刚毕业的学生<br />
云计算大数据从业者<br />
熟悉 Hadoop 生态系统，想了解和学习 Hadoop 与 Spark 整合在企业应用实战案例的朋友<br />
系统架构师、系统分析师、高级程序员、资深开发人员<br />
牵涉到大数据处理的数据中心运行、规划、设计负责人<br />
政府机关，金融保险、移动和互联网等大数据来源单位的负责人<br />
高校、科研院所涉及到大数据与分布式数据处理的项目负责人<br />
数据仓库管理人员、建模人员，分析和开发人员、系统管理人员、数据库管理人员以及对数据仓库感兴趣的其他人员</p>
<h3>培训目标：</h3>
<p>了解大数据时代的基础技术和思维<br />
体会大数据驱动下的营销变革与实战分享<br />
能从电子商务等新型企业的大数据应用情况和案例中理解大数据价值<br />
分享大数据应用案例，培养听众对大数据挖掘与分析的认识<br />
掌握以 Hadoop 为代表的大数据平台实现技术能力
</p></div>
<h2>课程内容纲要</h2>
<div class="w768">
<h3>第1个主题：大数据生态圈和案例介绍</h3>
<p>1. 认识大数据（大数据时代的思维，价值体现是什么，大数据应用的热点、发展、展望）<br />
2. 大数据与云计算（大数据与云计算的关系是什么，大数据云计算的应用和领域）<br />
3. 大数据技术概述（大数据技术的分类有哪些，大数据的主流技术有哪些）<br />
4. 国外、国内大数据应用情况现状以及发展方向（其他行业大数据案例分享，国内大型互联网公司案例分享）</p>
<h3>第2个主题：Hadoop 三问（彻底理解 Hadoop）</h3>
<p>1. Hadoop 为什么是云计算分布式大数据的事实开源标准软件框架？<br />
2. Hadoop 的具体是如何工作？<br />
3. Hadoop 的生态架构和每个模块具体的功能是什么？</p>
<h3>第3个主题：彻底掌握 HDFS（深入理解 HDFS）</h3>
<p>1. HDFS 体系架构剖析<br />
2. 名称节点、数据节点、辅助名称节点架构<br />
3. 名称节点的高可靠性最佳实践<br />
4. 数据节点中 Block 划分的原理和具体存储方式</p>
<h3>第4个主题：彻底掌握 MapReduce（剖析 MapReduce 执行）</h3>
<p>1. MapReduce 执行的经典步骤<br />
2. wordcount 运行过程解析<br />
3. Mapper 和 Reducer 剖析</p>
<h3>第5个主题：YARN（理解和使用 YARN）</h3>
<p>1. YARN 的设计思想<br />
2. YARN 的核心组件<br />
3. YARN 的共组过程<br />
4. YARN 应用程序编写</p>
<h3>第6个主题：深入理解 Hive（掌握 Hive 数据仓库的实现查询）</h3>
<p>1. 了解基于 Hadoop 的数据平台架构<br />
2. 了解 Hive 的应用环境<br />
3. 了解 Hive 的作用及原理<br />
4. 案例和演示</p>
<h3>第7个主题：深入理解 HBase（掌握 HBase 数据仓库的原理及应用场景）</h3>
<p>1. HBase 简介和架构<br />
2. HBase 核心知识点<br />
3. HBase 高级应用<br />
4. HBase 安装、部署、启动<br />
5. 案例和演示</p>
<h3>第8个主题：深入理解 Zookeeper（掌握 Zookeeper的原理及应用场景）</h3>
<p>1. Zookeeper 简介和架构<br />
2. Zookeeper 核心知识点<br />
3. 使用 Zookeeper 实现 Name Node 高可用</p>
<h3>第9个主题：Spark 的架构设计（理解 Spark 平台和应用场景）</h3>
<p>1. Spark 生态系统剖析<br />
2. Spark 的架构设计剖析<br />
3. RDD 计算流程解析<br />
4. Spark 的出色容错机制<br />
5. 案例分享
</p></div>
<div id="themify_builder_content-2121" data-postid="2121" class="themify_builder_content themify_builder_content-2121 themify_builder themify_builder_front">
	
	
</div>
<!-- /themify_builder_content -->]]></content:encoded>
			<wfw:commentRss>http://www.eddic.cn/main/big-data-training/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Cloudera 授权 Hadoop 开发者培训</title>
		<link>http://www.eddic.cn/main/cloudera-hadoop-developer-training/</link>
		<comments>http://www.eddic.cn/main/cloudera-hadoop-developer-training/#comments</comments>
		<pubDate>Mon, 14 Oct 2013 13:36:54 +0000</pubDate>
		<dc:creator><![CDATA[Eddic Training Center]]></dc:creator>
				<category><![CDATA[课程 Courses]]></category>
		<category><![CDATA[Hadoop]]></category>
		<category><![CDATA[IT 服务管理]]></category>

		<guid isPermaLink="false">http://www.eddic.cn/main/?p=1057</guid>
		<description><![CDATA[Cloudera 授权 Hadoop 开发者培训 课程目标 适用于使用 Apache Hadoop 来创建开发强大的数据处理应用的各类 Hadoop 开发技术人员。通过本课程的学习，学员将掌握开启海量数据处理技术大门的金钥匙，为企业提供前所未有的从所有不同类型数据里挖掘商业价值的机会。 课程内容 • Hadoop 分布式文件系统（HDFS）和 MapReduce 的工作原理 • 如何利用 JAVA API 或者其他编程语言来开发 MapReduce 应用 • MapReduce 任务开发中的注意事项 • 如何在 Hadoop 上实现常见算法 • Hadoop 开发和调试的最佳实用经验 • 如何利用其他 Hadoop 相关技术，包括 Apache Hive, Apache Pig, Sqoop 和 Oozie 等 • 满足解决实际数据分析问题的高级 Hadoop API 参训相关信息 课程时间：4 天 学员基础 具备编程经验的开发人员（最好是面向对象高级编程语言，譬如(...)]]></description>
				<content:encoded><![CDATA[<p><img src="http://www.eddic.cn/main/wp-content/uploads/2013/10/bannerHadoop1.png" alt="bannerHadoop1" width="978" height="320" class="alignnone size-full wp-image-1050" /></p>
<h1>Cloudera 授权 Hadoop 开发者培训</h1>
<div class="w768">
<h3>课程目标 </h3>
<p>适用于使用 Apache Hadoop 来创建开发强大的数据处理应用的各类 Hadoop 开发技术人员。通过本课程的学习，学员将掌握开启海量数据处理技术大门的金钥匙，为企业提供前所未有的从所有不同类型数据里挖掘商业价值的机会。</p>
<h3>课程内容 </h3>
<p>• Hadoop 分布式文件系统（HDFS）和 MapReduce 的工作原理<br />
• 如何利用 JAVA API 或者其他编程语言来开发 MapReduce 应用<br />
• MapReduce 任务开发中的注意事项<br />
• 如何在 Hadoop 上实现常见算法<br />
• Hadoop 开发和调试的最佳实用经验<br />
• 如何利用其他 Hadoop 相关技术，包括 Apache Hive, Apache Pig, Sqoop 和 Oozie 等<br />
• 满足解决实际数据分析问题的高级 Hadoop API
</p></div>
<h2>参训相关信息</h2>
<div class="w768">
<h3>课程时间：4 天</h3>
<h3>学员基础 </h3>
<p>具备编程经验的开发人员（最好是面向对象高级编程语言，譬如 Java）。不需要事先掌握 Hadoop 相关知识。</p>
<h3>授课形式</h3>
<p>采取教师讲解和学员上机操作相结合的形式。上机实验有机地穿插在重要课题讲解后，学员能马上学以致用，巩固刚刚所学的概念和知识，转化为自身的技能应用到实战中。我们鼓励学员在课堂上大胆自由地提问，和授课教师进行互动，获得最大的收益。</p>
<h3>认证考试 </h3>
<p>Cloudera Apache Hadoop 资格开发员考试提供 Hadoop 上软件开发在业界唯一且最具权威性、并得到全球认可的认证。为企业提供高质量保证的 Hadoop 开发人员；为工程师技术人员提供了最新的技术装备，开拓了职业发展。</p></div>
<h2>课程内容纲要</h2>
<div class="w768">
<h3>Hadoop 的来源和动机 </h3>
<p>• 传统大规模系统存在的问题<br />
• 对一种新的解决方案的需求 </p>
<h3>Hadoop 基本概念 </h3>
<p>• Hadoop 概述<br />
• Hadoop 分布式文件系统<br />
• 上机实验<br />
• MapReduce 工作原理<br />
• 上机实验<br />
• Hadoop 机群剖析<br />
• Hadoop 生态系统 </p>
<h3>编写 MapReduce 程序 </h3>
<p>• MapReduce 流程<br />
• 剖析一个 MapReduce 程序<br />
• 基本 MapReduce API 概念<br />
• 驱动代码<br />
• Mapper<br />
• Reducer<br />
• Hadoop 流 API<br />
• 使用 Eclipse 进行快速开发<br />
• 上机实验<br />
• 新 MapReduce API </p>
<h3>集成 Hadoop 到现有工作流 </h3>
<p>• 关系数据库管理系统<br />
• 存储系统<br />
• 利用 Sqoop 从关系型数据库系统中导入数据到 Hadoop<br />
• 上机实验<br />
• 利用 Flume 导入实时数据到 Hadoop<br />
• 使用 FuseDFS 和 Hoop 访问 HDFS </p>
<h3>Hadoop API 深入探讨 </h3>
<p>• ToolRunner 介绍<br />
• 使用 MRUnit 进行测试<br />
• 利用 Combiners 来减少中间数据<br />
• 使用 Configure 和 Close 方法来进行 Map/Reduce 设置和关闭<br />
• 编写 Partitioner 来优化负载平衡<br />
• 上机实验<br />
• 直接访问 Hadoop 分布式文件系统（HDFS）<br />
• 使用分布式缓存（Distributed Cache）<br />
• 上机实验 </p>
<h3>常见 MapReduce 算法 </h3>
<p>• Hadoop 概述<br />
• Hadoop 分布式文件系统<br />
• 上机实验<br />
• MapReduce 工作原理<br />
• 上机实验<br />
• 如何利用其他 Hadoop 相关技术，包括 Apache Hive, Apache Pig, Sqoop 和 Oozie 等<br />
• 满足解决实际数据分析问题的高级 Hadoop API </p>
<h3>使用 Hive 和 Pig </h3>
<p>• Hive 基础<br />
• Pig 基础<br />
• 上机实验 </p>
<h3>实用开发技巧 </h3>
<p>• 排序和搜索<br />
• 索引<br />
• 上机实验<br />
• 用 Mahout 进行机器学习<br />
• Term Frequency – Inverse Document Frequency<br />
• Word Co-Occurrence<br />
• 上机实验 </p>
<h3>使用 Hive 和 Pig </h3>
<p>• Hive 基础<br />
• Pig 基础<br />
• 上机实验 </p>
<h3>实用开发技巧 </h3>
<p>• 调试 MapReduce 代码<br />
• 使用 LocalJobRunner 模式进行轻松调试<br />
• 利用计数器来检索任务信息<br />
• 日志<br />
• 可分割文件格式<br />
• 如何确定最优的 Reducer 数目<br />
• 只使用 Mapper 的 MapReduce 任务<br />
• 上机试验 </p>
<h3>高级 MapReduce 编程 </h3>
<p>• 定制 Writables 和 WritableComparables<br />
• 使用 SequenceFiles 和 Avro 文件保存二进制数据<br />
• 创建 InputFormats 和 OutputFormats<br />
• 上机实验 </p>
<h3>用 MapReduce 合并数据集 </h3>
<p>• 在 Map 方的合并<br />
• 辅助排序在 Reducer 方的合并 </p>
<h3>图的操作 </h3>
<p>• 图论简介<br />
• 用 Hadoop 表示图<br />
• 一个图算法的实现：单源最短路径 </p>
<h3>使用 Oozie 创建工作流 </h3>
<p>• 使用 Oozie 的动机<br />
• Oozie 工作流定义格式<br />
• 上机实验
</p></div>
<div id="themify_builder_content-1057" data-postid="1057" class="themify_builder_content themify_builder_content-1057 themify_builder themify_builder_front">
	
	
</div>
<!-- /themify_builder_content -->]]></content:encoded>
			<wfw:commentRss>http://www.eddic.cn/main/cloudera-hadoop-developer-training/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Cloudera 授权 Hadoop 管理员培训</title>
		<link>http://www.eddic.cn/main/cloudera-hadoop-admin-training/</link>
		<comments>http://www.eddic.cn/main/cloudera-hadoop-admin-training/#comments</comments>
		<pubDate>Mon, 14 Oct 2013 13:18:26 +0000</pubDate>
		<dc:creator><![CDATA[Eddic Training Center]]></dc:creator>
				<category><![CDATA[课程 Courses]]></category>
		<category><![CDATA[Hadoop]]></category>
		<category><![CDATA[IT 服务管理]]></category>

		<guid isPermaLink="false">http://www.eddic.cn/main/?p=1055</guid>
		<description><![CDATA[Cloudera 授权 Hadoop 管理员培训 课程目标 专门为系统管理员和其他技术人员量身定做的课程，以进行用于产品或开发测试环境中的 Hadoop 机群的安装部署，管理和优化，为企业进行海量数据存储和分析搭建经济高效和高可靠的系统平台。 课程内容 • Hadoop 分布式文件系统（HDFS）和 MapReduce 的工作原理 • 如何优化 Hadoop 机群所需要的硬件配置 • 搭建 Hadoop 机群所需要考虑的网络因素 • 如何利用 Hadoop 配置选项进行系统性能调优 • 如何利用 FairScheduler 为多用户提供服务级别保障 • Hadoop 机群维护和监控 • 如何使用 Flume 从动态生成的文件加载数据到 Hadoop • 如何使用 Sqoop 从关系型数据库加载数据 • 使用其他 Hadoop 相关系统工具（诸如 Hive，Pig 和 HBase）所涉及到的系统管理问题 参训相关信息 课程时间：3 天 学员基础 具备基本 Linux(...)]]></description>
				<content:encoded><![CDATA[<p><img src="http://www.eddic.cn/main/wp-content/uploads/2013/10/bannerHadoop2.png" alt="bannerHadoop2" width="978" height="320" class="alignnone size-full wp-image-1051" /></p>
<h1>Cloudera 授权 Hadoop 管理员培训</h1>
<div class="w768">
<h3>课程目标 </h3>
<p>专门为系统管理员和其他技术人员量身定做的课程，以进行用于产品或开发测试环境中的 Hadoop 机群的安装部署，管理和优化，为企业进行海量数据存储和分析搭建经济高效和高可靠的系统平台。</p>
<h3>课程内容 </h3>
<p>• Hadoop 分布式文件系统（HDFS）和 MapReduce 的工作原理<br />
• 如何优化 Hadoop 机群所需要的硬件配置<br />
• 搭建 Hadoop 机群所需要考虑的网络因素<br />
• 如何利用 Hadoop 配置选项进行系统性能调优<br />
• 如何利用 FairScheduler 为多用户提供服务级别保障<br />
• Hadoop 机群维护和监控<br />
• 如何使用 Flume 从动态生成的文件加载数据到 Hadoop<br />
• 如何使用 Sqoop 从关系型数据库加载数据<br />
• 使用其他 Hadoop 相关系统工具（诸如 Hive，Pig 和 HBase）所涉及到的系统管理问题
</p></div>
<h2>参训相关信息</h2>
<div class="w768">
<h3>课程时间：3 天</h3>
<h3>学员基础 </h3>
<p>具备基本 Linux 系统管理经验。不需要事先掌握 Hadoop 相关知识。</p>
<h3>授课形式</h3>
<p>采取教师讲解和学员上机操作相结合的形式。上机实验有机地穿插在重要课题讲解后，学员能马上学以致用，巩固刚刚所学的概念和知识，转化为自身的技能应用到实战中。我们鼓励学员在课堂上大胆自由地提问，和授课教师进行互动，获得最大的收益。</p>
<h3>认证考试 </h3>
<p>Cloudera Apache Hadoop 资格管理员考试提供业界进行 Hadoop 安装部署及管理调优领域里唯一且最具权威性、并得到全球认可的认证。为企业提供了高质量可以依赖的 Hadoop 管理员，保障了海量数据存储和处理计算平台系统的高质量；为工程师技术人员提供了最新的技术装备，开拓了职业发展。
</p></div>
<h2>课程内容纲要</h2>
<div class="w768">
<h3>Hadoop 和 HDFS 入门 </h3>
<p>• 为什么使用 Hadoop?<br />
• HDFS 介绍<br />
• MapReduce介绍<br />
• Hive, Pig, HBase 和其他 Hadoop 生态系统项目<br />
• 上机实验 </p>
<h3>Hadoop 机群规划 </h3>
<p>• 一般考虑因素<br />
• 选择合适的硬件<br />
• 网络考虑<br />
• 配置节点 </p>
<h3>配置和部署 Hadoop 机群 </h3>
<p>• 部署种类<br />
• 安装 Hadoop<br />
• 使用 Cloudera Manager 进行简易安装<br />
• 典型配置参数<br />
• 机柜配置（Rack Awareness）<br />
• 使用配置管理工具<br />
• 上机实验 </p>
<h3>管理调度任务 </h3>
<p>• 管理运行的任务<br />
• 上机实验<br />
• 先进先出调度器（FIFO Scheduler）<br />
• 公平调度器（FairScheduler）<br />
• 配置公平调度器<br />
• 上机实验 </p>
<h3>Hadoop 维护 </h3>
<p>• 检查 HDFS 状态<br />
• 上机实验<br />
• Hadoop 机群之间的数据拷贝<br />
• 增减 Hadoop 机群节点<br />
• Hadoop 机群数据负载平衡<br />
• 上机实验<br />
• 名字节点（NameNode）元数据（Metadata）的备份<br />
• 机群升级 </p>
<h3>Hadoop 机群监控和故障排除 </h3>
<p>• 一般性系统监控<br />
• 管理 Hadoop 日志文件<br />
• 使用 NameNode 和 JobTracker 的 Web UI<br />
• 上机实验<br />
• 使用 Ganglia 来监控机群<br />
• 常见故障问题<br />
• 用基准测试工具测试机群性能 </p>
<h3>为 Hadoop 机群加载外部数据源 </h3>
<p>• Flume 概述<br />
• 上机实验<br />
• Sqoop 概述<br />
• 导入数据的最佳实践 </p>
<h3>安装和管理其他 Hadoop 项目 </h3>
<p>• Hive<br />
• Pig<br />
• 上机实验<br />
• HBase
</p></div>
<div id="themify_builder_content-1055" data-postid="1055" class="themify_builder_content themify_builder_content-1055 themify_builder themify_builder_front">
	
	
</div>
<!-- /themify_builder_content -->]]></content:encoded>
			<wfw:commentRss>http://www.eddic.cn/main/cloudera-hadoop-admin-training/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>云计算技术之 Hadoop 大数据技术企业培训</title>
		<link>http://www.eddic.cn/main/hadoop-big-data-for-enterprise/</link>
		<comments>http://www.eddic.cn/main/hadoop-big-data-for-enterprise/#comments</comments>
		<pubDate>Sun, 01 Sep 2013 14:29:28 +0000</pubDate>
		<dc:creator><![CDATA[Eddic Training Center]]></dc:creator>
				<category><![CDATA[课程 Courses]]></category>
		<category><![CDATA[Hadoop]]></category>
		<category><![CDATA[IT 服务管理]]></category>

		<guid isPermaLink="false">http://www.eddic.cn/main/?p=1059</guid>
		<description><![CDATA[云计算技术之 Hadoop 大数据技术企业培训 Hadoop 是一个分布式文件系统，广泛应用于云计算领域。对于现在的互联网企业和云计算服务企业来说，每天都会产生大量的数据，而且并发访问也非常高，传统的关系型数据库已经无法满足大数据量高并发的要求。因此各大互联网企业已经开始使用 Hadoop 软件解决大数据量高并发的问题。像：淘宝、百度、京东、Yahoo、Facebook、暴风影音都已经为他们的企业引入了 Hadoop 技术。在国内，越来越多的企业急需引入 Hadoop 技术，由于市面上掌握 Hadoop 技术的开发人员并不多，直接导致了 Hadoop 技术人员的薪水远高于 JavaEE 程序员，Hadoop 技术的入门薪资已经达到了8000以上，工作一年达到12000以上。 课程内容 • EasyHadoop 大数据处理生态系统和成功案例 • EasyHadoop 开发者 • Hadoop EDW 数据库管理员 参训相关信息 课程时间：2 天 学员基础 具备编程经验的开发人员（最好是面向对象高级编程语言，譬如 Java）。不需要事先掌握 Hadoop 相关知识。 课程内容纲要 EasyHadoop 大数据处理生态系统和成功案例 课程目标：此课程面向企业 CIO、CTO、架构师、以及传统数据库管理员、数据分析师、或对 Hadoop 技术感兴趣的技术人员。通过此课程的培训，学员可以了解 Hadoop 的历史及目前发展的现状、以及 Hadoop 的技术特点和适用场景，从而把握分布式计算框架及未来发展方向，在大数据时代对能为企业的技术选型及架构设计提供决策参考。 目标学员：CIO、CTO、架构师、DBA、数据分析师、数据库开发人员 学员基础：无编程技术要求 一、Hadoop 的起源 二、Hadoop 在云计算和大数据的位置和关系 三、Hadoop(...)]]></description>
				<content:encoded><![CDATA[<p><img src="http://www.eddic.cn/main/wp-content/uploads/2013/10/bannerhadoop.png" alt="bannerhadoop" width="978" height="320" class="alignnone size-full wp-image-1053" /></p>
<h1>云计算技术之 Hadoop 大数据技术企业培训</h1>
<div class="w768">
Hadoop 是一个分布式文件系统，广泛应用于云计算领域。对于现在的互联网企业和云计算服务企业来说，每天都会产生大量的数据，而且并发访问也非常高，传统的关系型数据库已经无法满足大数据量高并发的要求。因此各大互联网企业已经开始使用 Hadoop 软件解决大数据量高并发的问题。像：淘宝、百度、京东、Yahoo、Facebook、暴风影音都已经为他们的企业引入了 Hadoop 技术。在国内，越来越多的企业急需引入 Hadoop 技术，由于市面上掌握 Hadoop 技术的开发人员并不多，直接导致了 Hadoop 技术人员的薪水远高于 JavaEE 程序员，Hadoop 技术的入门薪资已经达到了8000以上，工作一年达到12000以上。</p>
<h3>课程内容 </h3>
<p>• EasyHadoop 大数据处理生态系统和成功案例<br />
• EasyHadoop 开发者<br />
• Hadoop EDW 数据库管理员
</p></div>
<h2>参训相关信息</h2>
<div class="w768">
<h3>课程时间：2 天</h3>
<h3>学员基础 </h3>
<p>具备编程经验的开发人员（最好是面向对象高级编程语言，譬如 Java）。不需要事先掌握 Hadoop 相关知识。
</p></div>
<h2>课程内容纲要</h2>
<div class="w768">
<h3>EasyHadoop 大数据处理生态系统和成功案例</h3>
<p>课程目标：此课程面向企业 CIO、CTO、架构师、以及传统数据库管理员、数据分析师、或对 Hadoop 技术感兴趣的技术人员。通过此课程的培训，学员可以了解 Hadoop 的历史及目前发展的现状、以及 Hadoop 的技术特点和适用场景，从而把握分布式计算框架及未来发展方向，在大数据时代对能为企业的技术选型及架构设计提供决策参考。<br />
目标学员：CIO、CTO、架构师、DBA、数据分析师、数据库开发人员<br />
学员基础：无编程技术要求</p>
<p>一、Hadoop 的起源<br />
二、Hadoop 在云计算和大数据的位置和关系<br />
三、Hadoop 国外企业成功案例<br />
四、Hadoop 国内企业成功案例<br />
五、Hadoop 生态系统介绍和演示<br />
六、Hadoop 和传统数据库技术优劣势对比<br />
七、Hadoop 现有软件厂商和产品对比和选型<br />
八、Hadoop 现有硬件厂商和产品对比和选型<br />
九、EasyHadoop 软件系统和培训课程优势介绍</p>
<h3>EasyHadoop 开发者</h3>
<p>课程目标：此课程面向企业软件工程师、数据库工程师、以及对 Hadoop 开发感兴趣的各类技术人员。通过此课程的学习，学员可以全面掌握 Hadoop 的架构原理和使用场景，并通过贯穿课程的习题项目进行实战锻炼，从而熟练使用 Hadoop 进行 MapReduce 程序开发。课程还涵盖了分布式计算领域的常用算法介绍，帮助学员为企业在利用大数据方面体现自身价值。<br />
目标学员：软件工程师、高级软件工程师、数据库开发人员、互联网服务后台开发人员、运维人员<br />
学员基础：需要了解 Linux 系统，了解网络，懂 Java 编程</p>
<p>一、Hadoop MapReduce<br />
二、使用 Hadoop MapReduce Streaming 编程<br />
三、MapReduce 分布式程序<br />
四、Hadoop 核心代码导读<br />
五、HDFS 分布式文件系统编程<br />
六、Hadoop Mapreduce 高级编程<br />
七、MapReduce 的优化<br />
八、MapReduce 的任务调度<br />
九、MapReduce 编程实战<br />
十、flume + hadoop 日志的收集实战</p>
<h3>Hadoop EDW 数据库管理员</h3>
<p>课程目标：此课程面向公司系统管理员、数据库管理员，希望转型的 DBA 以及对 Hadoop 感兴趣的各类技术人员。通过此课程的培训，学员可以深入理解 Hadoop 技术架构，对 Hadoop 运作机制有清晰全面的认识，可以独立规划及部署生产环境的 Hadoop 集群，掌握 Hadoop 基本运维思路和方法，对 Hadoop 集群进行管理和优化。<br />
目标学员：软件工程师、高级软件工程师、数据库开发人员、互联网服务后台开发人员、运维人员<br />
学员基础：需要了解 Linux 系统，了解网络，了解 Shell SQL Python 等脚本语言的一种</p>
<p>集群安装和管理<br />
一、Hadoop 的来源和动机<br />
二、EasyHadoop 安装和部署准备<br />
三、EasyHadoop 集群安装和部署<br />
四、Hadoop 组件详解<br />
五、EasyHadoop 集群配置详解</p>
<p>集群优化和管理<br />
六、EasyHadoop 集群配置：机架感知,开启压缩和任务均衡<br />
七、Hadoop 集群维护与管理<br />
八、Hadoop 集群规划和测试<br />
九、Hadoop 集群监控和运维<br />
十、Hadoop HDFS 高可用</p>
<p>EasyHive EasyPig 数据仓库<br />
十一、EasyHive 仓库集群<br />
十二、EasyHive 仓库集群高级<br />
十三、EasyHive 仓库优化<br />
十四、EasyHive 仓库外围系统
</p></div>
<div id="themify_builder_content-1059" data-postid="1059" class="themify_builder_content themify_builder_content-1059 themify_builder themify_builder_front">
	
	
</div>
<!-- /themify_builder_content -->]]></content:encoded>
			<wfw:commentRss>http://www.eddic.cn/main/hadoop-big-data-for-enterprise/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>
