Hadoop 和 MapReduce 入门

如何处理大数据

中级

大约 1 个月

6小时每周 (自主学习)

由以下企业参与制作:
加入成千上万的全球学员

开始免费课程

加入课程
免费
可享受
课程视频
实战练习与参考项目指导
中级

大约 1 个月

6小时每周 (自主学习)

由以下企业参与制作:
加入成千上万的全球学员
观看Hadoop 和 MapReduce 入门课程介绍
观看视频

课程概述

Apache™ Hadoop® 是一个开发可靠、可扩展、分布式计算开源软件的项目。了解其背后的基本原理,以及如何使用它理解大数据。

为什么学习这门课程?

  • 了解 Hadoop 在现实世界中发挥的作用(认识它能解决哪些问题)
  • 理解 HDFS 和 MapReduce 的概念(明白它如何解决问题)
  • 编写 MapReduce 程序(明白我们如何解决问题)
  • 练习自己解决问题

先修要求

第 1 课没有技术性的先修要求,是对 Hadoop 和 MapReduce 的很好概述,非常适合管理者学习。

然而,要想尽可能从此课程中取得最大收获,你需要具备使用 Python 进行基本编程的能力,水平相当于我们的计算机科学导论导论。

要了解更多关于 Hadoop 的知识,你也可以阅读《Hadoop:权威指南》(Hadoop: The Definitive Guide) 一书。

查看使用优达学城的技术要求

你将学习什么内容?

项目

最终项目

在此项目中,你将研究论坛数据,这是最常见的一种用户生成内容。大多数热门网站都有某种论坛,而你在此项目中所做的工作也可在其他相似的项目中用到。

学习计划

第 1 课

什么是“大数据”?大数据的维度。缩放问题。HDFS 和 Hadoop 生态系统。

第 2 课

HDFS、MapReduce 和 Hadoop 集群基础。

第 3 课

编写 MapReduce 程序来回答有关数据的问题。

第 4 课

MapReduce 设计模式

最终项目

回答关于大量销售数据的问题并分析大型网站日志。

讲师与合作伙伴

Sarah Sproehnle

Sarah Sproehnle

Sarah Sproehnle 是 Cloudera 的教育服务副总裁,这是一家帮助开发、管理和支持 Apache Hadoop 的公司。虽然她本质上是一名电脑极客,但她热衷于帮助人们学习复杂的技术。除了教人如何使用 Hadoop 外,她还教授过数据库管理、各种编程语言和系统管理。

Ian Wrigley

Ian Wrigley

Ian Wrigley 当前担任 Cloudera 的高级课程经理,带领为公司创造所有 Hadoop 培训材料的团队。在过去的 20 年里他作过科技记者、讲师和课程作者,他教过的东西从 C 语言编程到 Web 文案编写应有尽有。他形容自己的工作为“让极客更极客”。

Gundega Dekena

Gundega Dekena

Gundega 曾是优达学城的学员。如今,从某种意义上来说,她依然是个学生,因为她每天都会从一起共事的讲师和优达学城的同事身上学到新的东西。

如果你想阅读一些关于机器人、科技和游戏方面的趣味新闻,不妨在 Google+ 上关注她 - https://plus.google.com/+GundegaDekena

官方微信公众号二维码

优达学城(Udacity)微信