单项课程

Spark 入门

by
Insight

学习使用时下最热门的 Spark 来处理大数据,构建机器学习模型!

纳米学位项目

数据科学家

获得纳米学位证书,加速你的职业发展。

关于此课程

你将学习如何使用 Spark 来处理大数据,并规模化构建机器学习模型,包括如何使用 PySpark 来清洗大数据集及建模。PySpark 是 Spark 为 Python 开发者提供的 API。第一课介绍了大数据及 Spark 在大数据生态系统的角色。在第二课里,你将练习处理和清洗数据集,从而熟悉 SparkSQL 和 dataframe APIs。在第三课里,你将在集群上运行 Spark 代码,并进行调试和优化。在最后一课,你将使用 Spark 机器学习库来训练机器学习模型。

学费
免费
学习时间
大约 10 小时
难度
中级
你将获得

丰富的教学内容

业界专业导师

互动随堂练习

自主掌握进度

开始你的旅程

学习这门单项课程,迈出通往数据科学家职业道路的第一步!

单项课程

Spark 入门

合作企业Insight

学习使用时下最热门的 Spark 来处理大数据,构建机器学习模型!

Icon steps
 
 

课程讲师

David Drummond

David Drummond

Insight 工程副总裁

Judit Lantos

Judit Lantos

Netflix 高级数据工程师

你将学到什么

先修知识及要求

建议学员具有编程与数据分析的相关经验。

查看使用优达学城的 技术要求

为什么学习这门课程?

Spark 是一项开源大数据技术,是全球各大公司和初创企业进行高效数据处理与分析的工具首选,尤其是在清洗数据方面。

我将获得什么?
教学视频随堂练习专业导师
Contact Udacity

Hi,我是你的专属学习规划师

不知道选什么课?和我聊聊吧!

Contact Udacity立即咨询