单项课程

Spark 入门

by
Insight

学习使用时下最热门的 Spark 来处理大数据,构建机器学习模型!

关于此课程

你将学习如何使用 Spark 来处理大数据,并规模化构建机器学习模型,包括如何使用 PySpark 来清洗大数据集及建模。PySpark 是 Spark 为 Python 开发者提供的 API。第一课介绍了大数据及 Spark 在大数据生态系统的角色。在第二课里,你将练习处理和清洗数据集,从而熟悉 SparkSQL 和 dataframe APIs。在第三课里,你将在集群上运行 Spark 代码,并进行调试和优化。在最后一课,你将使用 Spark 机器学习库来训练机器学习模型。

学费
免费
学习时间
大约 10 小时
难度
中级
你将获得

丰富的教学材料丰富的教学材料

互动随堂练习互动随堂练习

业界专业导师业界专业导师

自主掌握进度自主掌握进度

课程讲师

David Drummond

David Drummond

Insight 工程副总裁

Judit Lantos

Judit Lantos

Netflix 高级数据工程师

先修知识及要求

建议学员具有编程与数据分析的相关经验。

查看使用优达学城的 技术要求

为什么学习这门课程?

Spark 是一项开源大数据技术,是全球各大公司和初创企业进行高效数据处理与分析的工具首选,尤其是在清洗数据方面。

我将获得什么?
  • 教学视频
  • 随堂练习
  • 专业导师