学习使用时下最热门的 Spark 来处理大数据,构建机器学习模型!
获得纳米学位证书,加速你的职业发展。
你将学习如何使用 Spark 来处理大数据,并规模化构建机器学习模型,包括如何使用 PySpark 来清洗大数据集及建模。PySpark 是 Spark 为 Python 开发者提供的 API。第一课介绍了大数据及 Spark 在大数据生态系统的角色。在第二课里,你将练习处理和清洗数据集,从而熟悉 SparkSQL 和 dataframe APIs。在第三课里,你将在集群上运行 Spark 代码,并进行调试和优化。在最后一课,你将使用 Spark 机器学习库来训练机器学习模型。
丰富的教学内容
业界专业导师
互动随堂练习
自主掌握进度
学习这门单项课程,迈出通往数据科学家职业道路的第一步!
学习使用时下最热门的 Spark 来处理大数据,构建机器学习模型!
Insight 工程副总裁
Netflix 高级数据工程师
建议学员具有编程与数据分析的相关经验。
查看使用优达学城的 技术要求 。
Spark 是一项开源大数据技术,是全球各大公司和初创企业进行高效数据处理与分析的工具首选,尤其是在清洗数据方面。
Hi,我是你的专属学习规划师
不知道选什么课?和我聊聊吧!