数据分析入门(中/英)

使用 NumPy 和 Pandas 进行数据分析

初级

大约 6 个礼拜

6小时每周 (按照自己的节奏)

加入成千上万的全球学员

开始免费课程

加入课程
免费
可享受
课程视频
实战练习与参考项目指导
初级

大约 6 个礼拜

6小时每周 (按照自己的节奏)

加入成千上万的全球学员

课程概述

本课程将向你介绍数据分析的世界。你将学习如何完成整个数据分析过程,包括:

  • 提出问题
  • 将数据整理为可以用来解决问题的格式
  • 探索数据、找出数据中的模式、建立关于数据的直觉
  • 得出结论和/或进行预测
  • 交流你的发现

你还将学习如何使用 NumPy、Pandas 和 Matplotlib 等 Python 库来编写更加干净、简洁、运行更快的代码。此课程提供中文版本。

喜欢这门课程?加入“数据分析”纳米学位。

为什么学习这门课程?

本课程是一门很好的全面了解数据分析过程的入门课程。在深入钻研各个阶段之前,了解数据分析过程不同阶段的不同点以及彼此的关联性十分重要。完成本课程后,你将打牢基础,更好地完成数据分析(进阶)纳米学位项目中的其他课程。例如,从“用 R 进行数据分析”开始学习的学员将学习探索性数据分析这个阶段,但他可能不了解数据探索和数据整理之间的区别。首先学习本课程,你将了解每个阶段的作用,以及它们在整个数据分析流程中的位置。

本课程还涵盖 NumPy、Pandas 和 Matplotlib 等 Python 库,它们都是 Python 中进行数据分析不可或缺的工具,拥有很多便利的函数,性能出色,大大方便了数据分析代码的编写。

先修要求

要学习本课程,你需要熟悉 Python 编程语言。

  • 你应熟悉 if 语句、循环、函数、列表、集合和字典。要了解这些课题,请学习“计算机科学导论”课程。
  • 你还应熟悉类、对象和模块。要了解这些课题,请学习“编程基础:Python”课程。

查看使用优达学城的技术要求

你将学习什么内容?

项目

调查数据集

选择一个优达学城提供的数据集,使用 NumPy 和 Pandas 进行调查分析。完成整个数据分析过程,从提出问题到分享发现结果。

学习计划

第 1 课:数据分析流程

在本课中,你将学习数据分析流程,包括提出问题、整理和探索数据、得出结论和/或进行预测,以及交流你的发现。你将仅使用 Python 完成优达学城学生数据分析,尽量不使用其他库。

第 2 课:NumPy 和 Pandas 用于 1D 数据

在本课中,你将开始学习使用 NumPy 和 Pandas 来方便数据分析流程。本课重点是适用于一维数据的功能。你将学习如何使用 NumPy 数组、Pandas 序列和矢量运算。

第 3 课:NumPy 和 Pandas 用于 2D 数据

本课将继续学习 NumPy 和 Pandas,但现在的重点是二维数据。你将学习如何使用二维 NumPy 数组和 Pandas DataFrames。你还会学习如何对数据分组以及对多个文件的数据进行整合。

项目:调查数据集

在本项目中,你将使用 NumPy 和 Pandas 对一个数据集完成整个数据分析流程。

讲师与合作伙伴

Caroline Buckey

Caroline Buckey

加入优达学城之前,Caroline 在一家为应用搭建搜索引擎的创业公司(Quixey)担任软件工程师。她在卡内基梅隆大学本科学习期间,曾为六门课程担任助教。对教育的热爱使她加入优达学城。在工作之外,她喜欢阅读小说,玩棋盘游戏,还喜欢喝珍珠奶茶。

官方微信公众号二维码

优达学城(Udacity)微信