用 R 进行数据分析(中/英)

直观地分析和总结数据集

中级

大约 2 个月

6小时每周 (自主学习)

由以下企业参与制作:
加入成千上万的全球学员

开始免费课程

加入课程
免费
可享受
课程视频
实战练习与参考项目指导
中级

大约 2 个月

6小时每周 (自主学习)

由以下企业参与制作:
加入成千上万的全球学员

课程概述

探索性数据分析是一种总结和直观呈现数据集重要特性的方法。探索性数据分析由 John Tukey 推广开来,主要侧重于探索数据,从而发现数据的基本结构和变量,使我们对数据集产生直观的认识,并了解该数据集是如何存在的,以及如何通过更加正式的统计方法调查该数据集。此课程提供中文版本。

喜欢这门课程?加入“数据分析”纳米学位。

为什么学习这门课程?

你将…

  • 通过探索性数据分析了解数据分析过程。
  • 通过相应的可视化探索各个层级的数据。
  • 掌握总结数据的统计知识。
  • 在展开数据分析时,保持好奇心和怀疑态度。
  • 对数据集产生直觉认识,了解数据是如何生成的。

先修要求

最好已经具有统计学方面的知识,但是并非必须掌握。在学习本课程前,可以考虑先学习描述统计学入门推论统计学入门课程。相关主题包括:

  • 平均数、中位数、众数
  • 正态分布、均匀分布和偏态分布
  • 直方图和箱线图


熟悉以下 CS 和数学内容将有助于你学习本课程:

  • 变量赋值
  • 比较和逻辑运算符( <、>、<=、>=、==、&、| )
  • If else 语句
  • 平方根、对数和指数

查看使用优达学城的技术要求

你将学习什么内容?

项目

探索和总结数据

通过 R 并运用探索性数据分析技巧来探索某个变量与多个变量之间的关系,并探索选定数据集的分布、异常值和异常现象。

学习计划

第 1 课:什么是探索性数据分析(1 小时)

我们将先学习什么是探索性数据分析 (EDA) 以及它为何如此重要。你将认识本课程的优秀导师,并了解课程结构和最后的实战项目。

第 2 课:R 基础知识(3 小时)

探索性数据分析是进行正式假设测试和建模的前一步。探索性数据分析利用直观方法来分析和总结数据集。R 将是用于生成这些图形部分并进行分析的工具。在这课中,我们将安装 RStudio 和数据包,了解 R 的布局和基本命令,练习编写基本的 R 脚本,并检测数据集。

第 3 课:探索一个变量(4 小时)

通过探索性数据分析了解变量的分布,并检查异常现象和异常值。学习如何定量分析和直观呈现数据集中的单个变量,并了解 Facebook 用户的伪数据集。虽然该数据集不包含实际用户数据,但是却提供了大量信息。在这课中,我们将创建直方图和箱线图、转换变量,并检测可视化的利弊。

习题集 3(2 小时)

第 4 课:探索两个变量(4 小时)

通过探索性数据分析,我们能够在构建预测模型前,发现数据集中的重要变量和关系。在这一课中,我们将学习如何探索数据集中的两个变量之间的关系。我们将创建散点图、计算相关性,并调查其他条件。

习题集 4(2 小时)

第 5 课:探索多个变量(4 小时)

数据集有时候非常复杂。在这课中,我们将学习检测多个变量之间关系的强大方法和可视化。我们将学习如何改变数据框帧以及如何通过美学(例如颜色和形状)发现更多信息。我们将接着上课的内容,继续围绕 Facebook 数据集形成直观的认识,并研究一些新的数据集。

习题集 5(2 小时)

第 6 课:钻石和价格预测(2 小时)

与 Facebook 数据科学家 Solomon Messing 一起研究钻石数据集。他将复习本课程涉及的很多策略,并展示如何通过预测模型,为钻石确定适当的价格。在最后的实战项目中,你将自己选择一个数据集并创建探索性数据分析。

最终项目(10 小时以上)

你已经探索了模拟 Facebook 用户数据和钻石数据集。现在,轮到你来进行自己的探索性数据分析了。请选择一个要探索的数据集(由优达学城提供或自己寻找一个),并创建一个 RMD 文件,发现该数据集的模式、异常现象和关系。

讲师与合作伙伴

Moira Burke

Moira Burke

Moira Burke 是 Facebook 的一名数据科学家。她负责运用社会心理学和数据处理知识来了解人们是如何看待他们在网上的好友,以及上网如何提高人们的心理幸福感。她在卡耐基梅隆大学获得人机交互博士学位,并从俄勒冈大学获得计算机科学文学士学位。在业余时间内,她喜欢参加无伴奏合唱,虽然唱的有点糟糕。

Chris Saden

Chris Saden

在 2008 年从埃默里大学毕业后,Chris 担起了高校招生工作,并持续了一年时间,后来来到奥克兰的高中教授数学。他非常喜爱学习,并相信每个人都应该获得良好的教育。2012 年,Chris 加入了优达学城,开始向成千上万的学员讲授课程,并与大家分享解决问题的快乐。

Solomon Messing

Solomon Messing

Solomon Messing 是 Facebook 数据科学团队的政治科学家。他负责研究和教授政治广告推广和宣传活动、社会影响以及设计和分析实验。他的作品荣登在《美国政治科学评论》(American Political Science Review)、《公共舆论季刊》(Public Opinion Quarterly) 和《传播研究》(Communication Research) 上。Solomon 在斯坦福大学获得政治传播博士学位和统计学理学硕士学位。

Dean Eckles

Dean Eckles

Dean Eckles 是一名社会科学家、统计学家,并且是 Facebook 数据科学团队的成员。他的主要工作是通过调解、放大和引导社会影响研究交互式技术对人类行为的影响,以及研究这些流程的统计学方法。Dean 拥有斯坦福大学的哲学学士学位、认知科学理学学士学位和硕士学位、统计学硕士学位和传播学博士学位。

官方微信公众号二维码

优达学城(Udacity)微信