Free Course

用 R 进行数据分析(中/英)

by
Facebook

直观地分析和总结数据集

开始学习
纳米学位项目

数据分析(进阶)

by kaggle

提升数据分析能力,成为抢手人才

获得纳米学位证书,加速你的职业发展。

关于此课程

探索性数据分析是一种总结和直观呈现数据集重要特性的方法。探索性数据分析由 John Tukey 推广开来,主要侧重于探索数据,从而发现数据的基本结构和变量,使我们对数据集产生直观的认识,并了解该数据集是如何存在的,以及如何通过更加正式的统计方法调查该数据集。此课程提供中文版本。

喜欢这门课程?加入“数据分析”纳米学位。

学费
免费
学习时间
大约 2 months
难度
中级
你将获得

Rich Learning Content

Interactive Quizzes

Taught by Industry Pros

Self-Paced Learning

Student Support Community

开始你的旅程

学习这门免费课程,迈出通往数据分析(进阶)职业道路的第一步。

免费课程

用 R 进行数据分析(中/英)

合作企业 Facebook

通过创新性的自主学习方式,掌握新技能,提升竞争力。

Icon steps 54aa753742d05d598baf005f2bb1b5bb6339a7d544b84089a1eee6acd5a8543d
 
 

课程讲师

Moira Burke

Moira Burke

Facebook 数据科学家

Chris Saden

Chris Saden

优达学城讲师

Solomon Messing

Solomon Messing

Facebook 研究科学家

Dean Eckles

Dean Eckles

Facebook 数据科学家

你将学到什么

lesson 1

What is EDA?

  • Start by learn about what exploratory data analysis (EDA) is and why it is important.
lesson 2

R Basics

  • EDA, which comes before formal hypothesis testing and modeling, makes use of visual methods to analyze and summarize data sets.
  • R will be our tool for generating those visuals and conducting analyses.
  • We will install RStudio and packages, learn the layout and basic commands of R, practice writing basic R scripts, and inspect data sets.
lesson 3

Explore One Variable

  • Perform EDA to understand the distribution of a variable and to check for anomalies and outliers.
  • Learn how to quantify and visualize individual variables within a data set to make sense of a pseudo-data set of Facebook users.
  • Create histograms and boxplots, transform variables, and examine tradeoffs in visualizations.
lesson 4

Explore Two Variables

  • DA allows us to identify the most important variables and relationships within a data set before building predictive models.
  • Learn techniques for exploring the relationship between any two variables in a data set.
  • Create scatter plots, calculate correlations, and investigate conditional means.
lesson 5

Explore Many Variables

  • Learn powerful methods and visualizations for examining relationships among multiple variables.
  • Reshape data frames and how to use aesthetics like color and shape to uncover more information
  • Continue to build intuition around the Facebook data set and explore some new data sets as well.
lesson 6

Diamonds and Price Predictions

  • Investigate the diamonds data set alongside Facebook Data Scientist, Solomon Messing.
  • See how predictive modeling can allow us to determine a good price for a diamond.
  • As a final project, you will create your own exploratory data analysis on a data set of your choice.

先修知识及要求

最好已经具有统计学方面的知识,但是并非必须掌握。在学习本课程前,可以考虑先学习描述统计学入门推论统计学入门课程。相关主题包括:

  • 平均数、中位数、众数
  • 正态分布、均匀分布和偏态分布
  • 直方图和箱线图


熟悉以下 CS 和数学内容将有助于你学习本课程:

  • 变量赋值
  • 比较和逻辑运算符( <、>、<=、>=、==、&、| )
  • If else 语句
  • 平方根、对数和指数

查看使用优达学城的技术要求

为什么学习这门课程?

你将…

  • 通过探索性数据分析了解数据分析过程。
  • 通过相应的可视化探索各个层级的数据。
  • 掌握总结数据的统计知识。
  • 在展开数据分析时,保持好奇心和怀疑态度。
  • 对数据集产生直觉认识,了解数据是如何生成的。
我将获得什么?
Instructor videos Learn by doing exercises Taught by industry professionals