单项课程

用 R 进行数据分析

by
Facebook

直观地分析和总结数据集

纳米学位项目

获得纳米学位证书,加速你的职业发展。

关于此课程

探索性数据分析是一种总结和直观呈现数据集重要特性的方法。探索性数据分析由 John Tukey 推广开来,主要侧重于探索数据,从而发现数据的基本结构和变量,使我们对数据集产生直观的认识,并了解该数据集是如何存在的,以及如何通过更加正式的统计方法调查该数据集。

* 本课程为企业专享单项课程。

学费
免费
学习时间
大约 2 个月
难度
中级
你将获得

丰富的教学材料

互动随堂练习

业界专业导师

自主掌握进度

开始你的旅程

学习这门单项课程,迈出通往 职业道路的第一步。

单项课程

用 R 进行数据分析

合作企业Facebook

通过创新性的自主学习方式,掌握新技能,提升竞争力。

Icon steps
 
 

课程讲师

Moira Burke

Moira Burke

Facebook 数据科学家

Chris Saden

Chris Saden

优达学城讲师

Solomon Messing

Solomon Messing

Facebook 研究科学家

Dean Eckles

Dean Eckles

Facebook 数据科学家

你将学到什么

课程 1

What is EDA?

  • Start by learn about what exploratory data analysis (EDA) is and why it is important.
课程 2

R Basics

  • EDA, which comes before formal hypothesis testing and modeling, makes use of visual methods to analyze and summarize data sets.
  • R will be our tool for generating those visuals and conducting analyses.
  • We will install RStudio and packages, learn the layout and basic commands of R, practice writing basic R scripts, and inspect data sets.
课程 3

Explore One Variable

  • Perform EDA to understand the distribution of a variable and to check for anomalies and outliers.
  • Learn how to quantify and visualize individual variables within a data set to make sense of a pseudo-data set of Facebook users.
  • Create histograms and boxplots, transform variables, and examine tradeoffs in visualizations.
课程 4

Explore Two Variables

  • DA allows us to identify the most important variables and relationships within a data set before building predictive models.
  • Learn techniques for exploring the relationship between any two variables in a data set.
  • Create scatter plots, calculate correlations, and investigate conditional means.
课程 5

Explore Many Variables

  • Learn powerful methods and visualizations for examining relationships among multiple variables.
  • Reshape data frames and how to use aesthetics like color and shape to uncover more information
  • Continue to build intuition around the Facebook data set and explore some new data sets as well.
课程 6

Diamonds and Price Predictions

  • Investigate the diamonds data set alongside Facebook Data Scientist, Solomon Messing.
  • See how predictive modeling can allow us to determine a good price for a diamond.
  • As a final project, you will create your own exploratory data analysis on a data set of your choice.

先修知识及要求

已经具有统计学方面的知识,但是并非必须掌握。相关主题包括:

  • 平均数、中位数、众数
  • 正态分布、均匀分布和偏态分布
  • 直方图和箱线图


熟悉以下 CS 和数学内容将有助于你学习本课程:

  • 变量赋值
  • 比较和逻辑运算符( <、>、<=、>=、==、&、| )
  • If else 语句
  • 平方根、对数和指数

查看使用优达学城的 技术要求

为什么学习这门课程?

你将…

  • 通过探索性数据分析了解数据分析过程。
  • 通过相应的可视化探索各个层级的数据。
  • 掌握总结数据的统计知识。
  • 在展开数据分析时,保持好奇心和怀疑态度。
  • 对数据集产生直觉认识,了解数据是如何生成的。
我将获得什么?
教学视频随堂练习专业导师