Free Course

机器学习入门(中/英)

有趣及有利的特征识别

开始学习

关于此课程

如今,机器学习是通向数据分析领域最令人兴奋的职业生涯的“头等舱”机票。随着数据源以及处理这些数据所需计算能力的不断增殖,直捣数据“黄龙”已成为快速获取洞见和做出预测的最简单直白的方法。

机器学习将计算机科学和统计学结合起来,驾驭这种预测能力。对于所有志向远大的数据分析师和数据科学家,或者希望将浩瀚的原始数据整理成提纯的趋势和预测值的其他所有人士,机器学习都是一项必备技能。

本课程将透过机器学习的视角向你讲授终端到终端的数据调查过程。课程将向你讲解如何提取和识别最能表示你的数据的有用特征、一些最重要的机器学习算法,以及如何评价你的机器学习算法的性能。此课程提供中文版本。

喜欢这门课程?加入“机器学习工程师”或“数据分析师纳米学位。

学费
免费
学习时间
大约 10 WEEKS
难度
中级
你将获得

Rich Learning Content

Interactive Quizzes

Taught by Industry Pros

Self-Paced Learning

Student Support Community

开始你的旅程

学习这门免费课程,迈出通往职业道路的第一步。

免费课程

机器学习入门(中/英)

合作企业

通过创新性的自主学习方式,掌握新技能,提升竞争力。

Icon steps 54aa753742d05d598baf005f2bb1b5bb6339a7d544b84089a1eee6acd5a8543d
 
 

课程讲师

Katie Malone
Katie Malone

斯坦福大学实验粒子物理博士,Civis Analytics 数据科学家

Sebastian Thrun
Sebastian Thrun

优达学城创始人,斯坦福大学教授,Google 研究员

你将学到什么

Lesson 1

Welcome to Machine Learning

  • Learn what Machine Learning is and meet Sebastian Thrun!
  • Find out where Machine Learning is applied in Technology and Science.
Lesson 2

Naive Bayes

  • Use Naive Bayes with scikit learn in python.
  • Splitting data between training sets and testing sets with scikit learn.
  • Calculate the posterior probability and the prior probability of simple distributions.
Lesson 3

Support Vector Machines

  • Learn the simple intuition behind Support Vector Machines.
  • Implement an SVM classifier in SKLearn/scikit-learn.
  • Identify how to choose the right kernel for your SVM and learn about RBF and Linear Kernels.
Lesson 4

Decision Trees

  • Code your own decision tree in python.
  • Learn the formulas for entropy and information gain and how to calculate them.
  • Implement a mini project where you identify the authors in a body of emails using a decision tree in Python.
Lesson 5

Choose your own Algorithm

  • Decide how to pick the right Machine Learning Algorithm among K-Means, Adaboost, and Decision Trees.
Lesson 6

Datasets and Questions

  • Apply your Machine Learning knowledge by looking for patterns in the Enron Email Dataset.
  • You'll be investigating one of the biggest frauds in American history!
Lesson 7

Regressions

  • Understand how continuous supervised learning is different from discrete learning.
  • Code a Linear Regression in Python with scikit-learn.
  • Understand different error metrics such as SSE, and R Squared in the context of Linear Regressions.
Lesson 8

Outliers

  • Remove outliers to improve the quality of your linear regression predictions.
  • Apply your learning in a mini project where you remove the residuals on a real dataset and reimplement your regressor.
  • Apply your same understanding of outliers and residuals on the Enron Email Corpus.
Lesson 9

Clustering

  • Identify the difference between Unsupervised Learning and Supervised Learning.
  • Implement K-Means in Python and Scikit Learn to find the center of clusters.
  • Apply your knowledge on the Enron Finance Data to find clusters in a real dataset.
Lesson 10

Feature Scaling

  • Understand how to preprocess data with feature scaling to improve your algorithms.
  • Use a min mx scaler in sklearn.

先修知识及要求

要想通过本课程,你必须事先精通 Python 编程,并了解基本统计学知识。如果你需要回顾一下这些主题,可以看一看以下课程:

另一门课程数据科学入门最好也学一下,因为它将有助你熟悉如何以科学的方式解决问题。然而,不需要完成此额外课程,即能够通过本课程。我们还将用到一点点 git 的东西,相关课程也可以在优达学城上找到。

有一点我们不作要求,那就是你不需要事先了解机器学习。如果你是刚刚接触机器学习的初学者,那你来对地方了。

查看使用优达学城的技术要求

为什么学习这门课程?

这门课程中,你将手脑并用,通过实践来学习!我们将通过展示引人入胜的使用案例以及解决趣味横生的现实世界问题(例如无人驾驶车),将机器学习带到现实生活中来。在毕业设计中,你将挖掘美国安然(Enron)公司的电子邮件和财务数据,找出美国历史上一次最大的公司欺诈案中的利益相关人士。

完成此入门课程之后,你将可以使用机器学习技术分析数据,也准备好攻读我们的数据分析师纳米学位了。课程一开始,为了助你在机器学习的旅程上起步,我们将教你如何使用辅助工具(如预先写好的算法与程序库)回答有趣的问题。

我将获得什么?
Instructor videos Learn by doing exercises Taught by industry professionals