创建分析数据集

为分析和建模准备数据

初级

大约 2 个星期

6小时每周 (自主学习)

由以下企业参与制作:
加入成千上万的全球学员

开始免费课程

加入课程
免费
可享受
课程视频
实战练习
初级

大约 2 个星期

6小时每周 (自主学习)

由以下企业参与制作:
加入成千上万的全球学员

课程概述

本课程为学生提供输入、清理、混合和格式化数据以供分析所需的基础知识。你将学习:

  • 数据的常见来源与类型
  • 使用数据识别和纠正常见问题
  • 以有用的方式格式化数据以供分析
  • 混合多个来源的数据


    在此课程中,你将学习在一个名为 Alteryx 的数据分析程序中运用你所学知识的技巧。在课程结束时,你将根据课程中学到的原则完成一个项目。

    喜欢这门课程?加入“商业预测分析”纳米学位,点此免费体验

  • 为什么学习这门课程?

    你听说过“垃圾进,垃圾出”这个说法吗?无论在分析领域还是其他任何地方都是如此。在此课程中,你将学习如何准备数据,以确保分析的有效性,这是使用先进分析的任何人都必须掌握的一项基本技能。你将在不断熟练 Alteryx(一款数据分析工具,用于快速准备、混合和并分析数据)的过程中学会此技能。对于想要从事业务分析但缺乏编程经验的人来说,此课程是理想的选择。

    先修要求

  • 无需编程经验
  • 希望借助数据做出更好的商业决策
  • Alteryx 软件许可(向纳米学位学生免费提供,仅与 Windows 兼容)
  • 查看使用优达学城的技术要求

    学习计划

    第 1 课 – 了解数据

    在这节课中,你将了解结构化、非结构化和半结构化数据之间的差异。你也将认识最常见的数据类型:字符串、数字、日期/时间、布尔值和特殊字符。

    第 2 课 – 数据问题

    这节课中,你将学习如何清理脏数据和准备数据以供分析。你将学习如何识别和纠正常见数据问题,如丢失数据、重复数据、特殊字符及异常值。

    第 3 课 – 数据格式

    这节课中,你将了解数据格式对分析的影响。你将学习如何使用常见格式化技术,如换位、聚集和交叉制表。

    第 4 课 – 数据混合

    在这节课中,你将学习如何将多个来源的数据组合到一个数据集中。你将学习如何使用常见的混合技术,如连接、结合、模糊匹配及空间混合。

    讲师与合作伙伴

    Maureen Wolfson

    Maureen Wolfson

    Maureen Wolfson 是 Alteryx, Inc 的一名解决方案工程实践主管。她拥有超过 20 年的数据分析经验,擅长数据准备、客户和地理空间分析。在过去 13 年里,她曾在 Alteryx 担任过产品管理、支持、培训、客户管理和解决方案工程职位。Maureen 拥有滑铁卢大学环境研究学士学位及约克大学工商管理硕士 (MBA) 学位。Maureen 在闲暇时候喜欢进行户外活动,比如爬山或骑行。

    官方微信公众号二维码

    优达学城(Udacity)微信