2018年6月13日

数据科学家的职业发展路径是什么

实用 | 数据科学家的职业发展路径是什么?

enter image description here

导语:数据科学家和数据分析师,到底有啥区别?

文/ Priscilla,Udacity数据分析师纳米学位学员

编辑/ 龙哥

这个问题问得好,由工作性质决定,数据科学家的职业发展途径注定是一条漫长而艰辛的道路。因为无论是你的专业技能,思维方式,沟通技巧,执行力,甚至薪资,与曾经比都不是一个level的。

无论哪个行业,每时每刻都会有庞大的数据产生并储存下来,这些数据蕴藏着大量的信息和财富,急需专业人士处理分析。特别是人工智能和金融科技兴起后,数据科学更是作为一切的根基。因此数据科学被「哈佛商业评论」评为21世纪最有潜力的学科。然而数据分析的人才需求每年都在增长,而高校毕业生远远无法符合行业的需求,尤其是真正有实力,有眼光的数据科学家更是凤毛麟角,是各个企业争相聘用的人才。

如果说,数据工程师(Data Engineer)负责整理数据,减少存储成本,方便其他部门调用;数据分析师(Data Analyst)偏重于数据清洗,挖掘,可视化,与商业运用相结合,最后形成切实可行的商业方案。那么数据科学家(Data Scientist)需要具备以上的所有能力,他们不仅仅会coding,还要有周密的产品思维,灵敏的商业嗅觉,深厚的数理功底,过人的沟通技巧,业务和技术两把抓。可谓上得了厅堂,下得了厨房,打得了小三,斗得过流氓。

正因稀缺而有价值,数据科学家的薪资是数据行业中最高的,江浙沪地区基本年薪50万打底;但同时也是最漫长的,成为一个真正意义上的数据科学家,往往需要5到10年的时间,没错,少于5年工作经验是没有资格担任数据科学家的。

那么如何成为数据科学家呢?有两条路可走,让优达菌为你解读。


第一条:转行

适用对象:

1、具备扎实的coding功底及数理基础的技术人才,如资深软件工程师/算法工程师。他们日常从事的工作很大一部分与数据科学重叠,选择技术,制定框架,编写好用的新包,为开源的发展做贡献。长期的读代码,编代码,解决高管及甲方的问题,让他们积累了大量实战经验,能够灵活分析复杂问题及使用各种工具。他们转行后遇到技术上的困难较少,更多是对市场需求的嗅觉不足,也就是业务思维的欠缺,这会导致他们短期内无法接触到业务的核心和前沿。

2、对商业有深度理解,目光敏锐,沟通能力强的商业人才,如咨询师。他们在IT界早已身经百战,时刻从商业模式的链条去分析问题,深入了解用户,知道什么样的产品深得人心,怎么和客户沟通交流,有极高的情商和专业素养。他们转行后需要弥补技术的空白,加上自身出色的业务能力和沟通能力,组建一个团队并与优秀的工程师合作,往往能为公司攻克发展中急需解决的问题。

第二条:从数据分析的基层岗位做起,慢慢求发展

适用对象:技术不过关,项目经验少,业务思维欠缺的小白。你可以先从事以下工作,为数据科学家之路铺砖:

1. 数据分析师

简单说就是为各行各业(甲方)进行数据服务。拿到数据后,按照固定流程,使用R或python等编程语言进行数据清洗,再从数据中找出能驱动解决实际问题的市场痛点,最后用Tableau等可视化软件展现给客户或高层领导。在这个过程中,你需要进行角色互换,从用户的角度思考问题的关键点,与研发部门和产品部门沟通,将整体分析方向控制在切实可行的范围内。如:这项产品的受众是哪些群体?该在哪里投放广告?喜欢这个产品的客户,还要推荐给他什么?

其中,最重要的原则是落地,不落地意味着你所有的工作都是纸上谈兵,makes no sense。有的公司会忽悠股东弄出假大空的目标来,其实短期内根本实现不了。

你将会积累以下技能:

  • 统计学基础(假设检验等)

  • 利用R或python进行数据清洗

  • 可视化技能(Tableau)

  • 基本的产品思维,商业思维和沟通能力

2. 数据工程师

由于公司中的部门太多,数据往往特别脏,各种格式都有,也不方便跨部门调用,因此演变出数据工程师这个职业。数据工程师的最终目的就是实现数据管理,将数据整理成标准格式,降低存储成本,优化查询效率。具体从收集和架构两大方面出发,一方面通过写数据传输包,设计聚合过程,优化存储,来构建和维护数据传输和存储的基础设施,另一方面将原始数据,转化为数据分析师可以制作报表的标准格式化数据。至于数据怎么用,就不是他们关心的了。

举个例子,某宝每天都有海量的用户在浏览,搜索,收藏产品,这就需要有工程师将他们的这些行为写入数据库中存储,再交给数据分析师进行分析,最后根据用户特征给出个性化推荐。

你将会积累以下技能:

  • python, C/C++, Java等语言

  • 计算机结构和算法设计

  • 数据仓库和ETL工具

  • 各种操作系统,如UNIX, LINUX等

  • Spark, Storm, Hive 等开源平台

没有数据分析基础的童鞋们,不妨可以了解一下优达的「数据分析师」纳米学位哦,学完后可以很好的与数据分析师和工程师对接。

3. 数据科学家

当你具备了在上述两个岗位积累多年的经验,此时的你足够担任team leader,领导大家攻克项目。一名优秀的数据科学家需要具备以下软/硬实力:

1、深入市场和业务:眼光必须足够广才能看清问题的本质,这就需要你在漫长的职业生涯中逐渐积累和锻炼。在做项目时,亲自与不同部门(如产品,运营,战略部门)沟通,才能找到核心问题,否则参数调得再溜都没有意义。另外, 多读经管方面的书籍,提升自己的商业管理能力,成为一个精通商业的技术人员。

2、过硬的技术:数据分析师解决不了的问题都要抛给数据科学家,没有过硬的技术怎能hold住场面呢?他们的主要工作是围绕公司最核心的产品解决实际问题,比如说,保险行业偏重于模型预测,基于数据预测多少保费能实现最大化收益;生物公司基于基因组大数据找到靶向位点精准治疗疾病等。掌握机器学习,算法研发,MapReduce框架,Hadoopscripting等种种技能,最终目的是提升用户体验,增强用户粘性,改善数据驱动产品。

怎样才能完成向数据科学家的华丽转身?在此优达菌要打个小广告啦。上周,Udacity在阿姆斯特丹的TNW科技峰会上,也向世界首发新课——「数据科学家」纳米学位,这门与 IBM、Starbucks 等众多创新型企业联合打造的终极课程,让你在7个月内打牢数理统计基础,get到数据行业的核心技能,迅速积累大量的项目实战经验,成为价值不菲的稀缺人才!