一年一度的高考又开始了。过了这几天,全国九百多万高中生们将告别只有文理科的日子,步入种类繁多的“专业”世界。最近两年,随着科技的发展,以“大数据”为代表的数据行业引领了一波新的择业热潮。这个行业到底怎么样?从业人员收入几何?作为数据界的网红,DT君今天就带大家一窥究竟。
DT君当年在高考的时候,常常被一个问题困扰:到底是大学重要,还是专业重要呢?不同的“过来人”往往会给我不同的答案。如今DT君作为一个过来人,也有自己的看法:高考不是终点,选择一个“合适的”专业,可能决定了你未来职业道路的方向。
最近几年,以“大数据”为代表的相关高科技行业在全球风头正劲。从2016年开始,教育部更是陆续在全国35所高校,新增了“数据科学与大数据技术”专业(专业代码080910T)。
作为数据界当仁不让的网红,DT君也无比关心各位考生们的前途和钱途。去年,图书出版公司O'Reilly发布了一份《2016数据科学从业者薪酬报告》(2016 Data Science Salary Survey),它调查了来自45个国家983位数据科学领域从业者,从多个角度回答了那些关于数据行业的“小秘密”。
报告显示,接受调查的数据科学领域从业者薪酬中位数是87,000美元,相比去年的91,000美元有些微下降。
先不要急。其实出现这一现象的原因主要是,在参与调查的从业者中,来自美国以外的,还有30岁以下的占比相对往年的更高了。

报告还调查了从业者们过去三年来的薪酬涨跌情况,超过八成的从业者们薪酬上涨。
不过从业者之间薪酬涨幅差别还是很大的,有11%的人三年来仅上涨了不到一成,但前6%人的薪酬却直接翻了三倍。真是同人不同命。
那么出现这种差别的原因是啥?
根据接受调查从业者的情况来看,影响薪酬水平高低的主要是下面这些要素。
首先,从业者所处的国家对数据科学从业者的薪酬有巨大的影响。报告表示,除了少数例外,从业者所在地的GDP水平差不多就能代表其薪酬水平。

美国的薪酬水平最高,六成接受调查的从业者来自美国,他们的薪酬中位数是106,000美元,比样本整体中位数高出1/5。
而亚洲与非洲的薪酬水平则最低。
第二个影响从业者薪酬水平的要素是性别。在工作角色与技能等其余变量都一样的情况下,女性从业者赚得比男性要少。从接受调查的从业者情况来看,女性薪酬的中位数比男性要少10,000美元。
报告显示,其余影响到薪酬的要素还有从业者的工作经验、年龄以及所处行业:
报告显示,开会时间越长的人赚得越多。但这并不能保证开会时长与收入之间必然的因果关系:如果你安排了一堆会议,却不改变工作期间的其他方面,那么你将很难提高你的收入。

从写代码的时长来看,收入中位数最高的是每周写代码4-8小时的小组,收入最低的是完全不写代码的。值得注意的是,今年只有8%的人表示他们从不写代码,而去年有20%。可见写代码已经是数据科学家不可或缺的一部分工作。
SQL、Excel、R以及Python是使用最为普遍的几个工具;而Python跟Spark是对从业者薪酬贡献最大的两个工具。

根据调查结果形成的这张图能够很好地估算拥有不同计算机语言能力组合的人挣钱能力的差距,但报告也提示:最好不要依据它来决定你接下去需要学习哪种语言。
你需要关注的问题是:哪种语言能帮你完成你的工作?
比如,如果你所需要分析的数据量都不足以填满你的本地内存,那么学习操作分布式计算的语言就不能够帮助你涨薪。
报告给你提供了下面几个序列的学习套路:

你还需要知道:
1.学习了一个序列的前几种语言后,学习者通常会继续学习这一个序列后面的语言;
2.学习者按照序列进阶到下一种语言,涨薪幅度将高于他进阶到其他种类的语言。
最后,DT君祝今年参加高考的你们旗开得胜,考上自己最理想的大学,学习你们最喜欢的专业!
编辑|唐也钦:tangyeqin@dtcj.com 图片|许天宇