数据是数据,科学家是科学家,数据科学家是21世纪最性感的工作,但是仍有很多朋友不清楚数据科学家的由来。
这里需要引出两位重要人物:
一、第一个爸爸:帕蒂尔博士(DJ Patil)
帕蒂尔博士在学术界的身份是美国马里兰大学的一名教职员工,应用数学博士。他的研究主要集中在非线性动力学和混沌理论(nonlinear dynamics and chaos theory),并创立了一个主要关于数值天气预报(numerical weather prediction)的研究项目。也作为美国国防部技术政策研究员,利用社会网络分析和计算与社会科学的多学科融合技术,来预测国家层面的网络技术威胁。
需要强调的是,他曾在前任美国总统奥巴马的领导下工作,奥巴马总统任命帕蒂尔博士为美国首位首席数据科学家,由他而起,促成了联邦政府中近40名首席数据官的设立。他的工作还包括,建立了美国新的医疗保健项目,包括大名鼎鼎的「精准医疗计划」和「癌症登月计划」,还包括新的刑事司法改革,其中数据驱动的司法和警察数据计划,覆盖了9400多万美国人。他还积极参与美国政府事务,并因其所做的努力而被授予国防部杰出公共服务奖章——这是国防部授予平民的最高荣誉。所以不少人管帕蒂尔博士叫美国首席科学家。
但是帕蒂尔博士在美国政府工作时候的头衔,这并不是数据科学家一词的由来,据帕蒂尔博士介绍,在领英工作期间,人力资源的同事多次抱怨搞不清数据相关的职位,说工作职责中多次提到数据,但是并没有一个清晰的称呼,人力资源部门希望清理组织结构图,希望将数据分析师,业务分析师、与开发者、工程师区分开,帕蒂尔博士在与另一位神秘人士电话讨论之后,得到了,或者说创造了现在最热门的职业——数据科学家。
没错,数据科学家一词诞生了。帕蒂尔博士曾经说过:“我们并没有试图创造一个新的领域,只是试图让人力资源脱离困境。”
帕蒂尔博士还表示,领英(LinkedIn)上的数据科学家工作申请在他们改变了职位的称呼之后飙升,目前在领英(LinkedIn)的页面上,关于“数据科学家”的结果有23749项。
二、第二个爸爸:托马斯·H·达文波特博士(Thomas.H.Davenport)
这位神秘人士是哈佛大学博士,“流程再造之父”托马斯·H·达文波特,智能商业五部曲的作者,《人机共生》、《数据化转型》、《工作中的数据分析》、《成为数据分析师》、《大决策》(这五本书中文版均有销售)。当然也有人管达文波特叫大数据之父。他有很多关于业务流程再造、知识管理、注意力管理、知识工作者生产力和分析竞争的书籍和文章。他的署名也出现在斯隆管理评论、加州管理评论、金融时报、信息周、CIO等众多出版物上。
达文波特博士是巴布森学院信息技术与管理杰出教授、麻省理工学院数字经济倡议研究员、国际分析研究院联合创始人、德勤分析高级顾问。早在2003年,达文波特被“ 咨询”杂志评为全球“25大顾问”之一,并于2005年被Optimize杂志的读者评为世界三大商业和技术分析师之一。从商业和技术分析的角度来讲,达文波特博士是领域翘楚。他在巴布森商学院(Babson)、哈佛商学院(Harvard Business School)、麻省理工斯隆管理学院(MIT Sloan School)和波士顿大学(Boston University)的高管课程中教授分析和大数据。
在普及大数据的知识与技术方面,有着多次探索性和开创性的功劳。例如大数据方面的早期开创性文章“大数据如何不同”。
2006年,他在《哈佛商业评论》(Harvard Business Review)上发表了一篇畅销文章(2007年出版了同名著作),开创了“分析领域的竞争”的概念。同时,他也将自己在分析和大数据方面的工作延伸到到智能领域,例如当智能机器做出许多重要决策时,我们人类将会怎样?
2012年,“哈佛商业评论”在帕蒂尔博士与达文波特博士共同撰写的一篇文章中称之为数据科学家,当然最重要的观点——数据科学家是21世纪最性感的工作。
由于大数据技术是一种新兴技术,而且很难将其提取出来用于分析,所以,要想成为一位成功的数据科学家,就必须具备一些黑客的特征。这就意味着,数据科学家必须具备编码或编程能力。“这样的特征也容易把开发者或者程序员与数据科学家混淆,但是数据科学家值得被区分出来。
以上就是数据科学家一词的由来,以及两位命名者的介绍。
参考文献与资料:
[1] The origins of the job title “data scientist”
[2] 托马斯·H·达文波特,《数据化转型》
[3] How Big Data Is Different?
-完-
亲爱的数据
出品:谭婧
美编:陈泓宇
领取专属 10元无门槛券
私享最新 技术干货