1
数据科学家的需求仍然很高,几乎每个行业的企业都希望从其蓬勃发展的信息资源中获得最大价值。
“随着企业开始充分利用内部数据资产,以及审视数百个第三方数据源的整合,数据科学家的作用也在变得越来越重要,”咨询公司Protiviti总监Greg Boyd这样说。
“过去,负责数据的团队只是IT部门的后台,执行关键数据库任务,确保各种公司系统得到数据‘燃料’的支持,这让企业高管能够报告运营情况并提供财务结果。”
这个角色很重要,但冉冉升起的业务明星都是那些精明的数据科学家,他们不仅能够利用复杂的统计和可视化技术处理大量数据,而且具有极强的敏锐度,让他们可以从数据中得到前瞻性的洞察,这些洞察有助于预测潜在结果,并减少对企业的潜在威胁。
那么,成为数据科学家需要具备哪些条件呢?下面就是我们根据IT领导者、行业分析师、数据科学家的看法,总结出的一些重要属性和技能。
2
数据架构
数据科学家必须从一开始、到模型、再到业务决策的过程中,就了解数据的所有情况。
“如果不去了解架构可能会对样本规模的推论和假设产生这样严重的影响,这就会导致错误的结果和决策,”Fralick说。
更糟糕的是,架构内部也可能会发生变化。Fralick说,如果不了解对模型的影响是从何而起的话,数据科学家最终可能会“不得不重做模型”,或者突然遇到模型不准确的情况而不知道其中原因。
Fraclick表示,虽然Hadoop通过将代码传递给数据(而不是相反)来通过提供大数据,但了解数据流或数据管道的复杂性对于确保基于事实的决策制定是至关重要的。
3
风险分析、过程改进、系统工程
敏锐的数据科学家需要了解分析业务风险、改进流程以及系统工程等概念。
Fralick表示:“我所知的优秀数据科学家无一不具备这些能力。他们紧密合作,对内焦点是数据科学家,对外专注于客户。”
对内,数据科学家应该谨记“科学家”三个字,遵循良好的科学理论,Fralick这样说。
在模型开发开始时进行风险分析可以降低风险。“表面上看,这些都是数据科学家了解客户想要解决什么问题索要具备的技能。”
Fralick表示,将支出与流程改进联系起来,了解固有的那些公司风险,以及可能影响数据或模型结果的其他系统,这些可以通过数据科学家的努力实现更高的客户满意度。
4
解决问题的能力和良好的商业直觉
一般来说,伟大的数据科学家所展现的特质,与任何一个好的问题解决者都是相同的。Nimeroff表示:“”他们会从多角度看待世界,他们会在动用所有工具之前,先了解他们应该做什么,他们以严谨而完整的方式工作,并且能够顺利地解释他们的执行结果。”
当评估数据科学家等职位的技术专业人士时,Nimeroff会寻找这些特质。“这种方法成功的几率要比失败的几率高得多,并且也确保了潜在的优势得以最大化,因为批判性思维已经走到了最前沿。”
寻找一位优秀的数据科学家,就是要寻找拥有某种矛盾性技能的人:可以应对数据处理,并创建有用的模型;能直观地理解他们正在尝试解决的业务问题、数据的结构和细微差别、以及模型的工作原理,商业软件供应商Paytronix Systems的Paytronix Data Insights主管Lee Barnes这样说道。
“其中第一个是最容易找到的;大多数拥有良好数学能力,拥有数学统计学、工程学或其他科学学科学位的人,可能在这方面是非常出色的。第二个却很难找到。令人惊讶的是,很多人建立了复杂的模型,但是当他们被问及为什么他们认为这个模型能够奏效、或者为什么他们选择这个方法的时候,他们却无法给出一个很好的答案。”
这些人也许能够解释模型有多准确,“但是,如果不理解模型为什么以及如何工作,就很难对他们的模型抱有很大的信心。能够对于正在做的事情有更深入的了解和直觉,这样的人才是真正的数据科学家,并且可能在这个领域拥有成功的职业生涯。”Barnes说。
文章与部分图片来源于网络,如有疑问,请联系删除
领取专属 10元无门槛券
私享最新 技术干货