每日一句
一生中总会遇到这样的时候,
你的内心已经兵荒马乱天翻地覆了,
可是在别人看来你只是比平时沉默了一点,
没人会觉得奇怪。
这种战争,注定单枪匹马。
——白岩松《痛并快乐着》(L小昊)
在今天的数据科学成熟度模型(DSMM)维度讨论中,我将重点关注“协作”维度:
数据科学家如何和企业中的其他人相互协作
例如,业务分析师,应用程序和仪表板开发人员,
来发展和交付数据科学工作产品呢?
数据科学项目通常涉及协作,我们将协作定义为“两个或更多人或组织共同努力实现同一个目标”。对企业产生积极影响的成功数据科学项目通常需要多个人的参与,例如:数据科学家,数据/业务分析师,业务负责人,业务领域专家,应用程序/仪表板开发人员,数据库管理员和信息技术(IT)管理员。协作可以是非正式的或正式的,但是在更好的情况下,我们寻求支持,鼓励,监控和指导参与者之间更好的协作。
与本系列的前几部分一样,我们将讨论“协作”维度的5个成熟度等级中的每一个:
第1级:数据分析师经常在孤岛中工作,孤立地执行工作并在本地环境中存储数据和结果。
1级企业经常遭受“孤岛效应”,企业不同部门的数据分析师孤立地工作,只关注他们可以访问的数据,回答他们部门或组织的问题。即使基本问题相同,在一个领域产生的结果可能与另一个领域的结果不一致。这些差异可能是由于使用不同数据或相同数据的不同版本,或采用不同的方法来达到给定结果。这些差异可以带来有趣的跨组织或企业范围的争论会议。
第2级:IT和业务线组织之间存在更大的协作。
2级企业寻求传统数据保管员(信息技术)与各种业务部门之间的更大合作。数据和结果的共享可能仍然是临时的,但更大的协作有助于识别数据以解决重要的业务问题并在组织或企业内传达结果。
第3级:认识到需要在数据科学项目的各个参与者之间加强合作。
随着数据科学家的引入以及更多地使用数据来解决业务问题的愿望,3级企业认为需要在参与或受数据科学项目影响的各个参与者之间进行更多的协作。其中包括数据科学家,业务分析师,业务负责人和应用程序/仪表板开发人员等。协作采用数据科学工作产品的共享,修改和传递的形式。工作产品包括,例如,原始数据和转换,数据可视化图和图表,要求和设计规范,直接或基于网络的笔记本(例如,Zeppelin,Jupyter)编写为R / Python / SQL /其他脚本的代码和预测模型。可以使用具有版本控制的传统工具(例如源代码或对象存储库)等等。
第4级:广泛使用引入的工具,以便共享,修改,跟踪和传递数据科学工作产品。
4级企业以3级的进展为基础,推出专门用于加强数据科学项目参与者之间协作的工具。这包括支持共享和修改工作产品,以及跟踪更改和工作流程。能够以无缝和受控的方式在定义的工作流程内交付工作产品是其中的关键。有时候企业内的不同组织可能会尝试各种工具,这些工具通常无法互操作。
第5级:在整个企业中引入标准化工具,以实现无缝协作。
虽然4级企业在加强协作方面取得了重大进展,但5级企业对工具进行了标准化,以促进数据科学项目参与者之间的跨企业协作。
在我们明天的文章中,我们将介绍数据科学成熟度模型的“方法论”维度。
分享:
领取专属 10元无门槛券
私享最新 技术干货