在本文[1]中,我将尝试对 MLOps 进行友好的介绍,并以简单的方式解释关键概念。作为一开始也觉得很难理解的人,我理解有必要对这个主题进行更简单的介绍。我希望在阅读本文后,初学者能够更轻松地阅读有关 MLOps 的更高级文档。
由于机器学习技术在各个研究领域的成功,许多公司都试图将其纳入他们的软件系统,以提高效率和解决现实世界的问题。然而,对于许多公司而言,在生产环境中实施机器学习可能是一个具有挑战性且耗时的过程。此外,一旦部署,就必须管理和维护模型,并且必须监控其性能以确保其正常运行。这些任务在大型软件系统中尤其困难。
另一方面,软件工程师使用 DevOps(开发和运营)范式,这是一组促进开发和运营团队之间协作和沟通的实践和工具,以开发和管理他们的系统。这有助于保持开发速度和质量。MLOps 旨在使这些 DevOps 原则适用于机器学习系统。考虑到这一背景,MLOps 到底是什么?
要定义 MLOps,让我们从检查各种定义开始:
基于前面的定义,我们可以将 MLOps 理解为一组用于以高效、优化和有组织的方式设计、构建和部署机器学习模型的技术和实践。这些技术和实践通常在 MLOps 生命周期的上下文中进行讨论。
MLOps 生命周期由 MLOps 范例中涉及的步骤和技术组成,从设计和开发机器学习模型到将其部署到生产环境中并随着时间的推移对其进行监控和维护。它通常分为三个主要阶段:
在部署模型后,随着时间的推移保持模型的性能很重要,因此这些阶段通常以循环方式执行。这确保了模型运行良好并且仍然满足第一阶段定义的需求。现在我们已经讨论了 MLOps 生命周期的各个阶段,让我们检查一下 MLOps 工作流,它概述了在流程的每个阶段执行的特定任务和活动。
MLOps 工作流概述了开发、部署和维护机器学习模型要遵循的步骤。在理想情况下,遵循工作流程就足够了:首先,了解业务问题,然后选择、训练和部署模型。然而,在现实世界中情况并非总是如此。在任何时候,都可能需要返回到上一步。此外,在部署模型后,必须对其进行维护和监控,这就是理解 MLOps 生命周期和 MLOps 工作流很重要的原因。
MLOps 工作流程的第一步是了解业务问题,这涉及定义模型的输入和输出,以及流程及其各种子任务。要构建此过程,您可以使用 AI(人工智能)画布或 ML(机器学习)画布,它们可以被视为组织 MLOps 工作流程的模板。AI 画布通常为 ML/AI 实现提供高级结构,而 ML 画布提供系统的高级描述和细节。
让我们举个例子!假设为了改进其产品,一家乳制品公司有兴趣收集消费者的反馈。为此,需要对消费者对社交媒体平台上的产品的评论进行情绪分析。机器学习技术可用于训练模型,将这些评论的情绪分类为正面、负面或中性。这将使公司能够更好地了解客户对其产品的体验,并确定需要改进的地方。此业务问题描述已转换为 AI 画布和/或 ML 画布,以获得更清晰的表示:
了解手头的业务问题后,MLOps 工作流程的下一步就是数据工程流程。这包括数据摄取、探索和验证、数据清理、数据标记和数据拆分。
MLOps工作流程的第三步是机器学习工程,包括模型训练、模型评估、模型测试和模型打包。
在此步骤中,模型已准备好部署到生产环境中。模型部署包括三个步骤:模型服务、性能监控和性能日志记录。
在本文中,我们简要介绍了 MLOps。我们讨论了对 MLOps 的需求,提出了各种定义,解释了 MLOps 生命周期,并描述了 MLOps 工作流程。如果您想了解有关 MLOps 的更多信息,我推荐 ml-ops.org 以获取更多信息。
这是关于 MLOps 的第一篇文章,当然不是最后一篇!我将编写更多关于 MLOps 及其各种技术的教程,并提供示例,敬请期待。如果您有任何问题或建议,请随时在下方给我留言。
[1]
Source: https://towardsdatascience.com/a-beginner-friendly-introduction-to-mlops-95282f25325c