Databricks(Apache Spark数据分析引擎的母公司)最近发布了统一数据分析平台,其中包括一个名为AutoML Toolkit的自动化机器学习工具。
通过自动化数据科学工作流的各个步骤——包括特征工程、超参数调优、模型搜索和部署——以获得完全受控和透明的增强ML体验。该工具包可用于帮助数据科学团队提高生产效率。这是Databricks实验室提供的面向公民和专家数据科学家的定制化解决方案。在MLflow中,AutoML工具包的执行会被自动跟踪。
Databricks实验室项目是一个实验性的端到端监督学习解决方案,用于自动化特征清理、特征向量化、模型选择和训练、超参数优化和选择、批量预测以及记录模型结果和训练运行等步骤。
统一分析平台主要包括以下三个组件:
Databricks还提供与第三方机器学习工具的集成,如H2O的Sparkling Water、DataRobot和XGBoost。
要了解有关新的分析平台和AutoML toolkit的更多信息,请查看以下资源:
原文链接:
Databricks’ Unified Analytics Platform Supports AutoML Toolkit
领取专属 10元无门槛券
私享最新 技术干货