在GCP上启动Kubeflow管理集群

文章/答案/技术大牛

发布

1回答

KubeFlow端到端(Google )

我试图在codelab 之后创建一个集群。/kubeflow-qwiklab Message:{"ResourceType":"gcp-types/container-v1beta1:projects.locations.clusters“，"/gcp.go:278“错误:无法应用KfApp：(kubeflow.error)：代码500与消息一起应用：(kubeflow.error)：代码400与消息

浏览 0提问于2019-09-15得票数 1

1回答

、、、、

因此，目前我正在尝试通过Google Cloud shell using this指南来设置这个管理集群。然而，我一直面对着沿途的台阶。第一个事实是，kpt似乎不再具有任何kpt cfg功能。fn pkg 因此，我使用0.39.3在本地创建了Kptfile，然后将其放置在目录中，以便Google Cloud Shell拾取。

浏览 11提问于2021-08-24得票数 0

2回答

Kubeflow在GCP上的部署

、、

几周来，我一直在阅读ML在生产中的不同方法。我决定测试Kubeflow，并决定在GCP上测试它。我开始使用Kubeflow官方网站(这里是https://www.kubeflow.org/docs/gke/)上的guiidline在GCP上部署kubeflow。我遇到了很多问题，很难解决。我开始寻找一种更好的方法，我注意到GCP AI platfor

浏览 51提问于2021-01-09得票数 1

2回答

AWS/ on上的Kubeflow管道目前可行吗？

、、、

我正在测试kubeflow管道，并希望在AWS/ on上使用它，但是我看到了下面对文档的评论。我应该等着把它和AWS/on一起使用吗？由于Kubeflow /管线#345和Kubeflow/管线#337，Kubeflow管道依赖于Google平台(GCP)服务，其中一些功能目前不受非GKE集群的支持。

浏览 0提问于2019-04-05得票数 0

回答已采纳

1回答

Kubeflow无法同时使用CLI和控制台进行部署

、、、

我昨晚删除了我的KF集群来创建一个新的集群(使用kubectl集群命令而不是Kfctl delete)，然后当我绑定到创建一个新的集群时，它失败了，它不能与CLI而不是控制台一起工作。我发现其他人以前也遇到过这个问题，例如(和) “但是，正如我所说的，即使使用CLI，我的部署也会失败，来自控制台的错误是:无法应用：(kubeflow.error)：代码500，消息:协调器应用gcp失败：(kubeflow.error)：代码500，消息:gcp应用无法

浏览 17提问于2020-05-11得票数 0

1回答

如何解决在AWS EKS安装程序中执行ksonnet初始化步骤时出现的“找不到Major.Minor.Patch元素”的问题

、、、

我正在遵循官方的AWS EKS 为Tensorflow模型训练设置一个分布式GPU集群，但遇到了一些问题。在使用eksctl创建新集群并验证网关节点上存在相应的~/.kube/config文件后，本教程将指导我在网关节点上执行操作，并使用它来初始化新应用程序：但是to "version:v1.18.9" cluster at address <cluster address> ERROR No Ma

浏览 2提问于2020-11-07得票数 2

2回答

由于权限不足，Katib实验无法访问GCS桶

、

作为连续部署的一部分，我试图在kubeflow集群上运行Google构建的Kubeflow管道。我已经创建了一个服务帐户，并允许访问GCS桶。在Kubeflow管道中，我将服务帐户的用户-gcp应用于所有管道步骤。管道的第一步是在kubeflow命名空间中启动katib实验。然而，实验失败的理由如下。第一个管道步骤启动一个katib实验，并等待它完成。实验成功启动</em

浏览 5提问于2020-07-25得票数 0

1回答

将MLFlow与Kubeflow集成

、、、、

我正在尝试将MLFlow服务器与我在GCP上的Kubeflow集群集成。为此，我创建了一个MLFlow部署，并使用负载均衡器公开它。这是一个截图。 

浏览 2提问于2019-11-04得票数 0

1回答

如何使用Codefresh设置和部署Kubeflow

、、

目前，我使用Codefresh在Kubernetes上部署python脚本。我希望将Kubeflow整合到部署计划中，以获得Kubeflow的所有好处，如UI等，但我有点不知道如何开始或从哪里开始。Kubeflow的文档主要只涉及Google Cloud Platform的设置。有没有人有这方面的经验？

浏览 21提问于2020-03-24得票数 1

1回答

DataBricks + Kedro Vs GCP* + Kubeflow Vs Server + Kedro +气流*

、、

Wi将为所有公司部署多个机器学习模型(一般是高级分析模型)，我们将对所有模型进行管理。我们正在寻找一种管理多个服务器、集群和数据科学管道的解决方案。我喜欢kedro，但不确定在使用kedro时管理所有这些的最佳选择是什么。 AWS作为我们的数据仓库和数据库，用于管理服务器、集群和任务。使用GCP作为数

浏览 5提问于2020-11-20得票数 5

回答已采纳

1回答

从私有google容器注册中心提取图片，并在小型库上使用kubeflow

、、、、

我们很难将管道中的容器上传到Kubeflow，以访问存储在google容器注册表中的私有自定义码头映像。我们在运行在minikube上的kubernetes集群之上运行kubeflow。有人能帮助我们理解如何将访问令牌/服务帐户添加到Kubeflow部署中吗？我们已经阅读了几个在自定义Kubernetes部署上实现此功能的文档，但没有在Kubeflow部署中实现。我们在Kubefl

浏览 5提问于2019-12-17得票数 0

回答已采纳

1回答

Kubeflow-kale :-如何将kubeflow-kale扩展集成到一个独立的Kubeflow管道集群上运行管道

、、、、

目前，我试图在本地jupyterlab服务器上使用kubeflow kale jupyter扩展，而没有安装Kubernetes和kubeflow，并试图在GCP AI管道服务器或任何其他Cloud管道服务器上运行我的代码管道我可以通过kubeflow管线SDK(因为它有添加主机名详细信息的功能)来完成这个任务。但是，当试图通过库贝弗-卡莱扩展来实现时，它不起作用。如我所知，我们需要提供Kubeflow管道服务器的主机名，这是我无法<

浏览 0提问于2020-09-07得票数 2

回答已采纳

1回答

安装Kubeflow而不具有群集管理权限

、

我想在一个大型kubernetes集群下安装Kubeflow，我是一个名称空间管理员，但不是集群管理员。我一直在关注这个相关的git问题：这个问题表明，v0.6可能提供了这种功能，但是git问题最近还没有更新。现在，版本0.6已经发布，我正试图跟踪这是否是可能的，如果是的话，如何在没有集群管理权限的名称空间下安装Kubeflow。

浏览 0提问于2019-07-20得票数 1

回答已采纳

1回答

当文件到达云存储时触发云ml上的培训任务

、、

我唯一的选择是启用composer并将GPU附加到kubernetes节点，并创建一个云函数来触发一个dag来用GPU启动节点上的结束符并用数据挂载存储桶？似乎有点过分，但我现在想不出另一种方法了。

浏览 4提问于2020-06-15得票数 1

回答已采纳

1回答

如何在KubeFlow中创建和访问持久卷？

、、

我们在GCP上创建了一个KubeFlow集群，并通过它部署了一个ML模型。现在，我们希望创建一个持久卷，并将该卷映射到out主机中的一个文件夹。作为第一步，我必须创建一个pv，所以，我已经在我的GCP实例的木星笔记本中尝试了这一行代码。

浏览 4提问于2022-03-03得票数 0

1回答

Kubeflow与其他备选方案

我试图找出什么时候创建自己的Kubeflow MLOps平台是合理的：如果你是Tensorflow专卖店，你还需要Kubeflow吗？为什么不只是TFX？编曲可以用气流来完成。为什么要使用Kubeflow，如果您使用的都是scikit-学习，因为它不支持GPU，分布式训练方式？如果您确信要使用Kubeflow，云提供商(Azure和GCP)将提供ML管道概念(谷歌在幕后使用Kubeflow )作为托管服务。当部署自己的Kubeflow环境是有意义的时

浏览 4提问于2020-03-21得票数 10

回答已采纳

1回答

带有GPU的GCP* kubernetes节点过早被抢占*

、、、

我在us-central1-a上有一个kubeflow k8s集群，带有自定义的GPU驱动的可抢占节点池：我在这些GPU节点上运行kubeflow笔记本服务器。由于某种神秘的原因，节点在启动后很快就会收到compute.instances.preempted消息(5-10分钟)：为什么会发生这种情况？

浏览 17提问于2019-11-06得票数 0

2回答

您如何通过Google Cloud Composer安排GCP* AI平台笔记本电脑？*

、、、、

我的任务是通过造纸厂操作员自动安排一些每天运行在AI平台笔记本上的笔记本的日程安排，但实际上通过Cloud Composer来做这件事给我带来了一些麻烦。如有任何帮助，我们将不胜感激！

浏览 53提问于2020-01-30得票数 3

回答已采纳

2回答

如何在Python中启动Kubeflow管道开发

、、

我一直在研究Kubeflow，并试图掌握如何用它编写我的第一个hollo程序，并在我的mac上本地运行。我在本地机器上安装了kfp和kubectl。文档是压倒性的，我不清楚如何在没有安装k8s的情况下在本地编程，连接远程GCP机器和本地调试，然后创建压缩和上传或有方法执行代码，看看它是如何在谷歌云上运行？

浏览 5提问于2020-11-21得票数 0

1回答

AWS和GCP集中管理的气流和AWS的数据流等效

、、

我有两个问题要问：因此，我的公司有两个气流运行实例，一个在GCP配置集群上，另一个在AWS配置集群上。由于GCP有Composer，它可以帮助您管理气流，那么是否有一种方法可以将AWS集群中的气流DAG也由GCP管理呢？对于批处理ETL/流作业(在python中)，GCP为此使用了Dataflow (Apache )。AWS相当于

浏览 0提问于2019-08-24得票数 0

点击加载更多

KubeFlow端到端(Google )