我在我的Ubuntu机器上安装了一个Kubernetes集群。它由三台机器组成:一个主/节点和两个节点。
当我关闭集群时,它从未停止打印“等待拆卸豆荚”:
root@kubernetes01:~/kubernetes/cluster# KUBERNETES_PROVIDER=ubuntu ./kube-down.sh
Bringing down cluster using provider: ubuntu
Identity added: /root/.ssh/id_rsa (/root/.ssh/id_rsa)
No resources found
No resources found
ser
我有一个在名称空间NA中运行的Kubernetes服务,它被配置为作为服务帐户A运行。该服务在命名空间NB中调度Kubernetes作业。如何代表服务帐户A在NB中执行作业?我尝试为作业指定服务帐户的名称,但得到以下错误: Error creating: pods "pod_id_x is forbidden: error looking up service account NB/A: serviceaccount "A" not found 附注:我使用的是Google Kubernetes引擎
我有一个奇怪的问题,在Kubernetes上运行的Spark作业失败了,在有很多随机操作的作业中,会出现很多"Missing a output location for shuffle X“。增加executor内存并没有什么帮助。在本地*模式下,相同的作业只在Kubernetes集群的一个节点上运行,但是运行得很好,所以我怀疑它与Kubernetes或底层Docker有关。当一个executor死了,pods会被立即删除,所以我不能追踪它失败的原因。有没有一个选项可以保留失败的pod,以便我可以查看它们的日志?
我已经执行了"Kubernetes Up and Running“一书中的示例,其中运行了一个带有工作队列的pod,然后创建了一个k8s作业来消耗队列上的所有工作。我已经复制了下面的yaml api对象。
我的期望是,一旦一个k8s作业完成,它的豆荚就会被删除,但是kubectl get pods -o wide显示豆荚仍然存在,尽管它报告了0/1的容器,并且它们似乎仍然分配了ip地址--参见下面的输出。
何时从kubectl get pods的输出中移除已完成的作业吊舱,为什么在完成所有容器后,这不是正确的?
当豆荚像IP地址一样完成时,它们是否会消耗任何资源,或者信息是否被
我试图从Kubernetes Web的Pods页面中删除一个失败的pod,但是它没有被删除。
我理解错误本身是什么,我相信我已经通过使用secrets解决了它,因为这是一个私人回购。尽管如此,我不能再次正确地重新添加豆荚,因为它已经存在。
下面是我在Kubernetes UI中的Pods页面上看到的内容:
Pod状态: Waiting: ContainerCreating
误差
Failed to pull image "<USERNAME>/<REPO>:<TAG>":
failed to run [fetch --no-store do
我能够使用多个并行工作进程成功地运行Kubernetes作业,方法是遵循官方Kubernetes文档()中的“使用工作队列进行精细并行处理”中提供的示例。
例如,在Job文件中使用parallelism: 2,我能够并行地完成两个工人吊舱上的任务。
因此,命令:
kubectl get jobs
返回:
NAME COMPLETIONS DURATION AGE
worker 2/1 of 2 1h 6h
我的问题是:如何精确地解释完成列中的符号2/1
当我尝试安装图表时,pods卡在挂起状态。 描述下面给出的pods错误 Node-Selectors: ads.open.com/elasticsearch=true
Tolerations: node.kubernetes.io/not-ready:NoExecute for 300s
node.kubernetes.io/unreachable:NoExecute for 300s
open.com/elasticsearch=true:NoSchedule
Events:
Type Reason