首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    在 Kubernetes 上使用 CUDA

    我目前在一台运行 Debian 11 的裸机单节点上使用 containerd 运行 Kubernetes 1.28“集群”,所以这篇文章将假设一个类似的设置,尽管我尝试链接到其他设置的相关资源。...Test PASSED 如果一切正常,只需在每个您想要访问 GPU 资源的工作负载上添加 nvidia.com/gpu 的资源限制即可。...使用 Argo CD,我添加了一个负的 sync-wave 注解,以确保在工作负载之前启动 nvidia-device-plugin 以避免此问题。...但是,我无法让它工作,所以我选择了不幸更多的手动方法,将设备插件、驱动程序和容器工具包作为单独的组件进行安装。 可能是我的设置问题,或者我在文档中理解错了什么。如果您有解决方案,我很乐意倾听!...在撰写本文时,我的完整家庭实验室配置可在 GitHub 上作为参考。

    15510

    在 Kubernetes 上编排 MongoDB 集群

    replicaset: MainRepSet spec: affinity: podAntiAffinity: # 添加 Pod 反亲和性,将副本打散在不同的节点...为了保证应用的稳定性,我们通过 podAntiAffinity 指定了 Pod 的反亲和性,这样可以保证不会有两个副本出现在同一个节点上。...Mac 系统,使用的是 Robo 3T 作为 mongo 客户端,连接到其中一个节点并运行 rs.status() 后,我们可以查看到副本集的详细信息,并检查其他两个 Pod 是否被配置并自动连接到副本集上。...rs.status() 显示副本集名称和成员数量 在成员列表中也可以看到每个成员的 FQDN 名称和状态,不过需要注意的是 FQDN 只能在 Kubernetes 集群内部访问: ?...到这里我们就成功地将 MongoDB 部署到了 Kubernetes 集群,而且还是可伸缩的。

    4.5K42

    手工在Docker for mac上安装Kubernetes

    然后在这方面的知识也就固化在了这个点,再也没有更新。 而实际上Kubernetes大概每三个月发出一个新版本的速度,快速的成长着。...不过第一次安装就碰到了麻烦,在设置中开启Kubernetes支持之后,命令行工具kubectl很快就安装成功,但是Kubernetes一直停留在安装界面,看不到动作和进展。...查了查,发现又卡在了Docker映像文件的下载,Kubernetes毕竟是Google开发的工具,所以放在了Google自己的仓库中,域名是gcr.io,在国内完全无法访问。...其中Kubernetes使用的几个映像,原作者已经下载并导出tar文件,放置到了百度云上,下载地址:https://pan.baidu.com/s/1dzQyiq,密码:dyvi。...其中还共享有一些centos用的Kubernetes软件包,请忽略,在Mac上不需要。

    2.2K40

    Kubernetes 上容器的启动顺序如何把控?

    去年写过一篇博客:控制 Pod 内容器的启动顺序,分析了 TektonCD[1] 的容器启动控制的原理。 为什么要做容器启动顺序控制?...此外还有服务网格的场景,sidecar 容器需要在服务容器启动之前完成配置的加载,也需要对容器的启动顺序加以控制。否则,服务容器先启动,而 sidecar 还无法提供网络上的支持。 现实 ?...Kubernetes 也确实是按照顺序来创建和启动容器,但是 容器启动成功,并不表示容器可以对外提供服务。...在 Kubernetes 1.18 非正式版中曾在 Lifecycle 层面提供了对 sidecar 类型容器的 支持,但是最终该功能并没有落地[2]。 那到底该怎么做?...Kubernetes 源码 在 kubelet 的源码 pkg/kubelet/kuberuntime/kuberuntime_manager.go 中,#SyncPod 方法用于创建 Pod,步骤比较繁琐

    2.1K20

    Jenkins在kubernetes上的初体验

    在 kubernetes 上部署 Jenkins 在k8s上运行jenkins之前,我们需要知道几件事情: 可以通过image修改 jenkins 镜像的版本 可以通过nodeSelector选择 jenkins...k8s 上被指定到了kube-ops命令空间下,如果没有,请提前创建kubectl create ns kube-ops 使用 jenkins 最头疼的事就是插件下载不下来,无法正常运行,因此有两个办法就是...,第一,你把基础插件提前拷贝到存储卷上,第二就是通过把插件打到 jenkins docker 镜像内,其实都一样。...resources: requests: storage: 15G 创建 pv/pvc 对象,这里我们要注意 nfs 提供给 jenkins 的存储目录的权限问题,否则服务因为权限无法写入数据...template: metadata: labels: app: jenkins2 spec: nodeSelector: kubernetes.io

    87610

    在TKE(Kubernetes)集群上安装Rancher

    Rancher提供了在生产环境中使用的管理Docker和Kubernetes的全栈化容器部署与管理平台。 Rancher可以最大程度的降低学习成本,使得刚接触kubernetes的同学快速上手。...那么本文带来的是在TKE集群上安装Rancher 一、 安装Helm 首先在控制台开通helm功能 [jvsm84bykl.png] 二、下载helm client 由于控制台的安装只下发了tiller...所以证书是用到一个在腾讯云上申请的正式证书。 image.png 3....创建证书secret 在申请完毕后,点击下载将证书key存放至服务器上并解压 # 解压 $ unzip tencent.angryhuang.xyz.zip # 进入目录 $ cd Nginx/ $...Waiting for server-url setting to be set 这里是因为cattle-cluster-agent 还没有被创建,需要执行一定的动作才会触发下发agent的流程 等agnet启动完毕后

    3.6K20

    在 Kubernetes 上使用 Argo 实现 CICD

    Argo CD 是一种处理部署的 GitOps 方法,也就意味着 Kubernetes 集群从版本仓库镜像到任意位置时 git 仓库是事实上的唯一来源。...它将作为在工作流步骤中运行节点的名称前缀。它可以定义 volumns,如同你在普通的 Kubernetes 上下文中指定那样。它们可以在定义后当做模板来使用。...需要记住的是每个步骤都运行在它自己的 Docker 容器中,充分利用你的 Kubernetes 集群资源而不必在 AWS 上拆分 EC2 实例。类似这样的事情在例如 Jenkins 上会是一个问题。...所有的步骤在 Kubernetes 它们自身的 Docker 容器运行,所以状态可以通过一个 artifact library 传递。这里有一些可以使用的库。...与我自己实现的 Argo CI 以及 Argo 工作流一起,在 Kubernetes 集群设置运行一个 CI/CD 流水线成为可能。 译者:s1mple_zj

    3.7K20

    在现有 Kubernetes 集群上安装 KubeSphere

    KubeSphere 一开始就推出了开源的社区版本,只是之前提供的安装方式比较单一,在已有的 Kubernetes 集群上要想安装相对较麻烦,本文将为你演示如何在已有的 Kubernetes 集群上安装...ks-account 组件又是依赖 openldap 这个组件的,所以同样启动报错,在安装过程中 openldap 出现了类似如下错误信息。...设置为 False 问题4:在安装过程中 istio 安装不上,由于我当前的集群资源不是很足,所以也临时取消掉 istio 的安装,后续在开启 istio 的支持。...,这种情况我们可以先手动在节点上拉取镜像,然后再重新创建一个新的用于安装的 Job 即可。...Kubernetes 上搭建 EFK 日志收集系统→

    93320

    Jenkins在kubernetes上的落地实践

    在k8s上运行jenkins之前,我们需要知道几件事情: 可以通过 image修改jenkins镜像的版本 可以通过 nodeSelector选择jenkins pod运行在哪个Node(cpu/mem...表示0.2个 我们对jenkins的数据做了持久化配置,通过nfs提供pv,如果你有ceph,glusterfs,可以按需修改 jenkins在k8s上被指定到了 kube-ops命令空间下,如果没有,...请提前创建 kubectl create ns kube-ops 使用jenkins最头疼的事就是插件下载不下来,无法正常运行,因此有两个办法就是,第一,你把 基础插件提前拷贝到存储卷上,第二就是通过把插件打到...ReadWriteMany resources: requests: storage: 15G 创建pv/pvc对象,这里我们要注意nfs提供给jenkins的存储目录的权限问题,否则服务因为权限无法写入数据...template: metadata: labels: app: jenkins2 spec: nodeSelector: kubernetes.io

    79610
    领券