前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >k8s集群备份与迁移

k8s集群备份与迁移

作者头像
SRE运维手记
发布2024-09-13 18:45:40
1650
发布2024-09-13 18:45:40
举报
文章被收录于专栏:SRE运维手记

本文以最新版的velero1.14.1为例,分享部署指引及实战经验,备份和还原操作是简单,但是有些细节不了解清楚,有可能会造成大事故,本篇文章将带你了解需要注意的细节。

01、什么是 Velero?

Velero 是一个用Go语言开发的开源工具,用于 Kubernetes 集群的备份、恢复、灾难恢复和迁移。

02、Velero备份工作流程

当用户发起velero backup create时,会执行如下四个动作:

  1. velero客户端调用Kubernetes API创建自定义资源并存储到etcd;
  2. Backup Controller通过Kubernetes API监听到新创建的backup对象,并验证;
  3. Backup Controller开始执行备份,通过Kubernetes API查询查询和收集需要备份的资源;
  4. Backup Controller调用Minio的S3接口上传备份数据。

03、安装步骤

velero在卸载的时候会把所在命名空间的资源清空,所以需要独立部署,在实战中,我们会把minio和velero隔离命名空间进行部署。

下载地址

代码语言:javascript
复制
# velero
wget https://github.com/vmware-tanzu/velero/releases/download/v1.14.1/velero-v1.14.1-linux-amd64.tar.gz
# minio
git clone https://github.com/yilingyi/minio.git

minio安装

  • 修改minio中的values.yaml,有两处storageClass需要根据实际名称进行替换
  • 然后执行helm指令进行部署
代码语言:javascript
复制
helm install minio ./ -f values.yaml -n minio --create-namespace
  • 完成部署后,登录console(默认账号密码是minioadmin)创建bucket,命名为velero

velero安装

  • 在bucket创建后,紧接着解压velero,并在目录下创建S3存储桶凭证credentials-velero,示例如下
代码语言:javascript
复制
[default]
aws_access_key_id=minioadmin
aws_secret_access_key=minioadmin
  • 然后执行如下指令进行安装,需要注意的是,在首次备份期间需要关注集群的IO负载情况,如果负载较高,可以适当调低node agent的cpu和内容资源:
代码语言:javascript
复制
cd velero-v1.14.1-linux-amd64
cp velero /usr/bin/
velero install \
    # 指定存储提供商,minio用的是s3,所以这里是aws
    --provider aws \
    # 指定aws插件
    --plugins registry.cn-hangzhou.aliyuncs.com/yilingyi/velero-plugin-for-aws:v1.10.1 \
    # 指定velero镜像
    --image registry.cn-hangzhou.aliyuncs.com/yilingyi/velero:v1.14.1 \
    # 限制agent CPU和内存资源
    --node-agent-pod-cpu-limit 2 \
    --node-agent-pod-mem-limit 2048Mi \
    # 指定命名空间
    --namespace velero \
    # 指定bucket名称
    --bucket velero \
    # 默认以文件形式备份持久化卷
    --default-volumes-to-fs-backup \
    # 启用node agent 进行备份和恢复操作,--use-restic已启用,从v1.10开始默认使用kopia备份
    --use-node-agent \
    # 指定S3存储桶凭证
    --secret-file ./credentials-velero \
    # 禁用卷快照功能,只使用文件系统级别的备份
    --use-volume-snapshots=false \
    # 配置备份存储位置的详细信息,其中<minio-api-url>填写minio的api地址,如172.33.0.2:9000
    --backup-location-config region=minio,s3ForcePathStyle="true",s3Url=http://<minio-api-url>

04、常用指令

备份

  • 备份所有资源
代码语言:javascript
复制
velero backup create <BACKUP_NAME>

示例

代码语言:javascript
复制
velero backup create my-buckup
  • 常用参数
代码语言:javascript
复制
--include-namespaces 备份指定的命名空间
--include-resources  备份指定的资源,常用的有deployment,pods,services,secrets,configmaps
--exclude-namespace  排除命名空间
--exclude-resources  排除资源
--ttl                备份过期时间,默认为720h,即30天
  • 如果想要排除更细粒度的资源,可以给资源打上标签velero.io/exclude-from-backup=true排除备份,如
代码语言:javascript
复制
kubectl label pv my-pv velero.io/exclude-from-backup=true
  • 查看备份列表
代码语言:javascript
复制
velero get backups
  • 查看备份任务详情/进度
代码语言:javascript
复制
velero backup describe <BACKUP_NAME> --detail

还原

  • 还原所有资源
代码语言:javascript
复制
velero restore create --from-backup <BACKUP_NAME>
  • 常用参数
代码语言:javascript
复制
--include-namespaces 备份指定的命名空间
--include-resources  备份指定的资源,常用的有deployment,pods,services,secrets,configmaps
--exclude-namespace  排除命名空间
--exclude-resources  排除资源
  • 查看还原列表
代码语言:javascript
复制
velero get restores
  • 查看还原详情/进度
代码语言:javascript
复制
velero restore describe <RESTORE_NAME> --detail

定时任务

  • 可以设置定时备份任务
代码语言:javascript
复制
velero schedule create <SCHEDULE_NAME> --schedule="0 1 * * *" --include-namespaces <NAMESPACES> --ttl 240

示例

代码语言:javascript
复制
velero schedule create daily-backup --schedule="0 1 * * *" --include-namespaces argocd,blackbox,chaosblade --ttl 240
  • 查看定时任务
代码语言:javascript
复制
velero get schedules

其他指令

  • velero卸载
代码语言:javascript
复制
velero uninstall

05、k8s集群迁移

在目标集群安装velero,安装参数的s3url(“s3Url=http://<minio-api-url>”)指向源集群的minio,在完成部署后,方可进行备份浏览和还原,但需要注意以下两个细节:

  1. 还原到目标集群的备份数据中不要包含kube-system命名空间的资源,避免冲突
  2. 如果storageClass的名称发生变更,需要进行映射

将下面文件保存为velero-sc.yaml,将<target-sc>修改为目标集群的storageClass名称,并通过kubectl apply -f velero-sc.yaml执行映射,然后再进行数据还原。

代码语言:javascript
复制
apiVersion: v1
kind: ConfigMap
metadata:
  name: change-storage-class-config
  namespace: velero
  labels:
    velero.io/plugin-config: ""
    velero.io/change-storage-class: RestoreItemAction
data:
  cfs-v4: <target-sc>

06、结语

velero使kubernetes的备份、还原和迁移更加灵活和简单,本次分享就到这里,谢谢!

参考链接

https://min.io/docs/minio/linux/index.html

https://cloudcasa.io/blog/getting-to-know-velero-backup-and-important-velero-resources-that-you-can-utilise/

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-09-13,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 SRE运维手记 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
对象存储
对象存储(Cloud Object Storage,COS)是由腾讯云推出的无目录层次结构、无数据格式限制,可容纳海量数据且支持 HTTP/HTTPS 协议访问的分布式存储服务。腾讯云 COS 的存储桶空间无容量上限,无需分区管理,适用于 CDN 数据分发、数据万象处理或大数据计算与分析的数据湖等多种场景。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档