前往小程序,Get更优阅读体验!
立即前往
发布
社区首页 >专栏 >腾讯云迁移方案常见问题

腾讯云迁移方案常见问题

原创
作者头像
用户11390638
发布2024-12-02 01:16:28
发布2024-12-02 01:16:28
1500
举报

上云迁移概述

云计算定义及特点

云计算是一种按需使用、按量付费的服务模式,提供可用的、便捷的、按需的网络访问、可配置的计算资源共享池。其特点包括按需服务、资源池化、弹性扩展、泛网络访问、服务可度量。

上云迁移路线和场景

  1. 主要路线
    • 公有云上云迁移(本课程重点),涉及从 IDC 或友商云迁移到腾讯公有云,以及私有云与公有云之间的迁移。
    • 混合云:兼具安全合规与弹性,适合有特殊资源要求、目标用户分散、规模负载不可预测、强数据监管要求、容灾与恢复需求以及弹性不足的应用。
    • 多云:利用多朵云优势,优化工作负载,避免单一云厂商锁定,降低技术风险,但成本高且管理复杂。

上云迁移收益

迁移上云可获得更强的可伸缩性、更好的高可用性、更高的并发性、更安全的运行环境、更低的运维成本和更完整的技术栈。

上云迁移策略

  1. 直接迁移(Re - host)
    • 适合云就绪的应用程序,从云下 / 友商云迁移到腾讯云,不更改云架构和应用架构,多采用冷 / 热迁移工具或重新部署环境,难度较低,适合套装软件或代码不可控应用整机迁移。
  2. 平台重建(Re - platform)
    • 进行一些云优化以获得收益,但不更改应用程序核心架构,如从自建虚拟机托管的服务迁移到腾讯云上托管的 PaaS 服务,适用于不适合简单上云或想借助上云进行架构优化的情况,迁移难度中等,关键在于云上产品选型和对应。
  3. 重新购买(Re - purchase)
    • 适合原软硬件产品周期到期或体验不佳需更换产品的情况,如更换 CRM 系统,但可能带来预算变化。
  4. 应用改造(Re - architect)
    • 重新设想构建和开发应用程序(通常使用云原生功能),由增加功能、扩大规模或提高性能需求推动,成本最高且迁移难度最高,但长期来看可能带来技术益处。
  5. 停用(Re - tire)
    • 直接关闭不再使用的应用程序,可提高业务绩效、节约成本。
  6. 保留(Re - tain)
    • 暂时不适合上云或此次不打算迁移的应用程序可归类为此策略,建议对其进行分类,后续有替换方案再上云。

上云迁移流程

一般流程

包括调研评估、方案制定、方案实施、上云测试、业务割接、验收总结等阶段,各阶段包含多项具体活动8。

常见活动

  1. 调研
    • 分为业务调研(包括业务类型、特征、运行情况、指标等)、应用调研(技术栈、业务连续性、部署架构等)、数据库调研(类型、备份策略、数据量等)、系统调研(类型、安全、网络要求等),为后续评估和方案设计提供数据基础91011。
  2. 评估
    • 包括平台兼容性评估(应用对硬件、安全要求等)、系统改造风险评估(业务异构、改造耗时人力等)、性能风险评估(迁移后能否达到性能要求)、资源风险评估(人力和云上资源是否充足)。
  3. 规划
    • 与客户负责人制定总体上云计划,包含上云模块、时间规划、任务分工、负责人信息等。
  4. 责任分工
    • 明确在迁移各阶段双方的主导或协助角色,合理分配时间与资源181920。
  5. 实施计划
    • 以工作日粒度细分总体计划,安排具体工作。
  6. 验收
    • 完成迁移交付后,评估测试项目整体质量,验收合格标志项目实施完成2324。

常见风险及应对策略

  1. IP 变更风险
    • 确保业务接入规范,若写死 IP 则尽量保持内网 IP 不变;与第三方对接时提前申请添加白名单25。
  2. 业务中断风险
    • 选择业务量小的时间窗口迁移;数据迁移过程中保持源端在线,最后一次增量同步和业务切换时中断业务;源端和目标端搭建主备环境;保证迁移步骤可回退25。
  3. 网络稳定性风险
    • 建设迁移专用网络(如专线)提高稳定性和迁移速率;源端虚拟化主机采用镜像导入减少对网络依赖,手工补齐增量数据25。
  4. 数据不一致风险
    • 全量同步配合多次增量同步,最后一次同步停止源端业务写入;迁移前停止源端业务写入;做好源端数据备份25。
  5. 人员稳定性风险
    • 迁移开始后预备备份人员,以防双方接口人员无法全力投入。

上云迁移方案设计

云基础环境方案设计

  1. 资源规划设计
    • 包含资源管理模式设计(如集团账号模式、独立账号模式)和资源内容规划(详细的资源清单)。
    • 集团账号模式又分为基于功能角色和基于组织架构的设计,便于集中管理和资源共享,资金和权限可灵活划拨和分配。
  2. 基础账户设计
    • 包括身份、账号、授权、认证、审计等方面设计,腾讯云的身份与账号系统(CAM)解决单租户权限问题,可通过多种方式进行身份认证(如二次认证),授权可基于 RBAC 或 ABAC 模型,审计支持对常见操作记录和审核262930。
  3. 基础网络设计
    • 关注云内网络(VPC 规划、子网设计、互联与路由、访问 internet 方式)、云间网络(与传统 IDC、友商云等互联链路设计)、云外网络(拓扑及组件连接形式)。
    • VPC 设计遵循隔离性、扩展性、连接性原则,子网设计建议使用多个子网,分布在不同可用区,成对创建公有和私有子网,考虑网络地址规划、扩展、重叠等问题,同时支持 IPv4 和 IPv6 地址功能(IPv6 地址分配有特定规则)。
    • 云内互通可通过对等连接(同地域 VPC 互联,带宽高、防护性好)或云联网(不同账户地域的多 VPC 及云上云下多点连接,自动路由学习、稳定性高、成本优化)实现,访问 Internet 可通过弹性公网 IP、公网网关或 NAT 网关,各有特点。
    • VPN 架构方案包括 IPsec VPN(站点到站点连接,加密传输,适合混合云)和 SSL VPN(点到站点连接,适合移动办公和运维),物理专线架构方案提供更稳定高效链路(借助云联网可实现多 VPC 全互通),SD - WAN 接入方案可实现多种连接,降低网络成本,具备多种优势(如高可用、加密传输等)343536。

云组件迁移方案设计

  1. 迁移方案概述
    • 分为冷迁移(停服迁移,技术实施复杂度低,过程简单,停服时间长)和平滑迁移(热迁移,业务影响小,停服时间短,技术要求高,分批次迁移),根据业务特点和客户要求选择迁移方法。
  2. 迁移工具
    • 腾讯云服务平台(MSP)提供多种迁移工具(如主机迁移工具 go2tencentcloud、一键迁云,数据库迁移工具 DTS,文件迁移工具 COS 相关工具等),还有开源类工具(如容器迁移工具 velero)和第三方合作伙伴工具,三类工具可独立或配合使用404142。
  3. 主机迁移
    • 选择流程根据应用适配与测试、平台支持、停机需求等因素决定,包括 go2tencentcloud 在线迁移(适用于网络稳定、业务无法中断场景)、离线迁移(适用于网络不稳定、数据量大且可停机场景)、一键迁移(适用于批量迁移大规模云服务器且源在友商云场景)、重新部署(适用于对目标端有系统要求场景)。
  4. 容器迁移
    • 备份还原方式通过工具同步镜像和备份还原集群数据,适用于无太多厂商专属组件绑定场景;重新部署方式通过构建 CI/CD 流水线搬迁应用和镜像,适用于代码可控且有较强运维能力场景454626。
  5. 消息中间件迁移(Kafka)
    • 单写双消费迁移方案简单清晰,无数据积压,但需额外起一套消费者;单写单消费迁移过渡平滑,但生产切换后至消费切换前目标集群可能有数据堆积;mirrormaker 同步方案可同步历史数据,但消费者切换需从头消费且要做好幂等474849。
  6. 数据迁移(ElasticSearch)
    • Logstash 迁移适用于集群规模适中、索引数量少场景,方法简单但离线迁移,需校验数据一致性;CCR 迁移借助 ES 高级版本能力,适用于规模适中、停服短场景,但对版本有要求且割接时需停服重启;快照迁移适用于集群规模适中、索引数量多场景,迁移安全但离线迁移,需停机并安装插件505152。
  7. Redis 缓存迁移
    • 重新缓存方式适用于缓存量少场景,通过缓存更新机制重新缓存数据,但影响业务性能;redis - shake 冷迁移方式简单快速,适用于量少场景,但离线迁移需停机且数据校验需借助其他工具;腾讯云 DTS 迁移方式支持全量和增量迁移,简单快速,但需要 psync 权限进行 rdb 快照265354。
  8. 数据库迁移(腾讯云 DTS 平台)
    • 包括源库导出、数据导入、同步增量和校验数据,待全量和增量数据追平后切换读写进行割接5556。
  9. COS 对象存储迁移(腾讯云 MSP 平台)
    • 全托管模式适用于小规模且对迁移时间要求不苛刻的自服务场景,客户只需配置任务,共享资源,通过公网拉取友商数据,内网写入 COS(客户无成本),但集群迁移能力有限;半托管专线推模式适用于大规模且对迁移质量要求高的服务场景,需拉专线和部署 Agent,性能有保障,迁移前需与 MSP 团队沟通评估575859。
  10. 文件和块存储迁移
  • Filetruck 工具是基于 rsync 开发的文件备份和迁移工具,适用于小规模一次性文件迁移,可验证数据;腾讯云存储网关支持从数据中心文件服务器搬迁数据到腾讯云 COS,适用于混合云场景下持续性和灾备迁移606126。
  1. 全量割接
  • 割接前准备包括确认增量数据同步、目标端环境和功能等,割接步骤为源端停服、确认数据一致性、业务功能测试、切换 DNS 到新系统。
  1. 平滑割接
  • 割接准备包括确认目标端环境和功能等,割接步骤为灰度流量测试、逐渐切流量到目标端、承载 100% 流量时切换 Redis 和 MySQL。
  1. 上云评审
  • 召开评审会议,评审内容包括应用迁移工作内容与范围、时间计划、策略和优先级、方案合理性、业务影响、风险分析与应对策略等,输出方案选型清单。
  1. 上云风险控制
  • 包括风险控制措施(如充分预案、工具搭配、计划详细、演练充分等)、割接准备(如性能压测、数据检查、人员安排等)、回滚预案(如回滚标准、策略、考虑因素等),确保业务连续性和迁移成功率。

云上常见问题及处理

计算资源问题

  1. 管理问题
    • 如制作快照会占用少量 I/O,建议业务空闲时操作;快照不支持迁移,可通过制作镜像共享;可将已购云硬盘系统盘转换为云硬盘;弹性公网 EIP 同账号同地域内网访问不收费;安全组策略生效顺序从上至下。
  2. 排障问题
    • 无法登录云服务器可能原因包括网络安全配置、系统启动、资源使用问题,处理思路为确认实例类型、通过检查工具诊断、重启实例、提交工单;网站无法访问需排查服务器运行状态、资源使用情况、端口监听、防火墙、网络、安全组、域名备案和解析;实例 IP 地址 ping 不通需检查实例公网 IP 配置、安全组、系统设置、域名备案和解析;腾讯云弹性伸缩组失效需检查启动配置、负载均衡、私有网络、余额。

网络资源问题

  1. 管理问题
    • 云数据库 Redis 手动销毁后,若 VPC 中只有该实例,需将其从回收站彻底删除才能删除 VPC 和子网;VPC 和子网网段创建后不可更改;对等连接不具备传递性;可通过设置安全组和网络 ACL 保障 VPC 中云服务器安全;没有公网 IP 的实例可申请弹性公网 IP 或通过 NAT 网关访问公网。
  2. 排障问题
    • 云联网打通两个 VPC 后网络不通可能原因包括云服务器内部 docker 容器路由、通信子网网段冲突、NACL 或安全组配置、内部防火墙,处理思路为排查相关因素并联系售后支持;无法删除 VPC 或子网需查看并释放关联云资源;使用腾讯云 CDN 后网页访问速度慢需检查域名解析、节点缓存过期时间配置、进行 URL 预热、优化网页架构模式;VPN 通道状态未联通需尝试激活通道、检查 VPN 网关公网 IP、安全策略、协商参数和模式并联系技术支持。

存储资源问题

  1. 管理问题
    • 从其他云迁移到腾讯云对象存储 COS,源云出流量收费,写入腾讯云免费但有存储和请求费用,低频存储不足 30 天按 30 天计算;可通过设置生命周期自动清理 COS 文件、实现回源功能;腾讯云内部同地域访问 COS 自动走内网,跨地域默认外网,多应用读写同一文件需加锁保障一致性;对象存储可通过开启版本控制、存储桶复制、多 AZ 特性解决数据问题2677。
  2. 排障问题
    • 使用 CDN 域名访问 COS 返回 403 可能是 CDN 加速域名为关闭状态,需排查启用情况;CDN + COS 配置后文件异常可能是 CDN 缓存、浏览器本地缓存或文件被劫持问题,需检查相关因素;小文件及高并发场景下腾讯云文件存储 CFS 卡顿可能是 NFS v4.0 协议限制,可尝试使用 NFS v3 协议挂载并联系技术支持

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 上云迁移概述
    • 云计算定义及特点
    • 上云迁移路线和场景
    • 上云迁移收益
    • 上云迁移策略
  • 上云迁移流程
    • 一般流程
    • 常见活动
    • 常见风险及应对策略
  • 上云迁移方案设计
    • 云基础环境方案设计
    • 云组件迁移方案设计
  • 云上常见问题及处理
    • 计算资源问题
    • 网络资源问题
    • 存储资源问题
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档