共计 2787 个字符,预计需要花费 7 分钟才能阅读完成。
背景
我司有海外业务,没有自建IDC机房,使用了例如AWS、华为、阿里等公有云。
受到包括但不限于以下因素:政治、业务侧发展、成本、稳定性 影响,需要在海外做跨云跨 region 的迁移。
例如从腾讯云的欧洲节点迁移到AWS。
当然,最终由老板来敲定迁移目的地花落谁家,但在此之前,SRE 需要给到各个方案的论证供老板决策。
评估事项
背景分析
同上文,包括但不限于以下因素:政治、业务侧发展、成本、稳定性 影响等等,具体情况具体论证。
效益
非必要情况,不会如此大刀阔斧实施迁移。但凡执行大规模变更,必将会面临可用性受损的风险。
遇到了不迁移就解决不了的问题才会考虑迁移。
那么我们在迁移过程中,是否还能顺带解决其他问题,产生更多效益?
- 资源成本:对比迁移前后的 SAAS 成本。
- 维护成本:基础设施兼容度越高,维护难度越小。
- 稳定性:对比不同公有云提供的售后服务,SLA保障,故障响应时间,结合历史故障情况分析等。
- 架构优化:不同云提供的服务不同,可能因为迁移前的云受限于基建限制,存在架构问题,目标云是否可以得到解决?
合规
此处由AI生成,具体需要和公司法务进行咨询沟通。
在进行数据中心的国际部署时,您需要考虑许多国家和地区的法律法规,特别是在数据保护和隐私方面。具体受影响的法律法规将取决于您选择的数据中心所在地和服务所在地。以下是一些可能会影响您的主要法律和法规,取决于数据中心所在的区域:
1. **欧洲经济区(EEA)**:
- **《通用数据保护条例》(GDPR)**:适用于处理欧盟和欧洲经济区居民的个人数据,无论数据处理是在欧盟内还是外部进行。
2. **美国**:
- **加州消费者隐私法案(CCPA)**:如果您的数据中心涉及加州居民的数据,则需遵循CCPA规定。
- **其他州法律**:如弗吉尼亚州、科罗拉多州等州也开始制定自己的隐私保护法规。
3. **加拿大**:
- **个人信息保护和电子文件法(PIPEDA)**:如果您的业务涉及处理加拿大公民的数据,则需遵循PIPEDA。
4. **澳大利亚**:
- **隐私法**:管理个人信息的采集、使用和存储,适用于处理澳大利亚个人数据的企业。
5. **巴西**:
- **普通个人数据保护法(LGPD)**:类似GDPR,适用于处理巴西公民的个人数据。
6. **日本**:
- **个人信息保护法(APPI)**:管理涉及日本公民的个人信息处理。
7. **中国**:
- **个人信息保护法(PIPL)**:这是中国的主要隐私法,类似GDPR,适用于在中国经营并涉及中国公民数据的公司。
- **数据安全法(DSL)**:影响数据的跨境传输及存储。
具体受影响的法律和法规还可能涉及以下因素:
- 您数据中心的物理位置:不同国家/地区可能有不同的数据存储和传输规定。
- 数据的跨境传输:某些法律要求在数据跨境传输时满足特定条件或进行评估。
- 您的客户所在地:需要遵循客户所在地的数据保护法律。
在进行数据中心的国际部署之前,建议与法律顾问咨询,以确保您全面了解并遵守相关的国际法律法规。
数据安全
在迁移过程中,要保障数据的安全,防止数据发生泄露和损坏。
成本
资源成本
IAAS层成本,一般包括计算、网络、存储和其他API服务成本。
迁移过程成本
迁移过程中,会产生双边费用,即源和目标端同时存在两份计费资源。以及网络传输费用。
一般情况下目标云会减免此费用,提前和商务沟通。
后续维护成本
公有云提供的 API 是否能完善支持基础设施平台对其管理?例如CMDB、账单、工单、云管平台等。
是否要抽人力进行开发?开发耗时?
稳定性
- 技术支持响应时间 是否为 7*24
- 技术支持响应速度
- SLA保障等级
- 公有云基建完善度
- 网络质量:去程和回程双向时延、抖动、丢包
- IAAS服务完善度:例如 IPSEC VPN,RDS 等
- 资源性能
兼容性
基础设施兼容
SRE 平台的基础设施是否已经兼容。
例如选择已经使用过的云作为迁移目的端,兼容代价最小;选择一个从未使用过的云,兼容代价高。
业务服务兼容
业务侧可能使用云厂封装好的服务而不是自建。
例如 Mongodb,在 AWS 上被封装为 Document DB,并不保障 100% 的 API 兼容。
例如阿里云的对象存储 OSS 和 AWS 的 对象存储S3,也不保障 100% 的 API 兼容。
需要列出所有使用到的IAAS服务论证兼容性。不兼容需要提前改造。
迁移
任务清单
拆解所有任务,明确分工到人,明确时间点。
- 兼容性调研
- 兼容性改造
- 确定各类服务(基础设施、业务侧应用)迁移方案,包括风险评估和故障预案
- 迁移执行
- 目的端环境准备
- 迁移
- 测试和验收
- 故障回滚
- 复盘
迁移策略
时间维度
- 低峰期操作,降低对用户的影响。
- 从 SRE 角度衡量,优先迁移基础设施,例如网络、监控、自建数据库、LB、DNS 等,再迁移业务服务。
- 从业务侧角度衡量,被依赖性越高(越底层)的服务,需要优先迁移。例如优先迁移账号服务,再迁移增值服务。
安全第一
- 确保迁移同步过程不影响现网服务。
- 确保迁移前后数据完整性和一致性,原始数据不能受损。
- 确保迁移前后,原服务新服务的数据、网络安全性。
- 例如迁移过程中需要开放额外的白名单,迁移后需要需要回收。
- 目的端的网络安全、实例安全扫描等需评估实施
风险评估与故障预案
迁移过程中可能出现以下风险:
- 迁移时间不足:评估迁移所需时间,并进行合理安排,以确保业务不受影响。
- 数据备份不充分:加强数据备份工作,制定详细的备份计划,确保数据的完整性和一致性。
- 基础设施故障:提前对相关云资源进行分析和检查,确保基础设施的稳定运行。
- 网络中断:制定网络异常方案,确保网络故障时能够通过切换等方式快速恢复。
- 安全风险:加强新机房的安全措施,确保数据和网络安全。
针对可能存在的风险,需要确保有对应的预案,第一时间解决。
实施
- 迁移前调研迁移目标云厂、进行可行性分析。
- 成立迁移专项组,明确分工,确保迁移工作顺利进行。
- 定期进行迁移进度的汇报与沟通,确保迁移进度和质量符合预期。
持续监测和验收
- 云资源验收:在迁移完成后,需要对已使用的云资源进行分析,负载、延时等进行评估。
- 业务相关测试:对业务进行全面测试,确保线上服务稳定运行,功能正常。
- 安全检查:对新机房进行安全检查,确保数据安全和系统安全。
- 监控告警:对新机房的监控告警系统进行测试,保证能第一时间发现故障。
- 技术支持:成立新机房故障处理对接群,保证能第一时间处理故障。
注意事项
- 安全第一:在整个机房迁移过程中,请确保数据和网络相关安全性,不能有任何安全事故。
- 充分沟通:在迁移过程中,要保持与项目组成员、相关部门的充分沟通,确保项目进展顺利。
- 明确责任:在迁移过程中,请明确各成员的责任和义务,确保各部门之间的协作顺利。
- 持续优化:在迁移过程中,要总结经验,优化实施流程,以提高迁移项目的效率和质量。
- 风险预案:制定详细的风险预案,以应对可能出现的风险,确保项目的顺利实施。
总结
围绕关键点:成本和效益
、方案可行性
、稳定性
、安全性
。