有效的云迁移关乎稳步推进、适当监控和根据新见解调整。
译自 Big Bang vs. Incremental Migration: Which Cloud Strategy Wins?,作者 Siva Padisetty。
根据Pluralsight 的报告,全球94%的公司正在采用云计算,专家预计到2027年,云支出将达到近1.2万亿美元。随着云计算普及率的快速增长,企业纷纷加入浪潮,全力以赴的做法很诱人。然而,这种“大爆炸式”的云迁移方法可能适得其反,使业务运营和收入面临风险。
选择一次性完成云迁移的企业——“大爆炸式”方法——可能会面临严重后果,影响其业务、技术和利润率。
在业务方面,混乱的云迁移可能导致服务中断,从而影响客户并对收入产生负面影响。在技术方面,仓促进行云迁移可能没有足够的时间进行周全考虑,例如适当匹配服务需求或未来的可扩展性。如果企业没有花时间了解代码的运行方式,他们可能会重新发明轮子,最终发现其实一开始就可以实现的解决方案。
最后,一种普遍的观点认为迁移到云端会降低成本。但是,如果公司缺乏一个框架和实践来最大化业务价值(通常称为FinOps),云迁移成本可能会迅速超过预定预算。我亲身体会到实施FinOps治理以平稳运行大规模业务的重要性。在新力公司拥有超过100个独立运行的团队,我们创建了一个FinOps框架并实施了每周检查机制。因此,新力公司在上一财政年度节省了2000万美元。
这种“直接迁移”策略,即一次性迁移所有内容,通常是由将所有内容迁移到云端的指令驱动的。要迁移的数据量可能会加剧上述风险,并且需要大量时间,通常需要六个月或更长时间。然而,另一种策略可以在降低风险的同时实现成功迁移,那就是分阶段迁移到云端。
对于公司来说,云迁移是一个持续的、开放式的实验。在我们云计算之旅的早期,我就认识到我们的迁移将是一个多年的过程。我带领团队重新配置了我们的平台以实现混合运营,这一决定使我们能够很好地适应多云环境。
那么,企业应该如何开始呢?从较小的项目开始,可以让公司测试不同的方法,从结果中学习,并尽早发现有效的策略和陷阱。这个迭代过程帮助他们深入了解云采用情况,从而为其整体战略提供信息。
例如,负责云迁移的团队可以根据流程的需求进行调整和发展,同时仔细招聘新人才来补充现有员工。同样,连接财务和工程部门的FinOps团队可以继续改进其实践,而法律和合规团队将有机会确保他们能够满足所有监管标准。 此外,云迁移为组织提供了宝贵的机会,可以增强和简化其系统,而不会不堪重负。例如,随着组织迁移到云端,他们可以采用自动扩展来优化成本,同时满足需求;实施增强的网络和安全隔离,以最大限度地降低风险;并利用可用区 (AZ) 来提高整体可用性。通过制定这些策略,公司可以最大限度地发挥云迁移的优势,同时维护更高效和安全的系统。
采用增量式云迁移方法,公司可以持续跟踪流程的成功情况,并根据相关的 KPI 进行衡量。第一步是确定原始基线。运营成本是多少?它有多可靠和功能齐全?关键利益相关者(例如最终用户)目前的满意度如何?此外,公司可以根据其所需的成本、可靠性和满意度水平设定 KPI。
在确定基线后,负责云迁移的团队可以在整个过程中根据这些基准检查当前状态。虽然进度可能并不总是线性的,但至少应该呈积极趋势。同样,如果检查显示令人担忧的异常情况,例如成本或停机时间的急剧增加,团队可以调查并纠正问题。
云迁移通常是一个多年过程,公司必须准备好在这个较长的时期内运营。在系统地将工作负载迁移到云端的同时,有必要同时保持与本地系统的连接,以确保用户的服务不中断。为了有效地管理这种复杂性,必须具备有效的可见性,使团队能够识别和解决问题。
无论公司采用的是直接迁移还是增量方法,一个问题仍然存在:如何确定是否有问题发生?没有一个流程是完美的,快速修正已识别的问题至关重要。关键在于优先考虑可靠性,并利用强大的可观察性实践来有效监控问题及其根本原因。
随着技术环境不断发展,采用谨慎和实验性迁移策略以及高效监控的公司更有可能成功,而不会危及其运营或财务健康状况。