2025年云从业者的6个可操作的IaC技巧

云原生 IaC 复杂性激增!Terraform 统治地位受 OpenTofu 挑战,CI/CD 和 GitOps 自动化成标配。漂移修复是关键,仅 8% 实现自动化。AI 在策略合规和漂移检测潜力巨大,17% 团队已用。多云标准化、遗留改造、技能提升、精简工具链是关键。拥抱 AI 驱动的云治理,赢在未来!

译自:6 Actionable IaC Tips for Cloud Practitioners in 2025

作者:Ido Neeman

如果您现在正在管理云基础设施,您可能会被复杂性所淹没。根据我们最新的基础设施即代码 (IaC) 状态报告,高达 65% 的从业者报告说,在过去两年中,云的复杂性呈上升趋势,另有 27% 的人认为它和以前一样困难。

IaC 根本没有变得更容易,但这并不是因为缺乏尝试。

残酷的现实是?大多数团队仍然在追赶 IaC 采用。以下是我们面临的问题,以及如何在挑战面前获胜。

2025 年基础设施即代码的严峻现实

2025 年基础设施即代码状态 报告是一面反映我们行业现实的镜子。它揭示了一个充满矛盾的景象:广泛的 IaC 采用掩盖了令人震惊的低成熟度,Terraform 的铁腕控制 正在慢慢放松,而人工智能的诱人前景在很大程度上仍未被大多数团队开发。多云已经到来,但几乎没有人有能力有效地处理它。

但这一启示不应该只是一种温和的推动。对于 DevOps 和平台工程领导者来说,这是一次全面的干预。如果您仍然坚持过时的假设和半生不熟的实施,那么这份报告就是您的警钟。

如果您正在尝试为您的组织找到合适的 IaC 方法,请于美国东部时间 6 月 17 日上午 11:30 | 太平洋时间上午 8:30 加入我们的特别在线活动“2025 年 IaC 状态内幕:工具、趋势和战术解决方案”,与 Firefly 首席执行官 Ido Neeman 一起参加。

以下是 2025 年报告中吸取的最重要的经验教训。

  • Terraform 的统治面临挑战。 虽然 Terraform 仍然占据 62% 的市场份额,但只有 47% 的从业者计划在未来继续使用它。OpenTofu 的使用量正在激增,目前有 12% 的受访者正在使用它,27% 的人计划采用它。大约 5% 的人已经完成了从 Terraform 到 OpenTofu 的迁移,另有 6% 的人计划在明年进行转换。
  • 自动化正在成为标准。 在 2025 年,用于基础设施部署的 CI/CD 或 GitOps 管道的使用率已增加到 59%,而手动 CLI 运行自去年以来从 30% 降至 24%。DevOps 团队普遍将自动化和 GitOps 风格的交付评为他们首要的 IaC 管道能力。
  • 漂移仍然是一个关键问题。 只有少数 (8%) 实现了自动化漂移修复,40% 的人报告说需要几天到几周的时间才能修复配置漂移。更糟糕的是?17% 的人根本没有漂移检测流程。
  • 人工智能的采用是谨慎的,但正在增长并充满潜力。 如今,大约 17% 的团队已经在云运营中使用人工智能驱动的功能,另有 41% 的团队计划采用或积极探索解决方案。当被问及哪些人工智能功能对 IaC 最有价值时,受欢迎的选择包括自动化策略合规性和智能漂移检测。这表明了一个愿望清单,即使实际采用尚处于起步阶段,人工智能也可以提供帮助。

云从业者提示:将见解转化为行动

我们每年对 IaC 采用情况的脉搏检查揭示了几个重要的趋势,它们指向了明确的机遇领域。DevOps 和平台工程团队工作方式上的微小但有影响力的转变可以帮助他们领先于正在兴起的主要趋势以及他们仍然面临的最大挑战。

让我们深入研究一些 DevOps 和平台工程团队可以立即采用的可操作策略。

1. 征服多云混乱:跨提供商标准化

多云环境将长期存在,但它们带来了额外的复杂性,需要积极的规划。而且由于多云组织面临更高的管理开销,提前规划可以帮助减轻与收购或影子 IT 计划相关的风险。团队应该:

  • 跨云标准化 IaC 工具: 利用 Terraform 提供商或类似的框架来创建统一的工作流程,用于 AWS、Azure 和 Google Cloud Platform。
  • 实施跨云标记和监控: 在所有资源上使用一致的标记来简化治理和成本分析。
  • 在设计流程时要考虑多云: 即使您目前是单云,也要通过构建可以适应多个提供商的模块化 IaC 模板来为未来的扩展做好准备。

2. 逐步整理遗留基础设施

由于复杂性或缺乏时间,遗留资源通常不受 IaC 控制。2025 年的调查显示,61% 的团队正在逐步改造遗留基础设施。但修改后的方法可以降低漂移风险,并确保版本控制的优势扩展到旧系统。

  • 采用增量改造策略: 在更新或迁移期间以代码形式捕获遗留资源。
  • 避免大爆炸式迁移: 随着时间的推移,有机地集成遗留资源,以减少中断。
  • 优先考虑高风险资源: 首先专注于整理与合规性或灾难恢复相关的基础设施。

3. 投资于技能发展

技能差距仍然是团队采用 IaC 的首要挑战。值得庆幸的是,提升技能不仅可以解决人才短缺问题,还可以通过提供职业发展机会来提高员工保留率,这是团队成功的关键因素。一些好的方法?

  • 提供正式培训: 举办关于 Terraform、Pulumi 或 OpenTofu 的研讨会,以提升团队的技能。
  • 鼓励知识共享: 创建 Slack 频道或定期同步,工程师可以在其中讨论 IaC 技巧和挑战。
  • 开发可重用模块: 构建标准化模板的内部库,以简化新工程师的入职流程。

4. 简化您的工具链

分散的工具会增加认知负荷和部署错误。但是,流程精简的团队报告管理工作量稳定或减少,简化工具链可以腾出时间来执行更高价值的工程任务。

  • 整合重叠的框架: 尽可能在一个主要的 IaC 引擎和一个交付管道上进行标准化。
  • 简化 CI/CD 管道: 使用具有最少手动步骤的 GitOps 风格的工作流程。

5. 像专业人士一样部署:实施自动化的 GitOps 管道

自动化是现代管道的黄金标准。它可以最大限度地减少人工干预,并确保跨环境的可靠部署——这是 59% 的受访者认为的首要任务。要做好这一点:

  • 采用拉取请求驱动的工作流程: 确保使用自动化的计划/应用流程在部署之前审查更改。
  • 实施 GitOps 实践: 使用存储在 Git 存储库中的声明式配置作为单一事实来源。
  • 自动化漂移修复: 投资于能够实时检测和解决漂移的工具,以保持基础设施的一致性。

6. 尽早利用 AI 的力量(在它仅仅成为平价点之前)

AI 为云治理提供了变革性的潜力。此外,早期采用者随着 AI 技术的成熟而获得竞争优势,而现在的投资使您的团队处于创新的前沿。

领先的团队是那些:

  • 尝试智能工具: 使用 AI 进行策略执行、成本优化和漂移检测。
  • 逐步集成 AI: 从合规性检查等小规模应用开始,然后再扩大规模。
  • 专注于可操作的见解: 选择提供明确建议而不是抽象预测的 AI 解决方案。

弥合 IaC 差距:为什么等待的代价高于行动

IaC 领导者和落后者之间的差距正以惊人的速度扩大。随着云复杂性的不断增加以及安全风险的不断增长,等待完善您的 IaC 实践意味着每个季度都会进一步落后。竞争优势在于从仅仅采用转向精通和自动化。

IaC 方法的逐步改进不仅仅是锦上添花,它们是业务的当务之急。主动管理漂移、实施自动化管道并标准化其多云运营的组织将看到显着的好处:更快的部署、更少的停机时间和更具弹性的基础设施。即使是很小的步骤也能产生显着的回报。

您的下一步行动至关重要。下载 2025 State of IaC Report 以对照行业同行对您的组织进行基准测试,并开始规划您的 IaC 成熟之路。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注