基础设施吞噬战略

云原生架构迎来巨变!企业需将基础设施视为战略武器而非成本中心。拥抱 IaC,自动化云治理,应对多云复杂性与 AI 驱动的工作负载激增。打破团队孤岛,构建“团队基础设施”,才能在数字化转型中制胜。

译自:Infrastructure Eats Strategy

作者:Aharon Twizer

企业在 2025 年追求的每一个重大战略举措——全球规模、数字化客户体验和 AI,AI,AI——都有一个决定成败的关键要素:基础设施。更准确地说,是我们云领导者如何战略性地管理我们的云基础设施。

不幸的是,大多数企业的大部分部门仍然将“基础设施”视为管道——需要维护的东西,而不是可以用来获得竞争优势的东西。这种心态即将成为严重的负担。新的现实迫使各地的云团队做出选择:适应并采取战略性的基础设施方法,保持被动,眼睁睁地看着关键举措失败,竞争对手遥遥领先。

革命即将到来

在过去的十年里,基础设施——曾经是服务器、资源和治理流程的静态集合——已经被“基础设施交付革命”彻底重塑。正如二十年前的软件交付革命改变了我们构建和管理软件的方式一样,这场新的革命正在将基础设施转化为代码,添加自动化层,并简化治理——所有这些都是为了使交付像软件一样快速、高效和稳定。至少这是承诺。

现实呢?我们大多数人都处于中间状态,以代码形式运行部分或全部云基础设施,但依赖于过时的流程、不完整的自动化和不断膨胀的复杂性。每当我运行 IaC 覆盖率报告时,我都会看到这一点:典型企业中只有不到 50% 的基础设施由 IaC 管理。到目前为止,这已经“足够好”了——勉强而已。

随着云迁移加速和多云蔓延占据主导地位,我们面临着一个不断扩大的治理、安全和合规性要求迷宫,这些要求超出了我们维持控制的能力。这导致了阻碍创新的瓶颈、飙升的成本、安全故障、合规性罚款和未满足的 SLA。所有这些都加起来构成了一个脆弱的基础设施基础,不太可能支持我们的组织所押注的关键举措。

而那还是在 AI 之前……

AI 是混乱的倍增器

我们组织内的每个团队——研发、工程、安全、运营、客户支持、营销、财务、产品——都在努力利用 AI 来自动化、优化和扩展其功能。但是

AI 不仅仅是另一种工作负载——它呈指数级地增加了对基础设施的需求:

  • 更多的计算能力——AI 训练和推理工作负载需要更多的资源。
  • 更多的实时数据处理——AI 模型大规模运行,增加了云支出和治理复杂性。
  • 更多安全与合规风险——AI 依赖于海量数据集,引入了新的合规性和攻击媒介。
  • 更多需要交付的软件——AI 允许研发更快地构建软件和产品,并且所有这些都需要更多的基础设施规模和速度才能运行。

我们这些领导云团队的人——已经被不足的安全、治理和自动化工具搞得焦头烂额——现在面临着 AI 驱动的工作负载的浪潮。以前“足够好”的基础设施现在是一个巨大的负担。

让我们明确地说:只有当我们的云基础设施扩展以满足新的需求时,我们的组织才能获得 AI 快速扩张的好处。达到诸如研发速度提高 50% 或客户支持效率提高 50% 之类的里程碑也需要 DevOps 速度提高 50%。问题不在于 AI 是否会改变我们的业务——而在于我们的基础设施是否允许它这样做。

那么,该怎么办呢?

向战略基础设施的转变

为了使我们的组织能够赢得并出色地执行关键举措,我们必须从被动的基础设施转向战略基础设施,充分利用基础设施作为市场优势。我们需要一个新的框架,使云基础设施与成功所需的业务速度、创新和弹性保持一致。

要拥抱战略基础设施,需要三个根本性的转变——我亲身经历过的转变,并希望与同行分享。第一个转变?我们现在就可以做到。

转变一:改变心态

无论您是与 CIO、CISO、CSO 还是 CEO 合作——我们需要倡导将基础设施作为一种战略武器,而不是一个成本中心。这种转变正在向下蔓延。 传统上,基础设施交付一直被视为一项技术问题——由 IT 部门处理,由工程师解决。这种想法已经过时,会让我们的组织更加落后。

当我们都迁移到云时,企业已经实现了一次飞跃——我亲身经历了团队运营和衡量成功方式的彻底转变。现在必须进行第二次飞跃,而且已经开始了。我看到的那些有效扩展的团队已经做出了改变。

我们必须沟通,我们公司所做的每一项押注——人工智能、数字化转型、客户体验——都依赖于世界一流的基础设施。如果基础设施薄弱,一切都会崩溃。

如何行动:像拥有增长一样拥有基础设施

增长最快、最具弹性的公司将基础设施视为战略资产。这意味着:

  • 使基础设施决策与业务速度保持一致。缓慢、官僚的流程会扼杀势头。强大、端到端的自动化会加速它。
  • 授权云团队,但不要让他们负担过重。如果我们陷入救火,业务也会陷入困境。我们需要用于全面基础设施控制的工具,以便我们可以构建未来而不是修复过去。
  • 像对待核心产品一样投资基础设施。不要仅仅优化成本——从第一天起就积极地为规模、自动化和治理进行工程设计。

要问什么:困难的问题

现在,我们应该问:

  • 我们是将基础设施视为力量倍增器还是成本中心?
  • 我们的组织结构是否能够将基础设施作为战略重点?
  • 我们的基础设施投资是否与其对业务的影响相匹配?
  • 我们是否准备好与人工智能驱动的加速同步扩展?

如果什么都不改变,那就什么都不会改变——在最高层。心态转变是关键的第一步,但这不是最难的。接下来才是最难的。

第二个转变:重新控制云

今天的企业基础设施不仅在扩展,而且还在瓦解。多云蔓延、碎片化的自动化、隐形的安全性风险以及难以满足的弹性需求都使得基础设施交付几乎无法管理。我与之交谈的每一位 DevOps 总监或基础设施副总裁都看到了同样的情况。

唯一的出路是完全控制。领先的团队不仅仅是管理云的复杂性——他们设计控制,这意味着从一开始就构建正确,而不是以后再修复。

如何行动:自动化、治理和查看一切

  • 为云基础设施定义一个明确的北极星。如果我们的团队不了解我们期望的配置——“好”的样子,我们就永远无法到达那里。
  • 通过自动化消除瓶颈。从配置到安全再到合规性,智能的端到端自动化可以减少或消除不必要的组织摩擦。
  • 实施自主治理。我们可以通过授权需要基础设施的团队自行启动它(带有护栏),从而在不牺牲控制的情况下提高业务速度。

要问什么:困难的问题

现在,我们应该问:

  • 我们最大的基础设施瓶颈和摩擦点是什么——为什么它们没有自动化?
  • 是我们在运行我们的云——还是云在运行我们?
  • 我们是否拥有完整的云基础设施可见性和控制,还是我们在盲目飞行?

重新控制云是一个转折点——但控制并不是(还)胜利。第三个也是最后一个转变锁定了战略基础设施:打造一支比它所支持的组织移动更快的团队。

第三个转变:构建“团队基础设施”

仅靠更好的技术无法定义基础设施交付革命的赢家——我们的工作方式将决定。谁拥有基础设施,团队如何协作,以及我们的文化是否围绕卓越运营与平台一样重要和工具。下一个前沿阵地不仅是云技术——还是云团队合作。

最好的基础设施工程师不想与官僚主义作斗争或填补遗留系统中的漏洞——他们想解决大问题,大规模控制,并突破可能的界限。将他们的云团队定位为前沿创新者的组织不仅会更快地行动,而且还会吸引和留住构建战略基础设施所需的世界一流人才。

在组建团队二十年后,我可以自信地说,团队的质量——在无摩擦和谐中有效工作的群体——远比他们的规模重要。扩展的团队无法解决基础设施扩展问题。

如何行动:构建构建未来的团队

  • 打破孤岛。云、安全和工程团队不能孤立地工作——必须设计协作,而不是期望协作。将其作为关键的文化价值观。
  • 通过像对待核心企业产品一样对待基础设施(设计、衡量和持续优化),来提高运营标准,使团队能够运营而不是陷入混乱。
  • 将基础设施作为一项使命。最优秀的工程师不仅仅想要工作,他们还想要影响力。给予他们自主权、自动化和控制权,然后跟踪进度。你会很高兴你这么做了。

需要提出的问题:难题

我们都应该问:

  • 我们是否正在创建一个顶尖云人才想要建设和留下来的环境,还是一个限制他们影响力的环境?
  • 我们是否已授权我们的基础设施团队来推动业务速度或保持系统运行?
  • 我们是否已将基础设施定位为企业的产品,还是我们让团队自行摸索?

如何衡量不采取行动的风险?以十年为单位。

软件交付革命在二十多年前重塑了各行各业。基础设施交付革命发生得更快,其赢家和输家已经开始被区分。

积极拥抱战略基础设施的组织现在正在构建他们的未来,创造速度、弹性以及创新,从而为未来十年推动具有业务定义意义的举措。而且他们正在通过授权云团队以世界一流的水平执行来实现这一点——没有障碍、摩擦和限制。那些等待转变的组织仍然会在 AI 的工作负载淹没他们最关键的举措时,修复基础的基础设施问题。

AI 浪潮、数字化转型的加速以及积极的全球扩张不仅仅是要应对的挑战。它们是最终开始的信号;现在,今年,2025 年。

至少现在我们知道从哪里开始了。请记住,第一次转变从我们开始。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注