Hellmann Worldwide Logistics 在 PlatformCon 2024 上所描述的数字化转型,为其他组织提供了可借鉴的经验。
每家公司都是不同的,因此每个平台都必须是独一无二的。
我们在技术活动中经常听到这句话。采用定制化的平台工程方法让公司投入大量的时间和金钱来自定义开源软件,并从头开始构建自己的内部开发人员平台。
正如 Syntasso 的首席工程师 Abby Bangser 所言,平台工程团队的重点应在于重要的共享服务上,例如基础设施、扩展和安全性,但这些服务并不会为您企业的独特性做出贡献。
平台团队致力于减少认知负荷和工具复杂性,以帮助应用程序开发者更快地为最终用户提供价值。因此,除非您是一家平台工具公司,否则花费时间构建您自己的定制化平台意味着您并不会专注于您组织的独特价值主张——或改善您的内部开发者体验。
正如 Mathias Gebbe 和 Aljoscha Portner 在 PlatformCon 2024 上所述,拥有 153 年历史的 Hellmann Worldwide Logistics 的数字化转型既是独一无二的经验,也是许多其他各行业和各个规模的公司所共有的经验。他们的经验揭示了其他组织可以采用的平台工程模式。
Hellmann 全球物流公司于 1871 年由一人创立,现已发展为在 54 个国家/地区运营的 40000 名员工。虽然赫尔曼的技术堆栈没有那么古老,但它肯定需要升级。
“ 你会看到很多 AS/400 绿色显示屏、Oracle、VMware,一个内部部署的数据中心。代码使用 Java Enterprise [Edition]、C#,甚至 Visual Basic 编写,”开发人员体验和平台团队的团队负责人 Gebbe 说。
内部部署数据中心拥有专门团队,包括一个网络团队、一个服务器团队和一个数据库团队。“而且,开发团队被孤立出去,因为一个团队在 IBM WebSphere 门户服务器上进行构建,而另一个团队为员工和客户门户设计简单的界面。”
这些团队中的每一个团队都带来了大量业务背景,但是,Gebbe 说,他们完全没有云原生体验。
尽管如此,Hellmann 的工程文化还是接受了数字化转型——这家物流公司不仅开始在船只上放置集装箱,还开始在云中的 Moby 上放置集装箱。产品开发团队迅速开始接受 DevOps 理念——“你构建它。你运行它。”——他们共享资源、蓝图和操作途径。
尽管 Hellman 的工程师们大部分仍然在公司内办公,同时拥有一些云端的经验,但他们却使用诸如 Docker Swarm 用于编排的云原生技术。
Gebbe 说,“但随后很多事情就偏离了轨道。我们有或多或少幸运的团队,获得所需的资源、知识和时间,去充分利用云基础设施服务平台。”
那些滞留在数据中心的人无法取得和别人一样多的成就。
Gebbe 表示,“我们也有其他团队忙于产品开发,而且它们坚持使用旧的平台堆栈。”这些团队“仍然以工单为驱动,没有或很少自动化,并且受到限制,例如无法使用分布式文件系统。”
然后,这些团队走得越来越远。一些团队选择了亚马逊网络服务云,而另一些团队选择了 Microsoft Azure 云。不同的团队使用不同的源代码管理工具。
“我的一位同事曾经说过,‘我在这里感觉不像一名软件开发人员。我是一名测试工程师、DevOps 工程师、一级支持安全专家。我不是一名全栈开发人员。我是一个完整的 IT 部门,’”Gebbe 回忆道。
然后,他向 PlatformCon 观众展示了一张 Cloud Native Computing Foundation 景观 的拥挤图片,从中“每个产品团队都必须为其团队找到合适的解决方案。”
这种 开发人员倦怠 和认知负荷过重是采用平台工程的常见动力。
与许多进行平台工程项目的公司一样,钟摆需要从最初的云原生开发人员自主权转向集中化。这意味着平台团队必须做出一些并非所有人都满意的决定,因为他们被迫迁移到平台上。
“在这种情况下,唯一感到高兴的是支持不同产品团队升级基础设施和数据库的咨询公司,”Gebbe 评论道。“我们真的浪费了时间,没有为我们的客户开发功能。”
是时候尝试一些不同的东西了,灵感来自其他组织的平台故事。
Hellmann 团队决定“从为什么开始”,Pörtner 接过 PlatformCon 的麦克风说道,引用领导力大师 Simon Sinek。“我们定义了使命宣言:我们努力释放所有开发人员的潜力,以塑造数字未来和人类的成长。”
由此,平台团队确定了七个支柱:
- 透明度
- 信任
- 自动化
- 创新
- 自主权
- 以开发人员为中心
- 安全
平台工程是关于定义 最佳路径,以最小的阻力发布软件。牢记这七个价值观,清晰的路径是通过云,以 Kubernetes 配置管理、源代码管理和 CI/CD 为基础。
Pörtner 是一位平台工程师,他引用了软件开发人员常见的 非我所创综合症,表示团队最初认为他们应该自己从头开始构建。
“我们在自己的集群中部署了数据库。这不是一个好主意,”他说。“最好是基于现有的东西构建平台——我们正好有一个云提供商。”
事实上,托管云服务和自动化 始终优于 任何自管理方式。通过使用托管服务来部署数据库,Hellmann 平台团队能够将更多工作负载迁移到云中,并加快多个团队使用的功能的集成,而无需承担构建、部署和管理的成本。
在铺设这条黄金之路时,平台工程的共同目标是实现自助服务,以避免充满摩擦的工单编写和人为干预重复性工作。但尝试过早地过度自动化可能会带来更多麻烦。
“我们认为自助服务当然很重要,”Pörtner 说,但“最好不要过度设计所有东西,构建越来越多的功能,因为这样你的团队就会开始遇到问题,因为它变得更加复杂。”
如果平台工程不是逐步进行,就会有成为过时的、自上而下的庞大平台的风险。
团队拓扑 是现代软件组织中流行的模型,建议从一个名为 最小的可行平台 (TVP) 的概念开始——你可以构建的最基本的东西,它可以使你的开发人员客户的生活更轻松。这通常是一个轻量级的维基或某种文档。
这可以在最小可行产品格式中发布,以便快速反馈,而无需长期投资,但 TVP 不同于最小可行产品 (MVP),因为任何内部开发人员平台都是你必须构建和维护的东西。
“这是我们从错误中吸取的教训,”Pörtner 说。“我们了解到我们应该寻求更多反馈,并向他们展示我们所做的事情。”
在平台工程中,你的开发人员同事是你的客户,这应该使快速反馈变得容易,但情况并非总是如此。
“当我们问他们的时候,他们的反馈是‘让它工作’,因为有时他们参与了产品开发,他们没有时间回答你的问题或提供反馈,或者有时他们不知道真正的反馈是什么,”他说。
或者,有时如果平台不是他们真正需要的,工程师会开始构建临时解决方案。
Hellmann 平台团队必须负责平台的演变
内部开发者平台以其可选性而著称。这意味着你必须说服你的同事使用它。
像所有好的产品追求一样,平台即产品思维 依赖于快速反馈和开放式沟通。在 Hellmann,这包括:
- 冲刺评审
- 架构决策记录
- 事后分析
- 产品路线图和即将推出的功能
该组织还添加了一个帮助中心,开发者可以在那里提问和提交问题。
除了发布这些信息之外,平台团队还会向其客户征求需求。同样,这可能是一场斗争,因为应用程序团队忙于产品开发,这就是为什么平台团队聘请了一位产品负责人,以优先考虑利益相关者的需求。
产品负责人 Pörtner 说,“这个人可以与团队交谈,优先考虑事情,并找到一种方法来穿越构建平台时所有可能性的丛林,并识别痛点。”
平台团队需要意识到,他们不仅仅是在构建闪闪发光的或他们认为最好的东西。
“最终,像依赖项自动化工具——Renovate,Dependabot——可观察性 解决方案和秘密管理为开发人员节省了难以置信的时间,这对我们和团队来说确实是一个改变游戏规则的东西,”Pörtner 说。“然后他们开始欣赏我们的平台。我们感觉我们现在正朝着正确的方向前进。”
但是,平台团队仍然习惯于构建太多功能。繁忙的产品团队没有时间进行如此多的更新,因此平台团队养成了代表他们实施更改的习惯。这在规模上行不通。
“你必须以一种他们可以轻松集成的方式构建你的平台,”Pörtner 说。“因此你需要文档和培训。让我们向他们展示如何使用它,并给他们自己动手操作的可能性。”
是的,内部开发者平台专注于共享工具和流程,但并非每个人都会有相同的切入点。
如此庞大的组织总是会存在不同的知识和技术经验。Hellmann 的一部分已经采用云原生,而其他部分则在本地工作。
“我不会对你撒谎。有时这很难,你必须有耐心,你必须教他们,”Pörtner 说,并进一步警告说,“有时它会有点迷失。平台开发的很大一部分是记录东西,并培训你的开发人员使用你的平台做正确的事情。”
除此之外,平台工程团队通常只有几个人支持各种各样的团队。
“花时间让每个团队都加入你的平台。”Gebbe 补充道。“找到你的道路。你可能不是 Netflix 或者 Spotify,但你需要找到你的方式,让你的开发人员提供一个好的平台。”
平台工程策略既是你的组织独有的,也是需要随着时间推移而培养的。
正如 Gebbe 所说,“你必须建立一个真正好的土壤,一个好的基础,花朵和蝴蝶就会来,他们会对你的平台感到满意。”