为什么多云可观测性如此昂贵?

由于云原生环境中数据量的爆炸式增长,各组织正面临着不断攀升的可观测性成本,这促使他们寻求具有成本效益的解决方案。

译自:Why Is Multicloud Observability So Expensive?

作者:B Cameron Gain

各组织正争先恐后地寻找降低可观测性成本的方法。可观测性提供商提供了一些技术来节省成本,但这里存在一个先有鸡还是先有蛋的问题,因为他们必须更换现有的可观测性平台,并寄希望于最终能够省钱。

这可能会促使一些用户认为或看到可观测性正在商品化。用户可能会选择或依赖开源遥测数据源,例如 PrometheusJaeger 等提供的数据源。 感谢云原生计算基金会的 OpenTelemetry,这些数据可以被引导或重新引导。

鉴于 OpenTelemetry 提供的标准化,现在更容易更换供应商,并希望供应商可能会承诺按指标定价或统一费率,这可能会显示价格差异或价格比较。当然,这种想法可能会在考虑成本时发挥作用。

当然,收集遥测数据只是一个起点。正确的数据分析绝对不是一种商品,至少需要大量的研究才能提供分析和预测等,这不仅能证明业务和运营价值,还能在未来节省成本。

同样,难题在于这些服务需要花钱。因此,只关注价格可能不是一个好主意,尤其是对于那些可能无法提供与价格稍高的其他提供商相同水平分析的可观测性提供商。

数据爆炸

在报告《为可观测性的未来做好准备》中,Gartner 分析师 Mrudula Bangera 指出,由于云原生环境,需要监控和分析的数据量呈爆炸式增长。大量的可观测性数据使得摄取和保留遥测数据的成本很高,尤其是在某些数据冗余的情况下。

Bangera 写道:“收集所有可用的遥测数据也会增加在价值较低的数据中遗漏重要见解的风险。”“然而,随着商业可观测性平台中开放标准和基于消费的定价的出现,重点已经从简单地收集数据转移到利用分析及其提供的有价值的见解。”

现在考虑通过感知到的可观测性平台和遥测数据源的商品化来省钱还为时过早——或者更确切地说,是开始考虑或关注。原因不仅在于上面描述的原因,还因为该领域仍处于起步阶段,平台提供的寻找模式或做出预测的概念——以及人类无法做到的事情——现在与正确使用 AI 的好处相结合,开始为可观测性的新时代铺平道路。

与此同时,多云和本地来源生成的遥测数据的数据爆炸可能会使组织不堪重负。New Relic 首席技术战略家 Nic Benders 说,一个普通企业现在有 1,000 多个不同的应用程序,“我与很多拥有 10,000 甚至 50,000 个应用程序的客户合作”。“如果没有适当的可观测性提供商提供的强大分析,任何数量的仪表板和学习都无法帮助您理解该系统。”

多云成本

随着这种多云遥测数据爆炸,成本因素也随之而来。一个组织可能有 20 个节点需要监控,对于每个节点,有 20 个时间序列来获取每个节点的指标。Mirko Novakovic,可观测性提供商 DashO 的首席执行官,在他的演讲“使用 OpenTelemetry 进行 Kubernetes 可观测性”中说,他在 FOSDEM (Free and Open Source Developers’ European Meeting) 期间发表了演讲。“可以向这些节点添加无限数量的标签——因此,无限数量的基数——正如您所看到的,大多数供应商都会根据时间序列的数量和您的基数向您收费,因为每个时间序列都需要花钱,因为您必须存储和处理它,”Novakovic 说。“实际可能发生的是基数爆炸。” 尽管遥测数据激增且相关成本不断上涨,但在可预见的未来,至少供应商不会开始在数据馈送的成本上按量展开竞争。相反,能够提供最佳分析的供应商将赢得或获得市场份额。

其次,绝大多数组织并没有充分利用他们可以——并且可以说是应该——利用的可观测性的全部范围。在这方面,它仍然是一个新兴领域。“我经常被问及竞争对手,” Benders 说。“可观测性领域最大的竞争对手是‘无’——比如,更多的系统没有被观测到,所以仍然是一片蓝海。”

Bangera 写道,对于许多企业来说,与存储和分析可观测性数据相关的成本不断增加,无论他们是构建自己的解决方案还是使用供应商工具,都会抵消他们从中获得的收益。

Bangera 写道:“越来越多的不同监控工具也增加了组织的低效率和复杂性,导致需要管理多个工具、界面和不同的数据格式。”“为了确保洞察力能够跟上不断增长的速度和复杂的架构,基础设施和运营 (I&O) 领导者必须通过从传统监控发展到可观测性,为组织的未来做好准备。”

Bangera 写道:“可观测性的成本已成为一个重要的关注点,受到当前宏观经济形势、基于消费的定价以及对云支出的日益严格的审查的影响。”“以前,监控定价主要由被监控的设备或主机的数量决定,因此计算监控支出相对简单。”

可观测性成本

Jason Soroko,综合证书生命周期管理 (CLM) 服务提供商 Sectigo 的高级研究员,对此表示赞同:“Gartner 的分析是准确的。他们对数据分类和保留策略的强调解决了可观测性费用的关键驱动因素。严格的生命周期管理和开放集成对于可持续的成本控制至关重要。”

可观测性成本在多云环境中可能会迅速攀升,因为需要不同的 API 集成和孤立的数据管道,Jason Soroko,综合证书生命周期管理 (CLM) 服务提供商 Sectigo 的高级研究员说。“各组织面临着巨大的费用,必须协调本地和云遥测数据,这增加了复杂性、成本,并最终导致数据碎片化的风险,” Soroko 说。“云提供商可以理解地倾向于通过推广限制互操作性的专有生态系统来实现锁定。”

云提供商提供的可能导致锁定的一个具体领域示例是 PKI。一般来说,PKI 和证书生命周期管理工具应该提供一个信任模型,该模型可以跨越云和混合环境,并为数字证书提供可见性和生命周期管理,而不管其来源如何,Soroko 说。

在与 The New Stack 的播客中,Honeycomb.io 的首席执行官 Christine Yen 指出,有很多因素会导致成本膨胀。除了尝试监控容器、Kubernetes pod 和其他云原生基础设施以及我们基础设施中所有这些过去不存在的额外组件的固有复杂性之外,如今的工程团队谈论他们的软件的方式可能与过去不同。

“当我想象工程团队如何看待他们的系统时,我会想到 DevOps、平台工程和 SRE。我认为所有这些趋势都在塑造工程团队的关注点、运营方式以及他们如何考虑提供优质服务,” Yen 说。“具体来说,我喜欢围绕 SRE 的讨论,尤其是对 SLO(服务级别目标)的兴趣,因为 SRE 非常强调最终用户的体验。仅仅我们的基础设施健康是不够的;重要的是我们是否坚持我们为这些最终用户提供优质服务的标准。”

Yen 说,工程团队现在希望用诸如用户 ID 或购物车 ID,甚至软件处理的商品的倾斜度等术语来描述他们的软件。“在用于谈论我们的软件以及受影响的内容的语言的复杂性方面,存在着对人员和流程的需求,这也导致了数据的复杂性增加,从而导致了成本的复杂性增加。”

许多客户试图采用 SRE 实践和 SLO,但他们正在遭受痛苦,因为“他们的可观测性工具正在惩罚他们,因为他们试图跟踪对他们的业务至关重要的事情,试图帮助他们理解给定工程变更的客户影响和业务影响,结果是他们正在撤回他们需要理解影响的数据,”Yen 说。“看到这种情况令人难过,因为人们非常习惯于在传统日志记录、监控和 APM 工具的约束下工作,以至于通常需要一些对话才能让他们意识到现代可观测性工具实际上是为这种复杂程度和遥测中的表现力而构建的,”Yen 说。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注