OTel很烂 ,但也超棒!

爆!工程师怒喷 OTel:坑多路险!但也真香!痛点:版本迭代快,学习曲线陡峭。亮点:Vendor 中立,模块化设计,降本增效!更有开源社区鼎力支持!想玩转云原生可观测性?OpenTelemetry (OTel) 绝对值得一试!

译自:OTel Sucks (But Also Rocks!)

作者:OpenTelemetry Authors; Docs CC BY

OpenTelemetry (OTel) 经常被吹捧为可观测性的未来,承诺供应商中立和全面的数据收集。但对于那些每天使用它的人来说,现实是什么呢?我们与几位工程师和 SRE 坐下来,听取他们对 OTel 的真实想法。结果呢?这是一场坦诚的对话,内容涉及使用 OTel 的优点、缺点以及有时令人沮丧的方面。

为了准备 KubeCon 的演讲 OTel Sucks (But Also Rocks!),Juraci 与社区成员进行了交流,并收集了大量有价值的见解。由于时间限制,并非所有材料都可以包含在演示文稿中,因此这是试图公正地对待社区的贡献。

OTel 的不足之处

在他们对 OTel 的真实想法中,工程师和 SRE 分享了他们面临的常见挑战。Delivery Hero 的 Elena 强调说,“缺少稳定的收集器版本”和“快速的变化步伐”是重要的痛点。这些频繁的更新需要繁琐的检查和测试,以维持生产稳定性。

来自 Atlassian 的 James 和来自 Pismo 的 Alexandre 对语义约定的更改表示沮丧。这些更改可能会破坏现有的仪表板,并需要大量精力来更新大型系统中的检测。Alexandre 特别提到了指导整个公司更改属性的困难,开发人员对此并不满意。

Liatrio 的 Adriel 指出,“检测很难”,并且由于大量的信息和选项,入门可能会让人不知所措。他还提到了让人们克服手动检测的最初障碍的挑战。James 还讨论了 Java agent 的“魔力”,虽然它很强大,但有时会导致难以调试的意外问题。

所有受访者都认为,OTel 存在一个学习曲线,尤其是在理解收集器、配置和语义约定方面。Adriel 指出,“我花了很多概念上的开销来理解它。” Alexandre 还提到,文档虽然在改进,但仍然可以从更多示例中受益。

为什么 OTel 超棒

尽管存在挑战,我们的受访者也承认 OTel 的显着优势。

例如,来自 Pismo 的 Alexandre 强调了供应商中立的重要性。OTel 允许他们整合所有数据并切换到他们想要的任何供应商,而不会被锁定到特定的生态系统中。

来自 Atlassian 的 James 称赞 OTel 的模块化设计,它允许用户在某些东西无法正常工作时替换小的模块化部分。这种灵活性对于需要自定义设置的高级用户尤其重要。

Delivery Hero 的 Elena 分享了使用 OTel 从日志移动到分布式跟踪的变革性。她将回到日志的体验描述为“效率低下”。James 还强调了 Java agent 如何提供单体应用程序的“前所未有的画面”。

Adriel 深入参与了 OTel 社区,他强调了开源的价值和贡献的能力。他指出,“一旦你推动人们克服了困难并第一次开始使用它,之后就像微风一样,而且非常强大。”

来自 Pismo 的 Alexandre 分享了一个引人入胜的故事,讲述了使用 OTel 实施尾部采样如何大幅降低了他们的可观测性成本。他们能够优化资源分配并避免过度扩展他们的收集器。

最后,Alexandre 强调了 OTel 在将其可观测性实践标准化方面的作用。在 OTel 之前,他们混合使用了供应商特定的库和内部收集器,导致不一致和损坏的跟踪。OTel 提供了一个“单一库,一个单一标准”,显着提高了数据质量。

关键在于社区!

OpenTelemetry 社区受到其成员的高度评价,Adriel Perkins 将其描述为他第一次积极参与开源的经历,这主要是因为与人们的愉快互动。他强调了许多聪明、善良和乐于助人的人的存在,他们总是愿意提供指导。社区成员也因其经验而闻名,Adriel 认为这在个人方面帮助他成长为一名工程师。此外,该社区的特点是非常乐于助人、充满热情并对项目的未来感到兴奋。虽然成员有时可能很直接,但他们通常很友善。 James Moessis 还指出,贡献者可以期望他们的代码由社区内的专门人员进行审查,并且开发人员乐于接受贡献。贡献者体验调查的存在表明了社区致力于理解和改善贡献者体验。总的来说,社区营造了一个支持性和协作性的环境,成员可以在其中学习和成长。

结论

我们的访谈揭示了与 OTel 之间复杂的关系。它不是一个完美的解决方案,并且伴随着相当多的挑战。然而,对于那些愿意应对复杂性的人来说,OTel 提供了强大的功能和显著的优势。正如 Atlassian 的 James 所说,“当 OTel 表现不佳时,好处在于它的设计方式不会太糟糕,因此你可以替换这里和那里的小模块。”

最终,OTel 的价值在于其灵活性、厂商中立性以及它为复杂系统提供的深刻见解。虽然存在成长的烦恼和需要改进的地方,但 OTel 无疑是可观测性的强大工具。

我们要感谢 Elena Kovalenko, James Moessis, Adriel Perkins, 和 Alexandre Magno 分享他们对 OpenTelemetry 诚实和富有洞察力的经验。他们的故事为任何正在考虑或目前正在使用 OTel 的人提供了宝贵的视角。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注