可观测性和 ITSM 正在向融合靠拢——消除工具蔓延并释放 ITOps 效率的新水平。
译自 Trend Report: Merging Observability and IT Service Management,作者 Assaf Resnick。
在 IT 领域,可观测性和 IT 服务管理 (ITSM) 历来在孤岛中运行。但随着 IT 环境变得越来越复杂和繁重,IT 团队需要的不只是点解决方案。他们需要其可观测性和 ITSM 工具,以及使用这些工具的团队相互沟通,以保持其生态系统的正常运行。
值得庆幸的是,在当今人工智能和丰富数据时代,新的行业实践正在为 IT 环境带来更大的协同作用。因此,可观测性和 ITSM 服务正在向融合靠拢。这种转变将为 IT 运营 (ITOps) 领域带来巨大的好处,使 IT 团队能够达到前所未有的效率和生产力水平。
可观测性 是通过检查复杂内部系统的外部输出(分析指标、日志、事件和跟踪)来衡量和理解这些系统的功能。可观测性的最终目标是提供全面的见解,并发现 ITOps 中不可预见的 issue。随着现代 IT 基础设施变得越来越复杂,该行业已投入时间、金钱和精力来改进可观测性工具和服务。
但可观测性的承诺并不是 IT 复杂性的万能药。在提供有效的服务感知和可用性方面,可观测性只是难题的一部分。
看看这些数字:根据 Enterprise Strategy Group 研究,91% 的组织在部署可观测性解决方案时报告遇到了挑战。为什么?可观测性的目标是提供对 IT 生态系统的可见性和理解。可观测性服务和 ITOps 团队需要采取的警报之间经常存在差距。团队无法依赖可观测性服务来提供 ITSM 简化 IT 运营所需的上下文,例如优先级划分、分类、分配或影响,这进一步阻碍了任何下游自动事件解决。
IT 服务管理促进了与 IT 服务交付相关的任务和工作流。它是识别、分析和解决事件以尽快恢复服务运营的过程。ITSM 的作用是最大程度地减少中断的影响,提高生产力并防止对业务构成威胁的中断。
ITSM 允许组织管理向其用户(包括内部员工和外部客户)交付 IT 服务。可以这样理解:ITSM 不再将 IT 视为一个神秘的黑匣子,而是将 IT 服务视为其他任何业务产品。ITSM 提供了设计、创建、交付和支持 IT 服务的明确流程。成功的 ITSM 解决方案使 IT 团队能够将其服务与业务需求保持一致,并有效地交付这些服务。
ITSM 工具本身无法评估 IT 环境的整体情况和上下文——因此,它们无法尽可能有效地减少平均解决时间 ( MTTR )。ITSM 需要全面的可观测性见解,以及基础设施、系统映射和业务流程规则的操作特性,以便在问题出现时做出响应,从而加快 MTTR。在企业层面,ITSM 流程高度依赖人工,并且依赖大型团队进行定期维护和管理。由于当前流程复杂、不一致且缺乏保持此数据库最新的必要授权,因此通常无法实现简化的 ITSM。
尽管每年投入数百万美元用于可观测性和 ITSM 平台,但 IT 团队仍然面临长期影响其运营的障碍:警报疲劳、被动事件响应、事件中断以及对服务可用性和性能的持续抱怨。
在 事件管理和预防报告 中,Enterprise Management Associates 发现 69% 的 ITOps 团队报告称,至少 25% 的 MTTR 是在等待更多信息或其他团队的响应时花费的非活动时间。这是一个令人担忧的时间损失。更不用说团队在收到不相关详细信息时花费的额外时间,并且被迫通过多个支持级别重新升级工单以获取正确的数据。
是时候进入现代世界了。ITOps 需要一种更全面的方法,超越独立于可观测性或 ITSM 数据采取行动。
随着人工智能转型 ITOps,新的技术能力正在涌现,以整合可观测性和 ITSM 解决方案。
根据 Gartner 的文章“Gartner 专家回答企业最关心的生成式 AI 问题“: “到 2025 年,30% 的企业将实施人工智能增强型开发和测试策略,高于 2021 年的 5%。”生成式人工智能 ( GenAI) 的普及将随着其投入运营并在 IT 堆栈中创造更好的协同作用而改变 ITOps。
GenAI 使组织能够将机器生成的、可操作的警报和事件有效载荷数据与人类 ITSM 数据协调起来,以丰富可观测性上下文。通过合并可观测性和 ITSM 能力,自动化可以帮助 IT 团队超越传统限制,以增强系统理解并实现主动、明智的决策制定。
随着可观测性和 ITSM 的融合,整个 IT 功能将受益匪浅。可观测性和 ITSM 相结合将解锁:
- 加快正常运行时间并提高可靠性
- 前所未有的运营效率
- 增强安全强度和漏洞管理
- 实时系统可见性
将可观测性和 ITSM 的优势结合在一起,使 IT 团队能够摆脱不必要的工具负担,从而降低系统复杂性和成本。他们将以前所未有的方式了解其系统并访问按需修复工具。
通过可观测性和 ITSM 的协同工作,IT 运维团队可以快速解决事件,提供更好的客户体验并释放数字化转型的时间。
免责声明:Gartner 不认可其研究出版物中描述的任何供应商、产品或服务,也不建议技术用户仅选择具有最高评级或其他称号的供应商。Gartner 研究出版物包含 Gartner 研究组织的观点,不应解释为事实陈述。Gartner 对本研究不作任何明示或暗示的保证,包括对适销性或特定用途适用性的任何保证。