如何在事件期间简化沟通

别再为宕机烦恼!用AI和自动化简化事件沟通,提升运营效率!文章介绍如何利用自动化工作流减少响应疲劳,标准化沟通渠道如Slack/Teams,并自动化客户更新。AI驱动的摘要工具和人机协作至关重要,助力企业优化ITSM,保障SLA,实现卓越运营和高可用。

译自:How To Streamline Communication During Incidents

作者:Laura Chu

2024 年,每小时停机的成本对 90% 的组织来说超过了 30 万美元,而 41% 的组织表示,每小时停机的成本为 100 万到 500 万美元。事件会扰乱业务运营和收入,同时无可挽回地损害客户信任。考虑到这些非常高的风险,每一秒都很重要,但通常情况下,糟糕的沟通会减慢补救时间并加剧损害。

成功的事件管理不仅仅取决于解决手头的问题。它包括创造理想的条件,使组织能够通过改进运营管理来降低潜在失败的风险。每个企业都意识到将他们的 IT 服务管理工具 (ITSM) 与他们的客户服务团队连接起来的挑战。ITSM 是一个很好的工具,可以组织 IT 工单并允许对其进行跟踪和管理,但 ITSM 通常与客户服务团队脱节。

在整个事件生命周期中简化这两个职能之间的沟通是加强运营管理的关键。如果没有结构化的、一致的沟通——无论是在补救期间还是在事件发生后——客户服务团队可能会不知道事件的状态,导致客户无法使用关键服务。

许多服务级别协议 (SLA) 要求停机时间限制在五分钟或更短时间内。当工程团队和客户服务团队之间没有沟通时,可能会违反 SLA,这可能会导致处罚。这种情况很容易发生,因为许多工程师都专注于手头的任务,可能会告诉他们的经理事件已解决,但忽略将此信息传递给客户服务团队。组织可以采用的一种解决方案是自动化他们围绕事件的沟通流程,从而消除手动沟通的需要。

以下是组织可以使用 AI 和自动化来简化和增强整个事件管理生命周期中的沟通并提高运营弹性的三种方法。

1. 使用自动化工作流程来减少响应者疲劳

自动化对于简化事件管理非常强大。例如,在诊断软件故障时,工程师可能会浪费宝贵的时间手动运行健康检查、分析日志和进行故障排除。流程自动化可以立即触发诊断和补救措施,从而减少对主题专家的依赖,这些专家只应参与更高优先级的任务。 组织可以使用自动化来帮助工程师向客户服务代理提供状态更新。这有助于确保信息流向客户,减少他们的挫败感并确保维护 SLA,而不会给工程师带来额外的工作。

AI 代理日益增长的作用将进一步加快解决时间并提高沟通效率。AI 驱动的系统可以分析大量数据,识别根本原因并建议或执行补救措施。如果制定了正确的规则和治理,AI 代理可以采取积极的措施而无需人工干预,从而让工程师可以从事更具战略意义的工作。

2. 标准化沟通渠道

使用多种工具也会使事件管理沟通变得分散。由于在诸如 Slack 或 Microsoft Teams 之类的消息应用程序、电子邮件、工单系统和各种仪表板之间跳转,团队经常错过消息或收到延迟的更新,而且这还是在信息完全脱离工程部门的情况下。缺乏单一的事实来源会造成不必要的混乱和知识差距。与此同时,在事件期间很容易忘记或错过手动更新。

需要一个专用的、统一的沟通平台来用于整个事件管理生命周期,以解决这种碎片化问题。无论是通过 Slack、Microsoft Teams 还是集中的事件管理平台,拥有一个指定的自动化更新和协调位置都可以确保清晰度和一致性。

当通过 AI 驱动的摘要工具增强时,集中式沟通会更加有效。AI 可以从冗长的聊天记录中提取关键见解,突出显示关键更新,并提供状态和进度的简明概述。工程师无需浪费时间滚动浏览无休止的线程,即可立即访问他们需要的信息,而客户服务代理可以获得事件状态的摘要。 AI 还可以识别通信中的模式,并呈现可能提供对当前问题见解的相关历史事件。模式识别在事故后学习回顾期间特别有用,AI 工具可以总结事故期间采取的行动,并概述可以实施的关键学习和流程改进。

最成功的组织还会将升级嵌入到他们的工作流程中。当事件需要高管投入时,AI 可以实时路由更新,从而为决策者提供可见性,而不会因不必要的问题而扰乱运营团队。

3. 自动化客户更新以维持信任

当服务中断时,客户希望立即获得透明的信息。延迟或含糊的沟通会损害信任,并可能将客户推向竞争对手。手动起草状态更新、通过电子邮件发送给受影响的用户以及保持内部团队的一致,对于工程师和站在事件前线的客户服务团队来说,是一项耗时的负担。

AI 驱动的通信工具可以代表工程师生成状态更新和预计的解决时间,从而帮助客户随时了解情况,而无需工程师每次更新都进行手动干预。

然而,虽然 AI 可以简化通信工作流程,但人机协作的方法仍然至关重要。应始终审查 AI 生成的消息,以确保准确性并保持传达同情和保证的语气。最好的方法是平衡 AI 的效率与人类的专业知识,以确保清晰且客户友好的沟通。

面向未来的事件管理

事件管理不会在问题解决时结束。事故后审查对于分析哪些方面做得好以及确定需要改进的领域至关重要,包括信息如何从工程师流向客户服务团队,以及这种沟通如何帮助或阻碍响应。持续改进有助于缩短响应时间、满足 SLA 目标并提高服务可靠性。

有效的沟通就是使团队能够协同工作并更好地解决问题。通过将 AI 和自动化融入事件管理生命周期,组织可以改进其沟通策略,并帮助团队更快地朝着卓越运营迈进。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注