记住亚马逊和Netflix部署自动化系统时的优先级

亚马逊和Netflix等巨头如何利用自动化系统改进业务运营和客户体验。

译自 Remember Amazon and Netflix's Priorities When Deploying Automated Systems,作者 Saket Patankar。

随着企业日益依赖自动化系统来提高效率和促进创新,三个要素已成为成功的关键:可扩展性、可靠性和安全性。

它们共同构成了有效自动化的基石,使组织能够适应不断变化的需求,最大限度地减少停机时间,并防范不断演变的威胁。成功地利用这些要素对于维护客户信任和构建未来至关重要

成功的自动化

系统的可扩展性对于支持企业未来的增长至关重要。规划可以节省资金并促进无缝扩展——自动化扩展系统有助于企业高效有效地运行,而不是仓促应对需求。成功的公司会规划长期的成功,构建能够随着业务增长而扩展的系统。

可扩展性对于在可预测和不可预测的流量高峰期间保护客户体验至关重要。考虑在线幻想体育:比赛期间,随着玩家得分和个人登录网站查看分数,流量会大幅飙升。自动化系统可以根据需求进行扩展,根据需要快速增加或减少容量。零售业是另一个自动化扩展非常有帮助的行业。电子商务巨头亚马逊使用自动化扩展来处理季节性流量负载。即便如此,小型组织也可以从中受益,因为系统可以根据需要进行扩展,无需人工干预。

在某种程度上,系统的可靠性与其根据需要进行扩展的能力有关,因为意外的流量高峰或超出系统容量的增长会对性能产生严重的负面影响。可靠性是任何公司信誉的基础。客户期望持续性和功能性,任何下降都会损害客户信任。自动化系统可以确保一致的性能和运营连续性。

根据Statista的预测,在2024年至2028年期间,全球“创建、捕获、复制和消费”的数据量将增长三倍以上,组织保护这些数据变得越来越重要。数据泄露和安全漏洞会对公司的声誉产生深远而持久的影响。Darktrace在2024年进行的一项研究发现,数据泄露是损害组织声誉的三大事件之一,超过了涉及首席执行官的丑闻。继2013年Target的安全漏洞事件之后,首席执行官和首席信息官辞职。据估计,该公司因此次攻击损失了10亿美元,股价下跌超过2%。

自动化系统是打击攻击、减少响应时间和降低风险的有力工具。在数字安全领域,持续监控和快速响应对于避免和解决漏洞至关重要。与人工相比,自动化安全系统可以全天候监控攻击和漏洞并立即做出响应。当与人工智能 (AI) 和机器学习 (ML) 等工具正确集成时,自动化安全系统可以识别人类可能错过的模式,从而降低漏洞风险。

业务优化

通过支持可靠性、可扩展性和安全性,自动化系统帮助企业优化运营。负载均衡和预测性维护对于可靠性至关重要;公司需要他们的系统始终可供客户使用。当人们打开他们的奈飞应用程序时,他们期望系统正常运行,无论有多少其他用户。自动化系统允许奈飞等公司更有效地进行负载均衡。自动化系统可以更快地检测到由于用户数量导致的性能下降,并自动将负载均衡到其他服务器。如果一台服务器经常过载,自动化系统会在问题变得严重之前主动识别问题,从而允许企业进行预测性维护。

微服务架构是自动化系统的重要特征,使其能够保持可靠性和确保可扩展性。采用单体架构,实时响应系统中的问题具有挑战性,甚至是不可能的。另一方面,微服务架构允许组织根据需要添加、扩展、缩减或删除服务。每个专用组件都可以单独开发、部署、操作和扩展,使企业能够比单体系统更有效地自动化架构。

随着越来越多的客户数据可供公司使用,在设计、开发和部署过程中必须在每个步骤都考虑安全性;它不能是事后才考虑的问题。一个重要的组成部分是使用安全的编码。安全的编码实践,例如开放式全球应用安全项目 (OWASP) 中概述的那些实践,有助于最大限度地减少在开发过程中将安全漏洞引入软件的风险。

人工智能驱动的安全工具正变得越来越普遍,部分原因在于它们的高效性。在2024年的一项调查中,95%的网络安全专业人员认为人工智能将改善其组织的防御能力。受访者认为改进威胁检测、识别可利用的漏洞、自动化某些安全任务以及更快的威胁响应是该技术将产生影响的四个主要领域。由于人工智能和机器学习算法经过训练,并且能够快速解析大型数据集,因此它们有助于检测潜在的网络威胁并识别异常模式或行为。人工智能支持的系统通过提供持续的端到端监控和检测来支持人类信息安全团队,快速标记需要审查和识别的漏洞和事件。

自动化实践

多年来,亚马逊和Netflix等巨头一直利用自动化系统来改善业务运营和客户体验。亚马逊拥有许多业务部门,包括其最初的在线电子商务平台和按需云计算平台亚马逊网络服务 (AWS)。2024年,其电子商务部门宣布推出人工智能生成的购物推荐和人工智能聊天机器人Rufus,它充当数字代理。亚马逊利用各种AWS解决方案来处理每年在其Prime Day期间产生的巨大流量,包括自动威胁检测服务GuardDuty、用于增强性能的ElastiCache以及容器编排服务AWS Elastic Container Service (ECS)。

为了处理客户的观看需求,Netflix采用了一种优先级负载削减策略,优先处理关键请求,例如用户按下标题上的“播放”按钮,而不是非关键请求。也有充分证据表明该公司正在探索将人工智能用于字幕和本地化,使其能够更好地与全球客户沟通。当然,该平台著名的推荐算法使用有关用户在服务上的行为、与其他用户的相似性以及个人偏好(如类型、演员、用户使用平台的时间、首选语言和其他变量)的数据来自动生成建议观看列表。

很明显,人工智能和机器学习已经在公司如何解决可扩展性、可靠性和安全问题方面发挥着重要作用,并且这项技术将继续发展。当负责任且有效地使用时,人工智能非常适合支持自动化系统,部分原因是机器学习模型可以使用反馈循环来自主学习和改进模型。在可预见的未来,这些工具仍然需要人工监督,尤其是在安全等关键领域。

虽然全天候自动化监控提供了显著的安全优势,但组织机构必须越来越多地制定切实可行的主动安全策略来应对人为风险因素。其中一种策略是采用零信任和最小权限的方法。零信任要求对数据和资源的访问基于最小权限原则,默认情况下不可访问。最小权限方法只允许用户在有限的时间内访问所需的资源。这些原则有助于降低网络犯罪分子和疲劳或漠不关心的员工所造成的风险。

自动化对于组织来说越来越成为一项关键工具。它有助于更快地响应安全威胁,减轻不可预测的流量,并比人工响应错误的速度快得多。可扩展性、可靠性和安全性是成功自动化的支柱。构建模块化系统可以提高可扩展性,并确保公司能够适应增长。对可靠性的投资可以增强客户体验并最大限度地减少停机时间。在每个业务层面融入有效的安全策略和措施,可以保护数据,确保合规性,并建立客户信任。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注