在人工智能驱动的世界中,数据整理变得至关重要。

与数据的强大关联,在人工智能时代,需要的不仅仅是相关的上下文和控制。

译自 Wrangling Data Is Becoming Critical in an AI-Driven World,作者 Patrick Coughlin。

如同向移动端迁移、向云端迁移以及虚拟化的兴起一样,人工智能的全球普及也从根本上改变了数字架构。

如今的组织同时拥有数量空前的数据分散在各个地方。是时候让IT领导者彻底重新思考他们在AI时代如何处理数据管理了——哪些新型数据是相关的?哪些新的用例?运营?技能?流程?以及工具?如果IT领导者能够充分回答这些问题,他们就可以利用高质量的数据来支持合适的AI工具,从而推动业务成功。

AI改变了贵组织与数据的关系。大规模开发和部署AI系统将使组织的数据质量和架构面临严格的考验。随着领导者寻求加速AI系统和工具的开发和部署,他们将很快发现数据存在哪些问题——数据分散、无目的、不受控制且缺乏相关的上下文。如果数据质量差,企业将满足AI对资本投资的巨大需求,最终却只能收获失败的承诺,无法实现价格上涨和生产力提升。在全球2000强企业中,匆忙组建的AI委员会正在围绕AI的“我们如何才能……”用例提出不同的问题,这些问题围绕利用率、价值实现和投资回报率展开。

在AI时代发展与数据的关系需要对来源、唯一性和质量进行上游检查。云计算带来了大量SaaS解决方案和基于微服务的架构,帮助企业实现了扩展。然而,对于AI来说最独特和最相关的数据可能仍然存在于遗留的自定义应用程序中由孤立的IT和工程团队管理。AI投资的成功可能取决于您与这些团队和工具建立关系和管道的程度。

随着越来越多的AI模型、系统和应用程序进入生产工作流程,企业正在意识到孤立的用例和决策带来的下游影响。例如,部署AI副驾驶来提高软件工程团队吞吐量的客户也可能会看到该软件中的漏洞数量以相同的速率增加。这将负担和瓶颈转移到了可能正在优先考虑其他领域AI投资的团队。

在AI时代,与数据建立牢固的关系不仅仅需要相关的上下文和控制。企业数据技术领导者现在比以往任何时候都需要具有成本效益的系统思维方法。最熟练地部署AI的企业领导者需要确定目标用例,并考虑团队优先事项以及相邻和支持团队的相关数据源和关键上下文。

好消息:有多种方法可以控制您的数据和AI

在预期创建AI工具时管理数据时,首先了解工具的用例至关重要。如果您知道为什么实施此工具,您就会知道需要哪些组织数据来训练您的模型。了解用例不能仅仅依赖于您的IT团队。从CISO、CTO和CIO到下属,每个人都必须了解将涉及AI的用例。通常,AI模型成为非IT团队成员的工具,他们必须了解如何将相关的输入转换为可以提高其生产力的输出。

了解用例的额外好处是,企业在实施AI时会更加谨慎,而不是专注于成为最新技术炒作周期的一部分。如果IT领导者没有具体的计划就实施AI,他们将失去AI投资的投资回报率,从而导致宝贵的数据浪费。避免这些后果的一个好方法是将用例或实施放在非真空环境中。随着不同部门制定用例,他们应该与可以提供洞察力的同行合作,这些洞察力包括AI将完成的任务、影响用例成功的各种数据类型以及AI加速可能给任何特定工作流程带来的下游影响。

利用正确的技术来管理和使用数据

组织必须利用能够提供其IT架构,更重要的是其数据完整可见性的工具。这样,他们就可以找到与AI用例相关的数据,无论这些数据位于何处。然而,看到数据对于训练和利用AI工具而言是不够的。合适的工具和平台将与多个生产力/数据管理系统集成,允许IT决策者收集可以帮助改进AI用例的见解。

依靠数据联邦

数据联邦将在新的AI环境中变得重要,因为组织将受益于数据管理的灵活性。数据联邦,或访问和部署对存储在不同位置的数据进行分析的能力,是鼓励这种灵活性的关键方法。这将使组织在规模和成本上都具有自由度,以便在管理性能权衡的同时部署数据。过去,单个数据存储和应用程序需要摄取所有成功所需的数据。通过数据联邦,数据将根据合规性、控制、成本和性能驻留在不同位置。

优先考虑数据管理,然后再信任AI的决策

AI的未来是AI学习和做出决策的未来。在接下来的十年里,我们将越来越多地将行动卸载给能力越来越强的AI代理。随着AI代理从繁琐的任务(会议总结)和建议(建议的下一步)转向在业务关键型决策中采取行动,IT领导者必须进一步推动他们的数据关系,以实现这项技术的崇高承诺,同时又不忽视企业的底线。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注