2025年AI模型不是重点,数据基建才是关键

成功的关键不在于投入更多资源解决问题,而在于从根本上重新思考我们如何为人工智能时代设计数据基础设施。

译自 Data Infrastructure, Not AI Models, Will Drive IT Spend in 2025,作者 Sijie Guo。

随着各组织争相实施人工智能 (AI) 计划,他们遇到了一个意想不到的瓶颈:支持AI应用程序所需的大量数据基础设施成本。

虽然Gartner预测2025年IT支出将增长9.8%,但真正的问题不在于模型或计算资源——而是数据基础设施成本的指数级增长,这可能会使AI计划在经济上变得不可持续。

财务挑战的规模

传统的数据架构并非设计用于处理AI应用程序所需的数据量和速度。在流式场景中,仅网络成本就可能占总基础设施支出的80%。当组织必须在不同的区域或区域之间移动数据以进行处理或训练时,这个问题尤其突出。

考虑一个典型的企业AI计划:公司通常从针对一个特定业务挑战的小规模试点项目开始,例如实施用于欺诈检测或预测规划的AI。从成本角度来看,这些项目最初似乎是可控的。但是,随着数据量的增长和用例的扩展,基础设施成本呈指数级增长而非线性增长。对于自动驾驶或制造传感器等关键任务应用程序尤其如此,其中实时数据处理是不可协商的,停机时间是不可接受的。

成本挑战源于三个主要因素:

  • 首先,传统架构通常需要在不同系统中复制相同的数据——一份用于流处理,一份用于批处理,另一份用于AI训练。
  • 其次,在云环境中不同区域之间移动这些数据会产生大量的网络成本。
  • 第三,为实时和批处理维护单独的基础设施会造成运营开销和效率低下。

这种数据和基础设施的倍增导致了“AI数据税”——在将AI计划扩展到试点项目之外时出现的隐藏成本。对于许多组织而言,这些成本可能超过AI模型和计算资源本身的支出。

重新思考数据架构

我看到各组织正在通过创新的架构方法来应对这些挑战。一个有前景的方向是采用无领导架构并结合对象存储。这种方法通过利用同时服务于多种用途的云原生存储解决方案,消除了昂贵的数据移动的需要。

另一个关键策略是重新思考数据如何组织和访问。公司不再为流处理和批处理维护单独的基础设施,而是转向能够高效处理两种工作负载的统一平台。这降低了基础设施成本,并简化了数据治理和访问模式。

云提供商的定价模式会显著影响AI基础设施的经济性。虽然云服务提供灵活性和可扩展性,但它们的网络出口费用和数据传输成本对于数据密集型AI工作负载而言很快就会变得过高。组织必须仔细设计解决方案,以最大限度地减少区域和区域之间的数据移动。

成本效益的提升

随着我们进入2025年,成功的AI计划将越来越少地依赖于选择合适的模型,而更多地依赖于构建具有成本效益的数据基础设施。

组织应关注:

  • 实施最大限度地减少数据复制和移动的架构;
  • 利用对象存储和无头设计来降低基础设施成本;
  • 统一流处理和批处理以简化操作;
  • 优化云资源使用以控制网络支出。

虽然Gartner预测的IT支出增长反映了AI日益增长的重要性,但未能解决这些基础设施挑战的组织可能会因为成本过高而导致其AI计划停滞。成功的关键不在于投入更多资源来解决问题,而在于从根本上重新思考我们如何为AI时代设计数据基础设施。

下一波人工智能创新浪潮的到来,不仅取决于更好的模型,还取决于更高效的存储、移动和处理海量人工智能数据的方法。解决这一基础设施挑战的组织将最有可能成功扩展其人工智能计划。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注