将 AI 引入数据中心

将 AI 引入数据中心

翻译自 Bringing AI to the Data Center

不管你喜不喜欢,许多公司最重要的数据都存在于数据中心。很快,这将不再是交付 AI 的障碍。

尽管我们对企业数据和云技术的进步做出了所有假设,但有一个显而易见的事实经常被忽视:大多数最重要的企业数据仍然在企业数据中心。

有许多原因造成这种情况——有些原因比较合理,有些不太合理。在某些情况下,这是因为数据的高度敏感性,无论是 HIPAA 合规性要求,还是敏感的银行数据或其他隐私问题。在其他情况下,数据存在于难以移至云端的系统中(例如传统的企业资源规划数据或 PB 级的科研数据)。有时仅仅是惯性。这不是一个很好的借口,但这种情况一直都在发生。

无论出于何种原因,将数据存储在企业服务器的机架上已被证明是许多企业利用人工智能来改变业务能力的真正障碍,因为几乎不可能提供在支撑大多数数据中心的基础设施上驱动人工智能所需的重要计算能力。

但是,通过一小群初创公司和大型设备制造商,正在开展一项运动,以优化机器学习模型,并将人工智能提供给数据不在云中的公司。这将改变游戏规则。

处理能力问题

图形处理单元(GPU)的开发是为了处理高强度的视频处理应用程序,例如现代视频游戏和高分辨率电影所需的应用程序。但是,这些处理器将复杂任务分解为更小的任务并并行执行它们的能力也使这些高功率专用集成电路(ASIC)对人工智能非常有用。毕竟,人工智能需要大量的数据流来完善和训练机器学习模型。

另一方面,CPU 是服务器的灵活大脑,因此,它们旨在处理各种操作,例如访问硬盘驱动器数据或将数据从缓存移动到存储,但它们缺乏并行执行这些任务的能力(多核处理器可以处理并行任务,但不是在 GPU 级别)。它们根本不是为处理 AI 所需的那种高吞吐量工作负载而构建的。

高性能 GPU 非常昂贵,直到最近,由于加密矿工对这些高性能芯片的依赖,它们一直很稀缺。在大多数情况下,它们是云提供商的领域。

事实上,高性能计算服务是公司将数据迁移到云端的一个重要原因。谷歌的张量处理单元(TPU)是一种定制的 ASIC ,专门用于加速机器学习工作负载。亚马逊也有自己的芯片,用于为 AI/ML 工作负载提供动力。

针对 AI 进行优化

GPU 一直是最近占据头条新闻的 AI 创新热潮的基础。这些备受瞩目的发展大多是由公司推动的,这些公司在没有过多考虑效率或优化的情况下推动了可能性。因此,新的人工智能工具产生的工作负载是巨大的,因此,必须管理在云中。

但在过去六个月左右的时间里,这种情况一直在改变。首先,驱动所有这些尖端人工智能工具的庞大 ML 模型正在被显著压缩,但它们仍然产生同样强大的结果。

例如,我在手机上安装了 Vicuna 应用程序。这是一个 130 亿个参数的模型,可以像 ChatGPT 一样运行,并且可以实时运行,就在我手机上。它根本不在云中 - 它是一个驻留在设备上的应用程序。

Vicuna 项目源于大型模型系统组织,该组织是加州大学伯克利分校、加州大学戴维斯分校和卡内基梅隆大学之间的合作项目,旨在“通过共同开发开放数据集、模型、系统和评估工具,使每个人都可以访问大型模型”。

这是大型科技公司不会忽视的使命。苹果最新的台式机和 iPhone 具有专门的处理能力,可以加速 ML 流程。谷歌和苹果也在做很多工作来优化他们的 ML 软件。

初创公司中还有大量才华横溢的工程师,他们正在努力使硬件性能更高,从而使 AI/ML 更易于访问。

一个很好的例子是 ThirdAI ,它提供了一个基于软件的引擎,可以使用 CPU 训练大型深度学习模型。 DataStax 几个月来一直在与 ThirdAI 团队进行试验,并对他们开发的内容印象深刻 - 以至于上周我们宣布与该公司合作,使任何组织都可以使用复杂的大型语言模型(LLM)和其他 AI 技术,无论他们的数据位于何处。(此处阅读有关合作伙伴关系新闻的更多信息。)

将 AI 带给数据

由于所有这些辛勤工作和创新,人工智能将不再专门提供给在云中拥有数据的组织。这对隐私非常重要,这是许多组织将数据保存在自己的服务器上的一个重要原因。

在过去的 18 个月左右的时间里,人工智能转型浪潮席卷了一切,一切都与数据有关。事实上,没有数据的人工智能,无论它驻留在何处。像 ThirdAI 这样的团队的努力也使所有组织能够“将 AI 带给数据”。

长期以来,公司被迫做相反的事情:将他们的数据带到人工智能上。在分析关键见解之前,他们必须投入大量资源、时间和预算将数据从数据仓库和数据湖迁移到专用机器学习平台。

这会导致巨大的数据传输成本,并且迁移、分析和迁移所需的时间会影响组织了解新模式并立即与客户采取行动的速度。

将 AI 带给数据是我们 DataStax 通过实时 AI 工作非常关注的事情,因为它是基于 ML/AI 采取行动,取悦客户并增加收入的最快方式。将人工智能带到数据中心,而不仅仅是云,是使转型人工智能技术成为所有公司都可以参与其中的另一重要步骤。

了解新的 DataStax AI 合作伙伴计划,该计划将企业与开创性的 AI 初创公司联系起来,以加速为客户开发和部署 AI 应用程序。

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注