可以在 Kubernetes 上部署的 3 个重要 AI/ML 工具

可以在 Kubernetes 上部署的 3 个重要 AI/ML 工具

翻译自 3 Important AI/ML Tools You Can Deploy on Kubernetes

组织们都知道在 Kubernetes 上获取完整应用程序堆栈的重要性,人工智能是下一个。

基础设施技术的世界变化很快。不久以前,在 Kubernetes 上运行数据库被认为过于棘手,不值得这么做。但那只是昨天的问题。云原生应用程序的构建者已经擅长于运行有状态的工作负载,因为 Kubernetes 是一种快速、高效地创建虚拟数据中心的强大方式。

上一次撰写相关内容时,我扩大了视野,考虑了虚拟数据中心中应用程序栈的其他部分,特别是流式工作负载和分析。

随着这两个成为 Kubernetes 的主流,关于用例的讨论变得更加有趣。如果我们可以访问这些基础数据工具,我们将如何处理它们?

幸运的是,我们不必深入研究,因为行业已经选择了方向: AI/ML 工作负载。推动这一趋势的是对更快、更灵活的 MLOps 的需求,以支持在线预测,也被称为实时人工智能(AI)。Uber 和 Netflix 等公司都是早期采用者,但是有许多很棒的项目可以帮助您更快地使用 Kubernetes。

Feast 支持的特征服务

构建和维护机器学习(ML)模型正在从后台转向更靠近用户的生产环境。特征存储作为数据和机器学习模型之间的桥梁,提供了模型在离线和在线阶段访问数据的一致方式。它管理模型训练期间的数据处理要求,并在在线阶段提供低延迟的实时访问模型。这确保了两个阶段的数据一致性,并满足在线和离线的需求。Feast 是在 Kubernetes 中运行的特征存储的一个例子。

Feast 是一款开源工具,可帮助组织在离线训练和在线推理阶段一致地存储和提供特征。它不仅提供了传统数据库的功能,还提供了专业的特性,如时点正确性。同时,Feast 运行在 Kubernetes 中,使得它可以很好地与云原生应用配合使用。

KServe 支持的模型服务

KServe 是用于在 Kubernetes 中部署机器学习模型的 API 端点,处理模型的获取、加载和确定是否需要使用 CPU 或 GPU 。它与 KNative 事件集成以实现扩展,并提供 metrics 和日志等可观测性特性。

最好的部分?它很容易使用。只需将 KServe 指向您的模型文件,它将创建一个 API 并处理其余的部分。解释器功能提供了有关为什么会作出每个预测决策的见解,提供特征重要性并突出显示导致特定结果的模型因素。

这可以用于检测模型漂移和偏差,这是机器学习中“重要但困难”的部分之一。这些功能减少了 MLOps 所需的工作量,并增强了对应用程序的信任。 KServe 最近从 Google KubeFlow 项目中分离出来,并被彭博社作为其构建 ML 推理平台的努力的一部分进行了重点介绍。

矢量相似性搜索

传统的寻找数据的方法有所不同,向量相似度搜索(Vector Similarity Search,VSS)是一种机器学习工具,它使用向量数学来找出两个事物彼此之间的“接近程度”。这是通过 K 最近邻(K-nearest neighbor,KNN)算法来完成的,该算法将数据表示为向量。

然后,使用一个 CPU 密集型的 KNN 算法将数据进行向量化,然后进行索引以进行低 CPU 消耗的搜索。终端用户可以提供一个向量,使用 VSS 服务器提供的查询机制找到与其相似的事物。可在 Kubernetes 中部署的开源 VSS 服务器包括 WeaviateMilvus 。两者均提供了添加相似性搜索到应用程序堆栈所需的所有内容。

组建团队

结合我之前的文章和这篇文章,你就有了在 Kubernetes 中部署完整堆栈的秘诀。每个组织都应该努力实现的结果是提高生产力和降低成本。最近的调查表明,数据领域的领导者在 Kubernetes 中部署数据基础架构时发现了这两种情况。

AI/ML 工作负载可能是您刚刚开始探索的内容,因此现在可能是正确开始的最佳时机。提到的三个领域——特征服务、模型服务和向量相似性搜索——都包含在我与 Jeff Carpenter 合著的书“Managing Cloud Native Data with Kubernetes”中。应用程序堆栈中 AI/ML 的大局:实时需求将很快在大多数 AI 应用程序中变得普遍。使用 Kubernetes 快速运行并可靠地构建不再是 AI 的幻觉。

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注