组织必须专门投入时间和资源到AI和向量数据库技术。
译自 Vector Databases: The Foundation of AI Agent Innovation,作者 Andre Zayarni。
未来数年,向量数据库的增长势头丝毫没有减弱的迹象,Forrester 预测,到 2026 年,大多数组织都将在生产环境中使用向量数据库。然而,向量数据库及其面临的挑战将发生巨大变化,尤其是在大规模使用的情况下。如今,这在向量数据库在企业采用 AI 智能体中所扮演的角色中尤为明显。
麦肯锡认为,向量数据库将成为构建 AI 智能体(“生成式 AI 的下一个前沿”)的关键。“我们正在从基于知识的、由生成式 AI 驱动的工具——例如,回答问题和生成内容的聊天机器人——转向由生成式 AI 支持的‘智能体’,这些智能体使用基础模型在数字世界中执行复杂的多步骤工作流程。简而言之,这项技术正在从思想转向行动,”最近的一篇麦肯锡季刊文章指出。
德勤预测,2025 年将有 25% 使用生成式 AI 的企业部署 AI 智能体,到 2027 年这一比例将增长到 50%。“虽然早期采用者将面临复杂性和挑战,但这一愿景足以促使组织积极采取措施,为未来的采用做好准备,”德勤全球 2025 年预测报告生成式 AI:为技术、媒体和电信领域的变革性未来铺平道路指出。“这一发展将使 AI 智能体能够处理更广泛的应用,为企业提供宝贵的工具,以提高知识型员工的生产力和各种工作流程的效率。”
虽然传统数据库可以支持 AI 应用,但它们缺乏高效处理海量多模态非结构化数据的专用架构——尤其是在实时处理方面。原生向量数据库非常适合定制智能 AI 所需的相关且上下文感知的响应。
例如,在许多传统应用中,用户发送请求并根据有限的结构化数据获得答案。智能体在决策方面则大相径庭,它们基于许多步骤中的各种输入,使用各种数据类型。例如,在医疗保健领域,AI 智能体可能会综合最新的 X 光图像、医生笔记、实验室结果、研究论文等,作为临床环境中的助手,与人类洞察力协同工作,并在数据演变时调整建议。在旅游业中,AI 智能体可以使用来自社交媒体帖子、照片、视频、旅游指南、新闻源和天气报告的实时数据来制定个性化行程。
可能性是无限的,但信任是任何 AI 智能体成功的共同因素。向量数据库充当这些智能体的记忆,实现自适应学习、实时决策、智能体之间的协作以及上下文精度。
QA.tech 提供 AI 驱动的自动化测试解决方案,它使用 Qdrant 向量数据库解决方案来启用在浏览器上执行任务的测试智能体,就像用户一样。这些智能体取代了难以设置和维护的硬编码测试,并避免了雇用人工 QA 测试人员的需要。QA.tech 智能体记录错误并向开发人员标记错误以供审查。由于整个测试过程都被记录下来,开发人员可以快速分析每个步骤以识别问题和差距。
QA.tech 的需求——最值得注意的是高效的实时操作和可扩展的基础设施——反映了大多数企业用例的需求。随着企业采用和扩展 AI 智能体的使用——以及 AI 智能体本身被构建为执行越来越复杂的任务——必须考虑向量数据库如何以及如何在多大程度上管理网络开销和 CPU 负载,以及它存储不同用例的多个嵌入的能力。
虽然向量数据库为寻求采用智能 AI 的企业提供了巨大的潜力,但它们也带来了一些挑战。
例如,随着自主代理应用程序的使用扩展,对数据泄露、数据主权和法规遵从性的担忧也会增加。开源系统、基于角色的访问控制、加密以及灵活地在本地、数据中心和/或云中部署数据库的能力,只是组织可以用来确保向量数据库不会成为AI应用程序链中薄弱环节的一些工具。随着向量数据库规模的扩大,成本和容量也将成为一个问题,这也是评估提供混合部署选项的开放解决方案的另一个原因。
另一个担忧是可用技能。许多公司都不具备使向量数据库运行起来的专业知识,更不用说在企业环境中充分优化自主代理AI技术了。公平地说,这与其说是向量数据库问题,不如说是AI问题——技术发展迅速,用例也在迅速发展,跟上步伐可能具有挑战性。例如,自主代理AI六个月前可能并未出现在企业的视野中,但现在对许多公司来说,它已成为一项关键的竞争需求。
组织必须专门为AI和向量数据库技术投入时间和资源。尽管如此,他们也可以通过专注于使用开源来弥合技能差距。使用开源解决方案的组织受益于社区的集体知识和经验,同时也避免了使用缺乏透明度的AI产品的问题。
如果2024年是组织发现向量数据库和生成式AI之间同步性的年份,那么2025年及以后将是向量数据库驱动生成式AI创新(包括自主代理AI)的时代。