虽然提示工程是解决通用任务的一种快速且经济高效的解决方案,但微调可以在专有数据上实现卓越的 AI 性能。
译自 Is Fine-Tuning or Prompt Engineering the Right Approach for AI?,作者 Rajat Tiwari。
我们之前讨论了如何构建一个基于RAG的聊天机器人,为企业数据创建全面的GenAI平台铺平了道路。这篇文章强调了企业越来越需要开发针对其特定需求的AI解决方案。
随着AI 采用的加速,各组织面临着一个关键的决定:他们应该依靠提示工程来获得快速解决方案,还是投资于微调模型以进行更深层次的定制?
让我们探讨这两种方法之间的差异,从早期采用者那里学习,并概述大规模微调的基础设施要求。
提示工程涉及制作精确的输入提示,以指导 大型语言模型 (LLM)(如 OpenAI 的 GPT 或 Anthropic 的 Claude),而无需修改其架构。
当与检索增强生成 (RAG)(它集成了外部知识库)结合使用时,这种方法可以动态地丰富模型输出,使其成为一种经济高效且适应性强的解决方案。
提示工程和 RAG 的优势
- 速度和简单性:实施速度更快,技术开销最小。
- 适应性:适用于通用用例和常见任务。
- 更低的成本:无需复杂的基础设施或模型训练。
挑战和限制
- 知识截止:预训练模型可能缺乏最新的信息。
- 有限的定制:模型难以处理小众或专有任务。
- 数据隐私风险:在提示中使用敏感数据可能会暴露知识产权。
虽然提示工程非常适合通用应用程序,但专业的 AI 工作流程通常需要更强大的解决方案。这就是微调的优势所在。
微调涉及使用特定领域的数据集重新训练基础模型,并调整模型的权重,以更好地适应独特的工作流程。此过程使组织能够增强模型在专门任务中的性能,从而提供无与伦比的控制和定制。
微调的主要优势
- 提高准确性:定制模型在专有数据集上表现更好。
- 完全控制:微调可以更深入地控制模型行为和输出。
- 专业化:非常适合行业特定或专有用途。
常见的微调技术
- 持续预训练 (CPT):使用自定义数据集扩展基础模型训练。
- 监督微调 (SFT):使用标记的提示-响应对进行特定于任务的优化。
- 从人类反馈中进行强化学习 (RLHF):使输出与人类偏好保持一致,以获得细致的结果。
随着企业意识到通过为特定需求定制 AI 模型来交付更好结果的潜力,微调正变得越来越流行。这不仅仅是访问 GPU — 而是通过使微调更容易的新工具,充分利用专有数据。
以下是微调越来越受欢迎的原因:
- 使用专有数据获得更好的结果:微调允许企业使用自己的数据训练模型,使 AI 更加准确并与他们的特定任务相关。这可以带来更好的结果和真正的商业价值。
- 比以往任何时候都容易:Hugging Face 的开源库、PyTorch 和 TensorFlow 以及云服务等工具使微调更容易访问。这些框架简化了流程,即使对于没有深厚 AI 专业知识的团队也是如此。
- 改进的基础设施:功能强大的 GPU 和基于云的解决方案的日益普及使得大规模设置和运行微调变得更加容易。
虽然微调为更多定制的 AI 打开了大门,但它确实需要仔细的规划和正确的基础设施才能成功。
开发微调的 AI 模型是一个多步骤的过程,首先是确保正确的基础设施。以下是分步路线图。
第 1 步:采购 GPU
获得 GPU 是 AI 开发的基础。组织通常使用 NVIDIA 的云合作伙伴 (NCP) 计划、云 GPU 提供商或 AWS 等平台。
示例:一家科技公司 ABC Corp 决定采购 GPU 以支持其不断增长的 AI 计划,包括运行复杂的模拟、加速机器学习实验以及为专有使用案例微调模型。通过构建内部 AI 数据中心,他们确保拥有多样化 AI 项目所需的灵活性和资源,同时保持对敏感信息的控制。
第 2 步:设置 GPU 基础设施
获得 GPU 后,下一步是设置基础设施。自动化工具和平台简化了集群管理、服务器设置和部署等任务,从而更容易高效地使用和扩展 GPU 资源。
示例: ABC Corp 的 IT 管理员使用自动化工具来高效地部署和管理他们的 GPU 集群。这种简化的流程使他们的团队能够更快地开始试验模型。
第 3 步:构建编排层
高效地管理 GPU 资源需要一个编排层。该层根据开发人员的需求分配 GPU 容量。例如,Rafay 的 GPU PaaS 解决方案允许 IT 管理员为团队创建 GPU 配置文件,从而实现无缝的自助服务访问。
示例: ABC Corp 的 IT 团队使用编排平台配置 GPU 配置文件。当首席数据科学家需要一个用于项目的 4-GPU 或 2-GPU 实例时,它可以立即配置,从而使团队能够继续进行而不会延误。
第 4 步:微调和模型开发
设置好基础设施后,AI 团队可以专注于真正的工作:微调和构建模型。公共云平台(如 AWS Bedrock 和 Azure AI)以及私有云解决方案(如 Rafay)提供了用户友好的环境,使开发人员可以更轻松地试验、训练和高效地部署模型。
这些平台允许数据工程师和机器学习工程师等最终用户将微调后的模型用于日常任务,从而推动创新和提高生产力。
示例: ABC Corp 的一位数据科学家将特定领域的数据集上传到微调平台,从而根据公司独特的需求定制大型语言模型。这产生了一个模型,该模型为他们的业务应用程序提供了卓越的准确性和改进的结果。
随着企业加速采用 AI,在提示工程和微调之间进行选择将对其成功产生重大影响。虽然提示工程为通用任务提供了一种快速、经济高效的解决方案,但微调释放了 AI 的全部潜力,从而能够在专有数据上实现卓越的性能。
从获得 GPU 到微调模型,这个过程很复杂,但组织可以通过正确的基础设施和工具来简化它。
在未来的文章中,我们将详细探讨微调技术,为处于 AI 旅程各个阶段的企业提供可操作的见解。
如果您正在寻找支持您的 AI 计划的解决方案,Rafay 支持企业完成 AI 旅程的关键步骤——从使用 Rafay 的裸金属解决方案设置基础设施、使用 Rafay 的 GPU PaaS 管理 GPU 资源,到使用 Rafay 的 GenAI 平台进行微调和模型部署。