人工智能入侵企业:超级对齐的关键路径

对于希望利用 GenAI 并实现高质量 LLM 的组织来说,存在一条加速数据科学和机器学习计划的途径。

译自 The Critical Path to Superalignment as AI Invades the Enterprise,作者 Paroma Varma。

“超级对齐(Superalignment )”的概念曾经是科幻小说和学术计算机科学领域的一个小众话题,但在 OpenAI 解散其超级对齐团队后,它进入了日常对话。

超级对齐旨在确保未来的超人类 AI 系统符合人类的伦理和目标——这无疑是一个值得称赞的雄心壮志。然而,就像在设计星际飞船的安全带之前优先考虑提高汽车安全一样,我们应该立即关注的是我们所说的“企业对齐”:确保 AI 能够准确地运行,安全可靠,并且可以在关键的商业环境中进行审计和扩展。

让我们让聊天机器人正常工作,不要说违规或不准确的话,然后再担心限制 SkyNet。

企业对齐的挑战

Snorkel 团队自 2015 年起就在斯坦福 AI 实验室研究弱到强的泛化(超级对齐的技术基础)。我们与企业 AI 团队的合作经验表明,企业需要帮助将当前的非超人类生产级生成式 AI 系统与组织标准、伦理和目标进行对齐。

标记数据,特别是偏好数据,即人类将 LLM 响应评定为可接受或不可接受(或提供其他类似形式的反馈),是企业对齐的关键。

我们看到领先的银行、科技公司和其他企业正在收集用户对其 AI 模型的响应数据,并手动标记每个响应是否可接受。这种费力的“点赞、点踩”方法在企业规模上非常繁琐、具有挑战性和效率低下。

这些手动流程会导致瓶颈和延迟,使企业难以适应快速变化的政策和法规。例如,在 COVID-19 大流行期间,政策例外和变化频繁发生,需要不断更新 AI 模型训练数据。企业发现很难手动调整其模型以快速反映这些变化。

大型科技公司和 LLM 提供商利用强化学习从人类反馈 (RLHF) 等方法,严重依赖大量手动标注数据。这种流程通常涉及外包给外包人员,对于大多数企业环境来说,成本过高且效率低下。实际的企业对齐——例如,将自定义 LLM 对齐到自定义的特定领域目标和策略——实际上被数据阻碍了。

我们与一家大型科技公司合作,发现其手动标记流程随着用户群的增长而变得不可持续。通过采用程序化数据开发,它能够扩展其运营,而无需成比例地增加手动标记工作量。这提高了其 AI 的性能,并使其能够快速有效地响应政策变化。

我与许多高级 IT 领导人交谈过,他们的经验表明,刚刚开始 AI 对齐之旅的企业应该避免尝试手动标记所有内容。即使你将这项工作外包,你也会通过无法演变的静态数据集创建技术债务。程序化数据开发可以使你的对齐能力面向未来。**

程序化数据开发:企业对齐的关键

在最近的研究中,Snorkel 团队表明,它可以快速应用程序化数据开发来将 LLM 对齐到自定义的特定领域策略和目标。我们在三个特定于企业的任务上验证了这种方法,显示出在每个任务中不到五个小时的程序化数据开发后,取得了显著的改进:

  • 金融服务: 我们将一个符合合规性的 GenAI 应用程序与金融顾问的职业和道德标准相一致,将对不合规请求的正确响应率提高了 20.7 个准确性点,超过了现成的解决方案——结果:一个与企业一致的,99% 符合合规性的金融顾问聊天机器人。
  • 保险: 我们将一个索赔覆盖 AI 助理与汽车保险单相一致,将无效索赔的拒绝率提高了 12.3 个准确性点,达到 98%,对有效索赔几乎没有影响。我们还根据适用的保单提供了关于索赔被拒绝原因的明确解释。
  • 医疗保健: 我们将一个聊天机器人与医疗保健提供者的具体政策相一致,在与用户的互动中,实现了对政策遵守情况评估的近 20 个点的提升。

这些成功突出了程序化方法的潜力,该方法使主题专家能够有效地将组织政策编码到偏好数据集中。这种方法的关键是一个结构化的、程序化的工作流程,它能够有效地使主题专家将领域——以及企业特定的政策编码到数据集中。

想象一下从二进制手动编码过渡到使用高级编程语言的类比。最初,必须仔细地编码每一个步骤,但随着更高层次的抽象,可以更有效地实现复杂的功能,并且错误更少。同样,程序化数据开发允许以更高层次、更抽象的方式对 AI 模型进行编码和更新,使该过程更快、更可靠。

加速企业 AI 的价值实现

除了提高一致性准确性之外,程序化数据开发技术使 AI 团队能够比传统方法更快地释放价值。赋予主题专家直接编码其领域知识的能力,极大地减少了开发人员和 SME 之间反复反馈循环的需要。

“在我们之前的 手动标注过程中,由于来回沟通,仅仅训练一个初始模型通常需要几个月的时间,”一家大型制造公司的 AI 项目经理回忆道。“通过程序化数据开发,我们的合规负责人基本上可以在一个下午将政策规则‘写入’训练数据中。我们从模型构思到生产不到一周的时间。”

通往企业超级一致性的道路

最终目标不仅是实现立即的企业一致性,而是实现企业超级一致性——确保未来更强大的 AI 系统与组织标准保持一致。这段旅程从实际的、渐进的步骤开始。通过解决企业环境中的当前挑战,我们为更广泛的超级一致性目标铺平了道路。

程序化方法提供了当今动态商业环境所需的快速性和可重复性,并允许在企业政策发生变化时快速调整。这种适应性确保 AI 系统与组织变化保持一致,而无需进行大量返工。

虽然开发用于假设的飞碟的先进安全系统是值得称赞的,但现实世界的必要性在于增强当前企业环境中的 AI 一致性。人们对 AI 的变革潜力抱有乐观态度,并致力于弥合理论进步与实际的、可投入生产的 AI 解决方案之间的差距。

对于希望利用生成式 AI 并实现高质量 LLM 的组织来说,存在一条加速数据科学和机器学习计划的途径。通过探索程序化数据开发技术,企业可以在其 AI 努力中推动价值和效率。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注