“开源”有明确定义,让我们认真捍卫它

Llama 大型语言模型声称是开源的,但 OpenInfra 首席运营官 Mark Collier 表示它根本不是。

译自 'Open Source' Has a Definition, Let's Get Serious About Defending It,作者 Mark Collier。

人工智能可能是科技领域中罕见的转型时代,它被低估了。数万亿美元的市场现实可能会让我们所有人感到惊讶。因此,看到世界上最大的公司和政府制定战略、产品和工作流程来占据这部分市场也就不足为奇了。

但是,在误导性人工智能法规、被破坏的开源定义和各种各样的狂妄自大相互重叠的韦恩图中,全球经济和创新的未来正面临风险。

法规可以塑造,狂妄自大是无法治愈的,所以让我们关注第三个变量,即分类要求我们立即关注的变量:人工智能混战中参与者对全球开源社区造成的故意或过失附带损害。

上周宣布Llama 3 只是针对该术语的一系列淫秽行为中的最新开源威胁——我们都应该记住,它有一个定义,我们都努力创建和捍卫它。虽然 Llama 3 LLM(及其前身)令人印象深刻,并且值得称赞它实现了推动实用人工智能发展的基准,但一个不准确之处已被反复报道,它需要同理心的纠正:Llama 3 的 Meta 许可证不是开源的

公平地说,这里存在歧义,开源倡议正在领导一个开放的、社区驱动的流程来详细说明开源定义如何在人工智能世界中应用。但即使没有这个过程,我们已经知道 Meta 的自定义许可证通过限制使用和创建衍生作品的能力,违反了当前开源定义和 OSI 社区针对人工智能的任何最终工作的多项原则。

开源定义的这一要素——创建和利用衍生作品的无障碍权限——是开源成为全球创新的强大推动力的核心。任何限制这一点的许可证,根据定义,都不是开源的。以下摘自 Llama 3 许可证 说明了这一点:

b. Redistribution and Use.
i. If you distribute or make available the Llama Materials (or any derivative works thereof), or a product or service that uses any of them, including another AI model, you shall (A) provide a copy of this Agreement with any such Llama Materials; and (B) prominently display “Built with Meta Llama 3” on a related website, user interface, blogpost, about page, or product documentation. If you use the Llama Materials to create, train, fine tune, or otherwise improve an AI model, which is distributed or made available, you shall also include “Llama 3” at the beginning of any such AI model name.

我们可以高度确信,即将出台的开源人工智能定义不太可能包括根据 Meta 和其他公司制定的此类商业限制性条款授权的模型资产,因为它们从根本上限制了访问,因此限制了自由。

尽管媒体经常错误地将 Meta 的 Llama 系列模型称为“ 开源”,从而造成混乱,但最近的一篇文章已进行了修改以澄清情况。

建立在开源之上

重要的是,我们认识到开源社区已经在为支持人工智能工作负载的进步而做出的努力。

Nvidia 依赖 Kata 容器Kubernetes,以便将现有的 AI/ML 工作负载无缝迁移到机密环境,同时将 LLM 与 GPU 加速计算相结合。几周前,OpenStack 社区 宣布了 Caracal,这是该项目的第 29 个版本,其功能包括加强对 AI 工作负载的支持,包括实时 GPU 迁移。

对于像 StackHPC,他们已经使用英国最大的超级计算机 Dawn 支持 AI 工作负载。该公司在 LinkedIn 上发帖称,“StackHPC 专注于为私有云提供 HPC 和 AI,我们期待将 OpenStack Caracal 版本的功能和优势带给我们的社区和客户。”

开源在 AI 的演进中发挥着至关重要的作用,并且已经取得了成果。开源面临着威胁——来自恶意的重新授权和障眼法的营销术语——全球的开发者和用户社区已经开始依赖开源的基本原则,他们可以理解地感到紧张和有点愤怒。

随着新受众首次接触该术语,我们的全球社区在教育他们了解开源方面发挥着至关重要的作用。即它释放了无法估量的创造力和市场价值,并且它有一个非常具体的定义,如果要为 AI 革命 保留该价值,就必须捍卫该定义。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注