重磅!Linux 基金会发布 AI 模型新许可协议 OpenMDW!兼容 Apache 2.0 和 MIT 许可证,力求简洁易用。覆盖模型、数据、文档和软件等“模型材料”,但训练材料除外。解决 Hugging Face 等平台模型许可难题,助力 AI 模型商业化落地!
译自:OpenMDW Is a New Permissive License for AI Models
作者:Frederic Lardinois
Linux 基金会本月早些时候悄然发布了一个针对 AI 模型及其工件的新许可证。新的 OpenMDW 许可证是一种高度宽松的许可证,它结合了 Apache 2.0 和目前流行的 MIT 许可证 的某些方面,MIT 许可证是目前 AI 模型许可的热门选择。它也很短,很容易放在一页纸上。
OpenMDW 诞生于 Linux 基金会的另一项工作,即 模型开放框架 (MOF),该框架试图帮助用户评估给定模型的实际开放程度。该框架将模型分为三个类别,从仅包含模型及其参数且具有不受限制的使用权的“开放模型”,到包含研究论文、数据集、中间模型参数等的“开放科学模型”,以允许完全重现类似的模型。
这非常复杂,而且看起来总体思路并没有流行起来。Matt White 帮助主持了 OpenMDW 许可证的发布工作,同时也是 PyTorch 基金会的执行董事,他承认了这一点。“模型开放框架的初始版本不易部署。它需要数据集的多个许可证,以及源代码的不同许可证集。因此,我们一直认为实际上需要一个可以涵盖所有这些内容的许可证。这就是 OpenMDW 的诞生之处,”他解释说。
最初,White 告诉我,最初的想法是创建一种基于 Creative Commons BY 4.0 许可证和 Apache 2.0 许可证的元许可证,但这让人感到笨拙。OpenMDW 背后的团队,包括来自 Linux 基金会以及 Amazon、IBM、Meta 和 Microsoft 的代表,确实想要一个像 MIT 许可证那样简短、宽松的许可证。
他指出,部分动机还在于确保,例如,如果开发人员访问 Hugging Face 并下载了 OpenMDW 许可证涵盖的模型,那么可以清楚地了解可接受的用途。他指出,如今,模型通常受具有限制或与可接受使用政策相关的社区许可证的约束。
“没有人会阅读 MIT 和 Apache 2.0,对吧?我们希望通过此许可证建立这种信任机制,以便人们识别该模型。它是 openMDW。好的。我知道我可以用它做什么。它对于商业用途是安全的。我可以在研究中使用它。我可以在生产中使用它。我可以随心所欲地使用它,”White 说。
OpenMDW 许可证的核心是其对“模型材料”的定义,其中包括模型本身和“所有相关工件(包括相关数据、文档和软件)”。这将涵盖模型架构(可以是代码或配置)、任何训练和预处理代码以及所有其他内容。但是,该许可证不要求提供任何实际的训练材料。
“我们希望它具有相当的包容性,”White 解释说。“此外,我们不假设我们知道未来的模型会是什么样子。这里的想法是使其足够广泛,不仅可以涵盖当今的深度学习模型,而且可以涵盖昨天的机器学习模型,以及未来的模型。”
该许可证还允许开发人员在另一个开源许可证下提供任何这些其他材料。他们只需将相应的许可证文件放入包含相关代码的目录中即可。
“我们的另一个目标是使该许可证成为全球许可证,以便与其他许可证兼容,”White 解释说。“因此,如果您有另一个许可证,您想在 Apache 2.0 下许可某些软件代码,这很好。它位于不同的目录结构下。[...] 但是,如果您包含它,并且另一个许可证没有明确说明,则 OpenMDW 将涵盖这些组件。”
与 Apache 2.0 许可证一样,它包含一项专利诉讼条款,该条款实质上意味着,如果任何人提起专利诉讼,声称该许可证涵盖的任何材料侵犯了专利,他们自己将失去该许可证授予的所有权利。
“如果有人起诉你,他们不应该仍然能够使用该模型,对吧?这是不费吹灰之力,”White 说。
由于该许可证未对模型输出施加任何限制,因此它还确保可以将具有此许可证的模型用于例如蒸馏。 在很大程度上,该许可证一直未引起广泛关注,尽管在团队发布 1.0 草案之前,它确实有六个月的评论期。也许这是因为到目前为止,它尚未包含在 SPDX 许可证列表中,并且该团队也尚未将其提交给 OSI。White 指出,该许可证不是传统的开源许可证,尽管它体现了开源原则。但由于它不要求任何组件,而 OSI 对开源 AI 模型的定义却要求,因此它是否能通过审查还有待观察。