数据科学研究表明,AI模型的云端部署激增

在部署用于数据科学、机器学习或人工智能工作的AI模型的人群中,云环境的使用激增。

译自 Cloud Deployment of AI Models Jumps, Says Data Science Study,作者 Lawrence E Hecht。

忽略您听到的关于AI工作负载推动从云端迁移到本地和私有云环境的轶事。在2024年,Anaconda最新“数据科学现状”报告中只有27%的专业受访者将大部分模型部署到本地服务器,这比2022年同项研究中41%的比例大幅下降。

事实上,在主要执行数据科学、机器学习或人工智能任务的模型部署受访者中,云环境的使用率大幅提升。59%的受访者表示他们的模型主要位于云端,高于2022年的49%。

尽管AI领域明显增长,但只有64%的受访专业人士将模型部署到生产环境中,低于2022年研究中的76%。这一下降是由较少的开发人员和数据工程师表示他们部署模型造成的。下降的一个解释可能是对第三方托管大型语言模型的依赖性增加。

2024年,87%的受访专业人士参与了模型训练和开发,高于2022年的85%。在进行训练和模型开发的人员中,现在使用本地服务器的人数减少了一半(2024年为10%,而2022年为20%)。即使现在云端进行的训练更多,本地台式机和笔记本电脑仍然是最常见的地点。我们将其解释为用户将其计算机直接连接到云端,并且未使用本地服务器。

部署模型到生产环境的挑战

Anaconda还询问了公司在将数据科学或AI模型迁移到生产环境时面临的障碍。如前所述,较少的受访者将模型部署到生产环境中,但问题只关注已经将模型迁移到生产使用的公司面临的问题。在这个群体中,满足IT/信息安全标准(58%)仍然是在将数据科学或AI模型迁移到生产环境时最常被提及的障碍。安全和IT标准尤其让数据工程师担忧,88%的人表示这是一个挑战。

确保数据连接(53%)是部署模型到生产环境的公司最常提及的第二个障碍,其次是组织技能差距(50%)。自2022年以来,技能差距有所恶化,当时只有34%的人将其列为障碍。

令人欣慰的是,较少的受访者表示他们受到必须将模型从Python或R重新编码为另一种语言的限制:这在障碍清单中排名第7,低于2022年的第2位。有趣的是,这种下降只发生在那些主要不从事数据科学、AI或ML工作职能的专业人士中。因此,我们认为改进的工具,包括更多低代码/无代码选项,可能使这一挑战对于那些并非每天都专注于数据科学的人来说不那么常见。

关于技术使用的其他发现

  • 由于Anaconda提供托管的Python产品,因此67%的受访专业人士定期使用Python(总是或经常使用)并不令人惊讶。对于主要从事数据科学、ML或AI工作职能的人来说,这一数字上升到82%。
  • 数据清洗、可视化和分析(66%)是受访专业人士使用AI最常见的方式。专业人士使用AI的下一个最可能的用途是自动化任务(52%)、预测或检测模型(49%)和LLM(即聊天机器人;44%)。
  • 数据工程师在使用AI构建新工具和构建内部使用的AI模型方面处于领先地位。总体而言,59%的专业人士表示他们的公司正在使用AI构建新工具,数据工程师(69%)更有可能报告这一点。此外,56%的专业人士表示他们的公司正在构建用于内部使用的AI模型,数据工程师(65%)更有可能报告这一点。

关于此研究

Anaconda在2024年6月至2024年9月进行的在线调查中收到了3096份回复,其中36%的参与者位于亚洲,29%位于北美,15%位于欧洲。Anaconda向The New Stack提供了2022年和2024年研究的原始数据文件。

本文部分发现与Anaconda发布的报告有所不同。这是因为Anaconda根据当前职位角色问题对数据进行了分割,而我们根据当前职位职能对数据进行了分割。我们的方法能够与2022年的研究进行准确的时间序列比较。另请注意,由于特定问题的样本量较小,我们对Anaconda发布的关于工作保障和招聘AI职位类型的研究结果缺乏信心。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注