想快速从AI获益的组织,或许可通过托管服务,直接在应用中接入AI。
译自 How to Easily Add AI to Your Applications,作者 Jason Monden 是 Oracle Cloud Infrastructure 的产品管理总监。20 多年来,Jason 一直在领导和建议财富 500 强公司和创业公司。他一直关注企业技术、云采用、应用程序现代化,最近关注......
AI 很强大,但其内在的复杂性可能会让潜在的企业用户望而却步。 对于许多希望快速从 AI 中获得价值的组织来说,允许他们将 AI 与应用程序集成的托管服务可能是答案。
好消息是这样的托管 AI 服务,它们会向用户隐藏复杂性,是可以获得的。在走这条路之前需要考虑两件关键的事情:
- 1:公司想要建立什么功能(或想要自动化什么流程)? 以及
- 2:基于使用案例、位置和监管要求,此需求如何运行?
使用 AI,整个流程始于数据。 初始目标是定义所需的数据类型、其来源以及所需的 AI 服务。
例如,对于想要自动化流程以减少人为错误、降低成本并提高生产产品效率的制造商,需要 AI 来使用图像。 可以使用固定摄像头或无人机捕获图像,这取决于要拍摄成品的状态和位置。 这些应用程序需要计算机视觉 AI。
托管 AI 服务的一个优点是它们会负责训练和推理。 用户只需微调训练数据并调用 API 来处理服务和模型上的推理。
这种方法对开发者很友好,允许组织进行试验和快速实现。除了自动处理训练和推理所需的基础设施和软件之外,这些服务还根据需要扩展那些无形的组件,用户在 API 层面进行交互。它们的成本效益也非常高,通常仅按 API 调用次数收费。
根据组织是否关注训练还是推理,数据类型和数据捕获方法会有所不同。当 AI 即将投入生产时,推理是需要的数据捕获设置。这可以看作是一个预设的自动无人机航线。如果模型需要自定义训练,则数据需要代表可能情景的不同方面。对于图像,考虑光照、角度、阴影以及过程中可能遇到的许多阶段都是必不可少的。这些阶段可能是不同长度的钢管和钢梁。
有用的数据通常散落在企业的不同系统中。偶尔也需要来自特定外部存储库或公共来源的外部数据。
导入不同形式的数据需要清理和重组,以与项目计划一致。一旦制定出这些方法,用户就可以创建一个管道,将从数据导入到数据清理到数据标注的整个过程自动化。一个标记好的数据集是AI定制过程的起点。
以下是一个计算机视觉的示例,用户可以导入许多显示不同角度、光照、形状、长度、数量和其他标准的管道图像。源图像看起来类似这样:
一旦收集了源图像,公司将创建一个可用于自定义训练的数据集。在此过程中,必须针对对象检测训练AI,并发现对象在图像中的位置。这是通过使用所谓的边界框使用元数据标记源图像来完成的。这些提供了图像中对象的确切坐标,向模型解释要查找的内容,同时考虑到先前提到的各种标准和场景。 一个标记的图像如下所示:
一个完全标注的数据集通常会保存在对象存储中,以供计算机视觉AI服务在运行模型定制时引用。模型定制微调通常在24小时或更短的时间内完成。
在测试模型时,用户必须注意“置信度因子”。模型会以百分比的形式说明它对识别对象的置信度。可以通过这些报告的置信百分比来衡量模型的准确性。通常,90%或更高会导致非常一致和准确的结果。用户应该确定哪些因素最适合给定的场景,并将此逻辑构建到应用程序中,因为当应用程序调用托管AI服务时,置信因子将包含在API响应中。
API 响应还将包括有关发现的其他详细信息。在计算机视觉的情况下,它将提供在图像上找到对象的确切坐标。这使企业能够更多地利用结果。他们可能希望在图像上绘制边界框,以显示 AI 在哪里找到了对象或找到了多少个对象。
最后,企业必须考虑在哪里以及如何部署 AI。他们需要考虑生产时的数据源,以及 AI 需要多快响应才能满足内部和客户的需求。如果 AI 位于公共云中,数据传输到公共云、通过 AI 服务运行、生成响应以及应用程序采取行动都需要时间。
如果使用无人机或摄像头,应多久更新一次图像?预期的响应时间是多少?对于每分钟发送的图像,30 至 60 秒的响应时间是公共云的合理预期。 如果需要更低的延迟、更高的数量或更接近实时的响应,则应该将 AI 服务部署得更接近数据源。
其他考虑因素包括法规、主权、安全性和其他限制。在这种情况下,所有数据和 AI 服务必须在满足这些要求的云区域内运行,或者在不损害功能的服务中运行,以适应不同的地理部署模型。
有许多有用的 AI 服务可用。本文提到了 OCI Vision,但其他服务包括 OCI 对象存储、OCI 数据标注和 OCI 现代数据平台。
尽管所有主流编程语言都广泛支持 AI,但 Python 有许多优秀的库可以帮助简化打包使用这些类型 AI 服务的应用程序。您可以在 Oracle 找到许多实验室,这些实验室使 AI 服务易于学习和使用。