这是用户在 2025-1-5 12:00 为 https://app.immersivetranslate.com/pdf-pro/uploading/ 保存的双语快照页面,由 沉浸式翻译 提供双语支持。了解如何保存?


数据科学和机器学习平台魔力象限


2024 年 6 月 17 日 - ID G00799982 - 阅读时间 39 分钟

作者:Afraz Jaffri、Aura Popa 和其他 5 人

数据科学和机器学习平台允许通过构建、定制和部署机器学习和生成式人工智能模型,基于数据科学技术做出洞察驱动的决策。这项研究可帮助数据和分析领导者做出选择 DSML 平台供应商的关键决策。


战略规划假设


到 2027 年, 50 % 50 % 50%50 \% 的数据分析师将被重新培训为数据科学家,而数据科学家将转向人工智能工程师。


市场定义/描述


Gartner 将数据科学和机器学习平台定义为一套集成的基于代码的库和低代码工具,支持数据科学家及其业务和 IT 同行在数据科学生命周期的各个阶段的独立使用和协作循环。这些阶段包括业务理解、数据访问和准备、实验和模型创建以及见解分享。它们还支持机器学习工程工作流程,包括创建数据、功能、部署和测试管道。这些平台通过桌面客户端或浏览器提供支持计算实例和/或作为完全托管的云产品。

数据科学和机器学习 (DSML) 平台旨在允许广泛的用户开发和应用一套全面的预测性和规范性分析技术。这些平台利用分布式来源的数据、尖端的用户体验以及本机机器学习和生成式人工智能 (GenAl) 功能,有助于增强和自动化整个企业的决策制定。他们提供了一系列专有和开源工具,使数据科学家和领域专家能够找到可用于预测财务指标、了解客户行为、预测供应和需求以及许多其他用例的数据模式。模型可以基于所有类型的数据构建,包括表格、图像、视频和文本,用于需要计算机视觉或自然语言处理的应用程序。

支持的机器学习技术范围从经典的回归或决策树到更复杂的深度学习和强化学习以及 GenAI。使用这些技术构建的模型可用于业务流程中的任务,例如信用评分、客户流失预测、预测维护、推荐和图像分类。

使用 DSML 平台的组织可以显着减少创建预测和规范模型、生成见解和分发结果的周期时间和进入壁垒。它们支持跨多个团队和部门的资产协作和重用,以及工作负载的编排以处理大量数据。它们还提供一致且可重复的培训和开发环境,提供数据、代码和模型资产之间的沿袭,从而提高数据科学家的生产力。此外,低代码和自然语言界面使领域专家和业务用户能够通过简单的工作流程创建预测模型。 DSML 平台支持 MLOps 实践,例如在生产中针对批量和实时工作负载部署模型,并提供对模型指标和合规性的持续监控。

  必备能力


该市场必备的能力包括:

-


从本地和云中的数据库、数据仓库和文件存储导入数据


使用核心数据科学和机器学习技术、方法、算法和流程库构建和评估模型


在平台中部署、托管和提供模型,以便在服务和应用程序中使用

  标准能力


该市场的标准功能包括:


能够从结构化和非结构化数据源(包括文本、图像、视频、音频和地理空间)构建模型 \bullet


用于模型开发的低代码接口,适合非专家数据科学角色,包括业务用户和领域专家


基于笔记本的代码接口,供数据科学家执行数据访问、准备、模型开发和发布任务


部署后模型生命周期管理,基于检测和分析数据、功能和模型漂移来重新训练、退役或调整模型


\bullet 支持基于 MLOps 的流程和工具,使 ML 模型能够在不同的操作环境中大规模部署

  可选功能


该市场的可选功能包括:


平台生成的建议,提供准备、集成和建模数据的最佳方法,以及基于手动选择的目标预测自动创建机器学习模型


先进的接口有助于为模拟、优化和基于深度学习的用例进行更复杂的建模


\bullet 自定义 SDK 为基于代码的模型开发以及与服务和应用程序的集成提供更多控制和灵活性


通过跟踪、选择和监控提示、模型和输出来处理 GenAl 模型(例如大型语言模型)的功能


提高模型透明度和可解释性的技术和工具,以了解模型输出的生成方式和原因

  魔力象限


图 1:数据科学和机器学习平台的魔力象限

资料来源:Gartner(2024 年 6 月)

供应商优势和注意事项

  阿里云

阿里云是这个魔力象限的挑战者。阿里云人工智能平台(PAI)提供高性能计算资源和基础设施,数据科学团队可以使用它们来构建、部署、利用和管理机器学习(ML)和生成人工智能(GenAI)模型。业务主要集中在中国、东南亚、中东和澳大利亚,客户多为跨国经营的各种规模企业。