云开发者正加速向Arm架构迁移：构建面向AI时代的未来基础设施|Arm|AI|开发者_新浪科技

云开发者正加速采用基于 Arm 架构的平台，凭借其无可比拟的每瓦性能和成本优势，更快落地可扩展并投产的 AI 工作负载。

人工智能 (AI) 正重塑数字格局，开发者也正面临全新挑战：基础设施不仅要具备强大算力，还需兼具可扩展性、成本效益和高能效等特征。当前，亚马逊云科技、谷歌、微软、Oracle Cloud Infrastructure (OCI) 及 NVIDIA 等超大规模云服务提供商与 AI 领军企业，均已基于 Arm 架构打造定制化解决方案，布局 AI 数据中心。

这一趋势正在蓬勃展开。2025 年头部超大规模云服务提供商的新增服务器算力中，有近半数是基于 Arm 架构。Arm Neoverse 平台正在为量产级 AI 工作流、向量搜索引擎、实时机器学习 (ML) 平台及云原生微服务提供算力支撑，同时在成本效益、吞吐量与节能方面实现可量化的显著提升。随着 AI 工作负载持续扩展，基础设施的选择愈发关键。

AI工作负载贯穿端到端，Arm赋能全流程优化

AI 的应用早已不再局限于推理或模型训练环节。从数据预处理、模型编排，到实时服务与内存管理，如今的 AI 技术栈已覆盖整个计算工作流。这也带来了延迟、成本、功耗及扩展性方面的全新系统级挑战，而这些早已超出了传统通用 CPU 的设计初衷与能力范围。

Arm 在这场变革中扮演核心角色——其价值不仅限于 CPU 层面，更贯穿整个 AI 系统架构。

在亚马逊云科技， Arm Neoverse 核心为 Graviton 通用计算平台、Nitro 数据处理单元 (DPU) 提供算力支撑，并作为 AI 加速器的头节点 (head node)，为 AI 工作流打造高度集成、能效出众的基础设施。

NVIDIA 亦采用类似架构设计：Arm 架构是 Grace 与 Vera CPU 的技术基石，二者均作为 AI 系统的头节点部署；同时 Arm 还为 BlueField DPU 提供算力支撑，助力数据迁移与卸载处理，为 AI 数据中心设计打造一体化的平台解决方案。

凭借卓越的每瓦性能、强大的内存带宽，以及在 Amazon Graviton、Google Cloud Axion、Microsoft Azure Cobalt、NVIDIA Grace 等平台上的规模化部署，基于 Arm 架构的基础设施正日益成为可扩展、高性价比 AI 工作负载的优选方案。

Arm正成为云计算的新标准

云计算领域正经历一场战略性转变：全球领先的云服务提供商均在加码基于 Arm 架构的基础设施建设，将其作为融合型 AI 数据中心规模化部署的默认路径。这并非试点探索，而是着眼于长期的架构战略。

在软件层面，Atlassian、Spotify 和优步 (Uber) 等企业，已开始借助通用工具与社区文档，将核心工作负载迁移至基于 Arm 架构的云基础设施，且无需对底层平台进行深度重构。Atlassian 表示，在将核心服务迁移至 Arm 实例后，计算成本显著降低，CI/CD 工作流运行速度也得到提升；Spotify 在后端工作负载中试用 Graviton 平台后，实现了显著的基础设施效率提升；Uber 则通过基于 Arm 架构的基础设施，在优化微服务性能的同时，降低了单实例的运营成本。

与此同时，Arm 提供的一系列工具正加速这一迁移进程。例如 Arm MCP（模型上下文协议）服务器以及集成于 GitHub Copilot 的 Arm 云迁移智能体 (Cloud Migration Agent)，正帮助开发者评估工作负载兼容性、加快云迁移进程，并实现稳定可靠的规模化部署。目前，专为各类 Arm 云平台量身打造的 Arm MCP 服务器已面向所有软件开发者开放，它可将云迁移工具与专业经验直接融入开发者常用的 AI 助手中，从而赋能自主化的智能体工作流。

通过自动化最佳实践、加速开发流程并提供实时指导，该工具显著简化了迁移路径，让开发团队从项目首日起，即可更轻松地获得成本、能效与性能优势。早期用户的反馈也验证了其在真实迁移场景中具备高度实用性。

开发者转向Arm架构的五大案例

除上述全球软件企业外，其他科技公司在日常运营中采用基于 Arm 架构的云基础设施时，也收获了类似效益。

● 借助 Graviton3，LLM 推理成本降低 35%

Vociply AI 是一家专注于大规模部署大语言模型 (LLM) 的 AI 初创企业，在切换至 Amazon Graviton3 后，其月度基础设施成本从 2000 美元降至 1300 美元，同时性能实现同步提升，具体包括：

● 性价比提升 40%

● 词元 (token) 吞吐量提升 15.6%

● 功耗降低 23%

这一成果得益于 Arm Neoverse 核心、Neon™ 指令集深度优化，以及 llama.cpp 等量化推理引擎的支持。

● 生成式 AI 工作流提速，基础设施成本降低 40%

生成式 IT 及 AI 解决方案平台 Esankethik 将其完整技术栈——涵盖预处理、训练与推理环节，全面迁移至基于 Arm 架构的 Graviton 实例，取得了显著成效，具体包括：

● 推理业务延迟降低 25%