配备超16000个GH200超级芯片，亚马逊云科技与英伟达共推云AI超级计算机|亚马逊_新浪财经

安装新浪财经客户端第一时间接收最全面的市场资讯→【下载地址】

　　美国当地时间11月28日，亚马逊云科技（AWS）在拉斯维加斯的re：Invent大会上发布了两款自研芯片Graviton4和Trainium2，并推出企业级AI聊天机器人“Amazon Q”（下称“Q”）抢占AI硬件市场。

　　生成式AI热潮下，尽管云计算厂商对自研AI芯片热情高涨，但英伟达GPU目前仍是企业进行AI训练及推理的算力首选。

　　当天，英伟达创始人兼CEO黄仁勋也穿着标志性的皮衣现身大会现场，与亚马逊云科技CEO Adam Selipsky一起宣布扩大战略合作。双方将联合推出先进的基础设施、软件及服务，包括亚马逊云科技将支持英伟达最新推出的H200 GPU，托管英伟达的人工智能训练即服务（AI-training-as-a-service）平台DGX Cloud。此外，双方正设计世界上最快GPU驱动的云AI超级计算机，配置16384颗NVIDIA GH200超级芯片，以及构建更多基于英伟达芯片的云实例等，提高生成式AI、HPC高性能计算性能。

　　作为此次大会的重头戏，Graviton4和Trainium2分别瞄准数据中心通用计算和人工智能训练场景。亚马逊云科技称，基于Arm架构的服务器芯片Graviton4与前一代Graviton3处理器相比，性能提升30%，独立核心增加50%以上，内存带宽提升至少75%。

　　而Trainium2则是面向AI大模型的高性能训练芯片，与第一代Trainium芯片相比，Trainium2训练速度提升至4倍，能够部署在多达10万个芯片的计算集群中，大幅降低了模型训练时间，同时能效提升多达2倍。

　　据界面新闻了解，目前最先进的大模型通常包含数千亿甚至数万亿个参数或变量，这为芯片的计算能力带来了诸多挑战，既要保证高性能、安全可靠，也要低成本。Tranium2主要强调的也是低成本、高能效和更快的训练能力。

　　Tranium2已有了早期客户，数据分析平台公司Databricks以及由亚马逊支持的OpenAI竞争对手Anthropic都计划使用Trainium2芯片训练大模型。

　　除自研定制芯片外，亚马逊云科技还推出首个基于生成式AI开发的应用——办公助手“Q”，可通过聊天方式实现辅助云端开发、服务响应、企业数据查询等功能。

　　Q并非面向消费市场，而是围绕企业需求设计，其定位类似于一个专家助理。但Adam Selipsky特别强调，Q不会使用企业客户数据来训练其底层模型，Q的生成结果也不会跨越不同数据权限间的防火墙。Q可以设置为仅对安全团队的相关安全问题进行响应，非公司内部或与业务无关者，无法获得安全问题答案。

　　事实上，在提及亚马逊云科技此前推出的Bedrock AI基础模型服务时，Adam Selipsky也重点强调了安全与隐私问题。他还“不点名”地提到了最大竞争对手微软。

　　“你不会希望看到云供应商受制于一家模型提供商，而是需要一个真正的选择……过去10天发生的事件已经非常清楚地表明了这一点。” Adam Selipsky说。他口中的“事件”指的是OpenAI刚刚经历的一场戏剧性的人事动荡。

　　re：Invent至今已举办了12年，云市场的竞争环境也增加了很多变量——尽管亚马逊云科技在公有云领域保持着领先优势，但竞争对手微软Azure凭借与OpenAI的深度合作关系，正不断扩大市场份额。

　　据市场调查机构Canalys公布的最新报告，亚马逊云科技今年第二季度占全球云基础设施服务（IaaS）支出为30%，同比增长12%。与去年同期相比，亚马逊云科技收入增长已减少一半以上，这也促使该公司加大对人工智能领域投资，以寻找更多增长动力。同期，微软Azure同比增长了26%，占据26%市场份额，增长率高于亚马逊云服务。而AI热潮很可能将进一步促进市场加大对微软云计算业务的支出，因为Azure承载着OpenAI和Meta等公司的AI计算需求。

股市回暖，抄底炒股先开户！智能定投、条件单、个股雷达……送给你>>