亚马逊 AWS Trainium2 实例全面可用,公布下代 3nm AI 训练芯片

亚马逊 AWS Trainium2 实例全面可用,公布下代 3nm AI 训练芯片
2024年12月04日 15:16 网易新闻

IT之家 12 月 4 日消息,亚马逊 AWS 今日宣布,基于其内部团队所开发 AI 训练芯片 Trainium2 的 Trn2 实例广泛可用,并推出了 Trn2 UltraServer 大型 AI 训练系统,同时还发布了下代更先进的 3nm 制程 Trainium3 芯片。

▲Trainium2 芯片▲Trainium2 芯片

单个 Trn2 实例包含 16 颗 Trainium2 芯片,各芯片间采用超高速高带宽低延迟NeuronLink 互联,可提供 20.8petaflops 的峰值算力,适合数 B 参数大小模型的训练和部署。

亚马逊宣称 Trn2 实例与当前一代基于 GPU 的 EC2 P5e 和 P5en 实例相比性价比提高了 30-40%

▲Trn2 实例服务器机架▲Trn2 实例服务器机架

而更大规模的 Trn2 UltraServer 则用 NeuronLink 聚合了 4 台 Trn2 服务器,总共包含 64 颗 Trainium2 芯片,算力峰值进一步线性扩展到 83.2petaflops,能满足目前世界上最大规模模型的训练和部署需求

▲Trn2 UltraServer▲Trn2 UltraServer

亚马逊还正与其投资的 AI 模型企业 Anthropic 合作,共同构建一个名为 Project Rainier 的 EC2UltraCluster 巨型计算集群,该集群包含大量 Trn2 UltraServer,总共拥有数十万颗Trainium2 芯片

IT之家获悉,该集群完成后有望成为迄今为止公开的最大 AI 计算集群,整体算力达 Anthropic 目前用于训练最先进 Claude 模型所需量的 5 倍以上。

亚马逊 AWS 还公布了下代 Trainium3 AI 训练芯片,这也是 AWS 首款采用 3nm 制程的芯片产品。亚马逊表示基于 Trainium3 的 UltraServer 性能可达 Trn2 UltraServer 的 4 倍,而首批基于 Trainium3 的实例预计将于 2025 年底推出。

海量资讯、精准解读,尽在新浪财经APP
芯片 亚马逊 AI 集群

VIP课程推荐

加载中...

APP专享直播

1/10

热门推荐

收起
新浪财经公众号
新浪财经公众号

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)

股市直播

  • 图文直播间
  • 视频直播间

7X24小时

  • 12-06 蓝宇股份 301585 --
  • 12-02 先锋精科 688605 11.29
  • 11-29 博苑股份 301617 27.76
  • 11-26 科隆新材 920098 14
  • 11-25 佳驰科技 688708 27.08
  • 新浪首页 语音播报 相关新闻 返回顶部