十万块英伟达H100打造,马斯克宣布“全球最大 AI 训练集群”投用

十万块英伟达H100打造,马斯克宣布“全球最大 AI 训练集群”投用
2024年07月23日 10:21 网易新闻

IT之家 7 月 23 日消息,马斯克现宣布,孟菲斯超级计算机集群(Memphis Supercluster)于当地时间凌晨 4:20 开始进行训练,感谢 xAI 团队、X 团队、英伟达及其支持公司所做的贡献。(IT之家注:孟菲斯是田纳西州人口第二大城市)。

据马斯克介绍,该集群配备了 10 万个英伟达 H100 GPU,采用液冷散热,并使用单一的 RDMA 网络互连架构,是全世界最强大的 AI 训练集群。

从 GPU规模上来看,这一集群已经全面超越了最新 Top500 榜单上的任何一台超级计算机,包括世界上最强的 Frontier(37888 个 AMD GPU)、Aurora(60000 个 Intel GPU)和微软 Eagle(14400 个 Nvidia H100 GPU)。

马斯克还透露,其目标是“在今年 12 月前训练出世界上最强大的人工智能(Grok3)”,而孟菲斯超级计算机集群正是其实现这一目标的优势所在。

在今年 3 月敲定协议后,这一“超级计算机工厂(Gigafactory of Compute)”几乎是立即开工。上个月,经济发展组织大孟菲斯商会也证实马斯克旗下 xAI 全新“超级计算机工厂”正在筹备中。

为了达成这项协议,xAI 已经口头承诺将改善孟菲斯的公共基础设施,以支持数据中心的发展,包括兴建一个新的变电站和一个污水处理设施。

孟菲斯电力、天然气和水务公司的首席执行官估计,xAI 孟菲斯工厂每小时可能使用高达 150 兆瓦的电力,相当于 10 万户家庭所需电量,而 XAI 预计每天至少需要 100 万加仑的散热水。

孟菲斯市议会议员 Pearl Walker 上周表示:“民众很害怕。他们担心水资源可能出现问题,也担心能源供应(出现问题)。”

实际上,早在 5 月份,xAI 就表示已获得 60 亿美元(IT之家备注:当前约 437.14 亿元人民币)的资金用于 AI 开发。该公司目前为其孟菲斯超级计算站点发布了六个招聘信息,职位包括光纤工头、网络工程师和项目经理等。

海量资讯、精准解读,尽在新浪财经APP

VIP课程推荐

加载中...

APP专享直播

1/10

热门推荐

收起
新浪财经公众号
新浪财经公众号

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)

股市直播

  • 图文直播间
  • 视频直播间

7X24小时

  • 07-26 龙图光罩 688721 --
  • 07-23 博实结 301608 44.5
  • 07-22 力聚热能 603391 40
  • 07-15 绿联科技 301606 21.21
  • 07-11 科力装备 301552 30
  • 新浪首页 语音播报 相关新闻 返回顶部