美国将对H20出口管制和英伟达的“B20+GB20”替代方案

美国将对H20出口管制和英伟达的“B20+GB20”替代方案
2024年07月26日 07:05 市场资讯

最近关于芯片出口管制比较重要的两个消息:一个是坏消息,美国投行Jefferies的报告说BIS计划把英伟达特供中国的H20纳入出口管制。好消息是英伟达已经未雨绸缪,打算推出一个芯片+服务器的替代方案B20+GB20。

关于H20,我在聊聊英伟达再次推出的专供中国版GPU芯片中有详细介绍。这种芯片虽然是“阉割版”,但还是能提供每秒可执行296万亿次8位整数操作(INT8 TOPS)或者浮点操作(FP8 TFLOPS),拥有96GB的第三代高带宽内存,内存带宽可以达到每秒4.0TB,这些特点让H20在入门级GPU芯片中表现非常突出。尽管纸面性能不如一些高端型号的GPU,但实际应用中,由于内存性能的优势,它在许多情况下比华为的Ascend920系列要胜出一筹。据说国内公司已经订购了近50多万块H20,总价值高达58亿美元,将在今年年内交付。

从2022年10月起,BIS每年10月更新对华半导体出口管制规则似乎已形成惯例,英伟达推出的A100、H100的阉割版A800、H800在2023年10月那次规则更新后被管制。如无意外,H20大概率会被今年10月的规则更新禁掉。商务部有多种方法可以实现,比如对H20芯片本身进行管制,或者针对计算能力、内存容量划更低的禁止线,让H20落入管制的范围。

英伟达可能已经了解到H20未来会被禁,正在提前设计替代方案。根据美国科技媒体的说法,英伟达明年会推出一款专供中国市场的GPU芯片B20。这种芯片是英伟达三月份发布的Blackwell系列芯片的减配版,计算速度比Blackwell慢。但为了弥补算力的缺陷,英伟达打算给这个芯片搭配一个服务器GB20,希望通过在其中同时安装大量B20芯片,以数量优势对冲计算速度缺陷。

消息人士透露,预计英伟达会在今年晚些时候开始量产B20,计划在2025年第二季度开始出货,由英伟达在中国的主要合作伙伴浪潮进行分销。

现在还不清楚B20的性能参数,但很多分析认为它会是一款入门级产品,和Blackwell系列的旗舰GPU B200不是一个等级。

美国对出口到中国的 GPU 实施严格的性能规定,使用一种称为 "总处理能力" (Total Processing Power, TPP) 的指标,TFLOPS(每秒执行的万亿次浮点运算,即计算能力)乘以精度位数(计算中使用的数据位数,例如 8 位FP8、16 位FP16或 32 位FP32,精度越高,每个数据点使用的位数越多,计算的准确性也越高),就能算出TPP。

我们知道目前BIS对数据中心GPU出口管制红线是两个指标:计算能力4800TPP,"性能密度" (Performance Density,即TPP分数除以芯片尺寸即可得到的数字)6.0,任何一个超了都会被管制。

H100和H200的TPP都是16000,远超红线,所以被管制。Blackwell系列芯片的计算能力更高,其在一块芯片上集成两个独立的计算核心的双晶体设计,可以输出约4500TFLOPS 的FP8计算能力,也就是说TPP高达36000,是红线(4800)的7.5倍。即使是比B200稍微差一些的B100也能提供3.5PFLOPS的密集FP8计算能力(28000TPP)。Blackwell系列的PD也明显超标,因此,英伟达需要大幅削弱B20的性能,要不就是使用面积更大的芯片,才能合规。

为了好懂,我以一个类比的方式解释英伟达计划推出的B20+GB20解决方案的原理。你可以把英伟达想象成一个厨师学校,刚培训了一个新的厨师团队(Blackwell系列芯片),都是做饭又快又好的大厨。中国的五星级餐厅想让这些厨师来做大型宴会的餐饮,但是,美国不让这些厨师进到中国服务。英伟达想了个办法,派了一组次一点的厨师(B20)来,同时还搭配了大厨房(服务器GB20)。这些次一点的厨师在大厨房里配合着工作,通过数量优势发现还是能完成任务。

据了解,英伟达还计划在GB20机架设计中整合NVLink技术,提高B20芯片之间的数据传输速度,同时加入新的冷却解决方案,降低计算的功耗。

还是用厨师打比方去解释这个设计:为了确保大型宴会后厨做菜和上菜的速度,你把厨房的储物柜和冰箱升级成了更大容量的,这样就可以一次性存放更多食材,不用频繁补充(增加内存容量以便一次处理更多数据)。你还在厨房里安装了高速传送带,能把食材从储物柜和冰箱快速传送到厨房各个烹饪区(加快内存和芯片间的数据传输速度);在各个烹饪区之间还安装了对讲机系统,让厨师们可以快速沟通协作(GB20机架整合NVLink,使多块不同芯片间能快速通信)。最后,你还很贴心地给厨房安装了强大的通风和冷却系统,确保厨房不会因为高强度工作而太热(确保芯片在高负载下运行的冷却解决方案)。

这样一来,就能形成多个B20组成的高效计算集群,训练AI模型时可以把训练数据分割成好多部分,让多块B20并行处理这些不同部分的数据,大大缩短训练时间,且不会导致芯片因为功耗过高而很快发烫。这样一番操作,单独每块芯片和每个GB20服务器都不违反出口管制,但B20在GB20服务器里整合起来用于大模型训练的表现也不错。

英伟达这招既能确保B20比华为Ascend 920系列芯片表现更好,同时也能满足美国出口管制的要求。这本质上还是一场“猫鼠游戏”,只能说英伟达太想要继续在中国市场赚钱了,对雷蒙多的威胁不屑一顾(毕竟明年民主党还在不在台上难说地很)。

过去一段时间,美国国内对芯片出口管制效果的质疑和反思越来越多,出现了一些比较客观冷静的分析。比如CSIS最近的一个报告,基于纽约联邦储备银行4月份的数据,指出芯片出口管制导致美国公司收入下降、市值减少、全球竞争力变弱,用在创新和研发上的投入变少。许多美国公司因为出口管制失去了中国的大客户,但却没能找到新客户来替代和弥补。即使是不受出口管制影响的中美公司之间的商业合作也受到了影响,因为中国公司担心未来可能会受到限制,不愿再深化和美国公司的合作。出口管制还影响了美国公司和第三国公司的合作,因为第三国公司很多和中国有生意,更倾向于选择稳定的供应来源,而不是依赖于供应经常受出口管制影响的美国公司。

昨天“外交事务”也发表了一篇文章,持有类似的观点。这篇文章认为:当前美国的战略是有缺陷的,过分关注拖慢中国的发展,却导致美国公司因被迫退出中国市场而收入下降,连带影响了研发投入。出口管制还无意中加速了中国国内半导体行业的发展,创造出了对中国本土设备、制造能力和AI芯片的新需求。美国应该更多地专注于自己的技术进步和创新能力,加大对下一代计算技术,如光子计算、神经形态计算和量子计算等领域的投资,这才是领先中国的取胜之道。

但民主党政府酝酿了大半年的一系列对华科技限制措施,已是箭在弦上,不在大选前发出来是不可能的。10月份左右临近选举日的那段时间,估计会有一波措施密集出来,如商务部半导体出口管制规则更新、云服务限制,财政部反向CFIUS,司法部数据跨境新规等等。而可能的特朗普第二任期是会延续这些限制措施,还是有自己的想法,目前还不太能看出端倪。

海量资讯、精准解读,尽在新浪财经APP
英伟达 芯片 出口管制 gpu 美国

VIP课程推荐

加载中...

APP专享直播

1/10

热门推荐

收起
新浪财经公众号
新浪财经公众号

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)

股市直播

  • 图文直播间
  • 视频直播间

7X24小时

  • 08-05 巍华新材 603310 --
  • 08-05 珂玛科技 301611 --
  • 07-26 龙图光罩 688721 18.5
  • 07-23 博实结 301608 44.5
  • 07-22 力聚热能 603391 40
  • 新浪首页 语音播报 相关新闻 返回顶部