【文/ 南极土著】
1月13日,美国历史上第一个(也是人类历史上第一个)人工智能出口管制规则终于揭开了面纱。168页的新规以“临时最终规则”形式发布,1月13日当天起生效,1月15日会刊登在《联邦公报》。公众在《联邦公报》刊登后120天内可以提交反馈意见。
我把该规则的结构总结为:管AI硬件(GPU等)+管模型权重。
一、管AI硬件
自2022年1017规则以来,所有对AI芯片的出口管制,本质上也可以理解为对AI的管制在硬件领域的体现。两年过去了,大家看得很清楚:美国半导体出口管制打的是中国AI,战略目标是绝不能让中国先于美国实现通用人工智能。
要管制的GPU的性能标准,本次规则里没有任何变化,和2023年1017规则保持一致,重点还是总处理性能、性能密度达到一定阈值的数据中心芯片,也是大模型训练最为倚重的硬件,具体而言:
主要的不同是创新了管GPU的方法,一定程度上颠覆了美国出口管制的传统逻辑,面向推出了一套面向全球的出口许可体系,把不同国家区分为三个等级的纺锤状结构:
(一)纺锤最上部,是美国最亲密的17个盟友(加上美国,可以用体制内经常用的“美西方”指代)。这些国家被新规称为“人工智能授权国家”,管制政策和以前基本没有变化。
对“美西方”境内的公司出口(包括转口和国内转移),只需要提交一个声明,承诺不会把到手的GPU:1)违反美国出口管制,转卖给美西方以外的公司;2)转卖给美西方以外国家或地区设在美西方的子公司;3)以远程云服务形式向美西方以外的区域提供算力,用于训练大模型。
(二)纺锤最下面,是美国视为“外国敌手”的中国,以及其他美国武器禁运的国家和地区。对这些国家,管制政策也没有变化,还是最严格的推定拒绝。
(三)纺锤中间的大肚子,是上述两类之外的100多个国家,包括新加坡、马来西亚、阿联酋、沙特等。它们也是这次新规里AI硬件限制的重点,我简称为“中间国家”。
对“中间国家”的受控GPU供应,新规用“总处理性能”(TPP)划了两条线(关于何为TPP,我在去年4月“对美国更新半导体出口管制的分析及对未来的几个判断”一文中作了通俗易懂的解释):
一条线是向单个“中间国家”的公司出口26,900,000TPP(大约1700块GPU),在该范围内的GPU出口适用“低处理性能”许可例外(完全不管)。美国觉得,绝大多数芯片交易属于这种“少量GPU采购订单”,这种量级的芯片采购远低于训练最先进AI模型需要的数量,一般很多是那些大学、医疗机构和研究机构出于研究需要下的订单,这类的没必要管。
另一条线是GPU国家配额,设定为2025年至2027年向“中间国家”累计出口 790,000,000TPP(每个国家约5万块GPU):从2025年一季度起算一直到2027年四季度,加起来就只能买这么多。2025年以前卖出去的、因为GPU丢失、损坏、故障、搬迁和转售等损耗的TPP,不算在里面。如果进口GPU是为了研发、生产或存储,且不会转运给中国等禁运国家,原则上也不占用配额。
数据中心 维基百科
美国政府认为,两年累计5万块的配额,能确保这些“中间国家”的公司开发出一些模型,获得经济收益,但用这点算力训出来的模型始终会离美国的先进大模型差着一个级别。同时,这样还能确保美国公司和技术“给这些国家的政府、医疗保健行业和当地企业提供服务”(说得像是灯塔国的恩赐,实际意思是还能继续赚这些国家的钱)。
如果超出5万块的配额,再往这些国家出口就是“推定拒绝”(默认不能卖)。BIS会和国务院、能源部、国防部一道每年审查后续几年的配额情况,决定要不要提升或者降低配额。
这些国家可以跟美国签署一个政府间协议,给美国提供“国家安全保证”,承诺进口这些GPU一定会确保美国的国家安全利益。这种情况下,GPU配额能翻一倍(10万块)。BIS会在新规里明确列出这些国家。
这种一看就是美国国务院出的主意,还是拜登政府的对华“多边围堵”路数。川普第一任期也搞过,美国2018年出了个“云法案”,授权美国政府从美国世界各地的云服务商调取存储在他国的数据。这显然损害他国数据主权,美国怕其他国家不高兴,在“云法案”里塞了条规定,说如果你跟我签个协议,你也可以调存在美国的数据。
这是分化“中间国家”的策略,和美国签的协议属于有国际法效力的条约,能想象到里面几乎一定会有这些要求国家跟随美国出口管制、反向投资审查、支持美国的“民主AI”国际标准等。这借鉴了美国一些智库提的建议,用“我手里有GPU”逼其他国家追随美国限制中国、支持美国主导AI国际规则和标准制定权。
对“美西方”在海外的公司和“中间国家”的公司,新规设置了两类“数据中心经验证最终用户”,允许它们申请相关的认证,拿到认证就能买更多的GPU。
2024年10月,BIS出了“数据中心经验证最终用户”(DC VEU)授权(具体背景可参见“人工智能扩散出口管制框架”:美国打算怎么“全球限制”AI芯片?)。新规进一步将其分为“通用经验证最终用户”授权(UVEU)、“国家经验证最终用户”(NVEU)授权。
UVEU:只有美西方本土公司(总部在美西方境内)、美西方本土公司在“中间国家”的子公司能申请。数据中心里实际拥有受控GPU的主体负责提交申请,如果它不能提供全部的申请信息(比如GPU等基础设施是A所有,但物理安全或逻辑安全由B公司负责),则A必须跟BIS报告所有参与数据中心运营的其他实体的身份。A可能需要拿到这些其他实体的书面保证。如果数据中心所有权是A的,但运营是B负责(比如Equinix和AWS的合作模式),A和B都得拿到UVEU授权。
如果要拿到UVEU,这些公司部署的算力必须主要集中在“美西方”,在“美西方”以外部署的算力不能超过全球部署总算力的 25%。;在“中间国家”国家可以部署算力,但单个国家不能超过全球总量的7%。如果是美国公司,在美国部署的算力至少要达到50%。
NVEU:“中间国家”的公司可以申请,拿到了就不再受该国GPU配额(5万块)的限制,但仍然有上限。美国政府规定,每家拿到NVEU的公司2025至2027年累计最多可获得5,064,000,000TPP(约32万块GPU)。BIS分析了训练最先进AI模型所需的计算集群规模,以及这些集群未来三年内可能的增长速度,最后确定了这个TPP上限。这些配额可确保上述公司能训出来的模型落后美国最先进模型训练所需计算集群规模约 12 个月或一代。美国认为,这能确保最先进AI模型和最大计算集群不受控制地扩散所带来的风险。
根据这个新规,要想拿到UVEU和NVEU,相关公司基本上要跟中国在半导体、AI和军民融合方面划清界限,而且要有好的“人权记录”。具体来说:
此外,还需要遵守一系列的监控、记录、报告义务,以及所有权、基准、软件与网络、供应链、人员方面的具体要求。
二、管模型权重
管制模型权重,BIS的具体做法是在《商业管制清单》(CCL)里给“先进AI模型”的“参数”(parameters)新增了一个ECCN编码 4E091,管制理由为“地区稳定”。“参数”指的是在模型训练期间学习的任何值(例如,网络权重、偏差等)。
怎么定义AI模型的“先进”?我在“人工智能扩散出口管制框架”:美国打算怎么“全球限制”AI芯片?一文中曾预测:“可能以模型训练所需的浮点运算量(FLOPs)划线,确定一个阈值”来管制模型权重。从新规来看,美国政府的确采取了这种路径。BIS在新规里说:“听取了美国政府各部门技术专家的意见,我们确定衡量AI模型性能的一个合理指标是计算量(即用于训练模型的计算操作次数),这一结论得到了顶尖AI研究人员的经验证据的支持。”
BIS认为,少于10的26方以下计算操作训练出额的模型权重已经存储在全球各地了,很容易能被外国获得,所以也就没必要管制了。所以它们设定的最终阈值是用超过10的26次方次计算“操作”训练出来的闭源模型。“操作”包括任何后续训练过程,例如对预训练模型的微调,但不包括输入训练数据的收集和整理。
对这些模型权重的出口,许可政策是推定拒绝(默认不批),基于两个原因:1)一个强大的模型就算只被出口了一次,也可能被恐怖分子拿到。2)模型权重其实就是一堆数据,可以存储、复制和传输,只要出口一次就很难阻止其全球传播。所以,对这种东西,要用最严格的管制力度。关于模型权重的出口许可政策,对“美西方”家,新规设置了许可例外(豁免许可);对中国等不友好国家,一律禁运;对“中间国家”的公司,获得了NVEU认证后可以适用许可例外。
除了管美国国内的模型权重,BIS还首次对美国境外的模型权重创造了外国直接产品规则。美国认为,先进的闭源AI模型训练高度依赖美国原产的受控GPU及含有该类GPU的服务器等部件,没有这些硬件就无法生成模型权重,所以可以适用外国直接产品规则管制美国以外的模型权重。
具体而言,只要使用了受控GPU、服务器和其他电子设备训练的闭源模型,且计算操作达到或超过10的26次方计算操作,即便相关模型在美国以外训练,其出口也要受美国的管制。即使模型训练没有使用上述受控硬件,但如果是在受控模型权重基础上通过微调、量化等“后训练”(Post-Training)技术生成的模型权重,也受到管制。
需要大量数据才能完成模型训练 网络
在模型权重部分,新规还增加了一条红旗警示(Red Flag 28):美国本土运营的IaaS提供商,如果给外国公司在美国的子公司客户训练10的26次方以上大模型,模型训练和之后交付模型权重的行为可能导致模型权重被转移给客户的外国母公司,从而违反出口管制。这种情况下,IaaS提供商可能被视为“协助或教唆”违反出口管制。
BIS建议,这些美国IaaS服务商在把生成的模型权重交付给该客户时,要先问清楚模型权重是不是会出口;如果需要申请许可才能交付的,得先拿到许可;或者告诉客户需要去申请许可才能交付给它。
总的来说,这个新规和之前了解到的信息比较一致,但还是有三个surprise:
一是竟然对模型权重也施加了外国直接产品规则,这对中国公司在海外训练的大模型带来了直接的合规风险,在海外使用美国GPU不再是一个理想的选择,从美国的云服务商和AI公司来说,这也让他们很难受,不仅合规负担上升,还要担心吓跑客户。
二是对美国云服务商尽调义务的要求竟然如此严格,这已经超出了此前只是要求美国云“了解你的客户”(KYC)的力度,终于能理解为什么Oracle的高级副总裁前两天火气那么大地发文抨击了。
三是对“中间国家”的出口配额,原来听说要取消,但还是留下来了,只是通过鼓励这些国家的企业去申请NVEU、鼓励这些国家的政府和美国签国家安全保障协议,局部做了软化。这充分说明美国对AI能力被中国获得的关切已经严重到了不顾他国外交反弹的程度。对中国云的海外扩张来说,这或许是个机会。在“芯片战争”日益转向“云战争”的当下,任何这种机会都要抓住。
APP专享直播
热门推荐
尹锡悦将在单人牢房过大年 能看4个电视频道 顿顿都有泡菜吃 收起尹锡悦将在单人牢房过大年 能看4个电视频道 顿顿都有泡菜吃
- 2025年01月27日
- 01:26
- APP专享
- 记经典时刻
- 6,268
阿斯麦、英伟达等科技股大跌 DeepSeek引发投资者恐慌
- 2025年01月27日
- 09:35
- APP专享
- 记经典时刻
- 5,043
无忧前员工称张大大工作室常换人:大家不太能接受张大大的工作方式,随叫随到、贬低辱骂、非常情绪化
- 2025年01月26日
- 08:27
- APP专享
- 我是山河君
- 2,320
24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)
投资研报 扫码订阅
股市直播
-
宋谈股经今天 07:21:04
今日共39股涨停,连板股总数8只,22股封板未遂,封板率为64%(不含ST股、退市股)。焦点股方面,机器人(sz300024)板块的高标冀东装备(sz000856)与冀凯股份(sz002691)双双上演“地天板”行情,但其余高位股大面积退潮,兴业科技(sz002674)、好想你(sz002582)、五洲新春(sh603667)、华联股份(sz000882)等人气股均跌停。 -
宋谈股经今天 07:11:26
1月27日收评:创业板指缩量跌2.73%,DeepSeek概念股逆势爆发1、市场全天走势分化,创业板指领跌。DeepSeek概念股集体爆发,每日互动(sz300766)、卓创资讯(sz301299)、每日互动(sz300766)、竞业达(sz003005)等多股涨停。AI智能体概念继续走强,新炬网络(sh605398)、垒知集团(sz002398)、美格智能(sz002881)、泛微网络(sh603039)等封板。下跌方面,算力硬件股持续走低,铜高速连接、CPO等方向领跌,华脉科技(sh603042)、新亚电子(sh605277)、瑞斯康达(sh603803)等跌停;机器人(sz300024)概念股下挫,宝塔实业(sz000595)、五洲新春(sh603667)等跌停。个股跌多涨少,沪深京三市超3300股飘绿,今日成交1.13万亿。截止收盘沪指跌0.06%,深成指跌1.33%,创业板指跌2.73%。2、板块概念方面,DeepSeek、AI智能体、银行、煤炭等板块涨幅居前,铜高速连接、机器人(sz300024)、CPO、液冷服务器等板块跌幅居前。3、两市共1783只个股上涨,45只个股涨停,3197只个股下跌,49只个股跌停,22只股票炸板,炸板率36%。 -
巨丰投资张翠霞今天 07:10:40
4小时运行结束,总结全天市场运行,1)A股龙年收官日,三大指数集体收跌,沪指跌0.06%,深证成指跌1.33%,创业板指跌2.73%,三市成交额超1.1万亿,复制12月底走势,预期红盘跨年跟跨界,但实际走势出现较大偏差,尾盘出现小幅恐慌抛售,主要长假因素,节后预期延续结构型行情;2)量能,沪深两市今日成交额11276亿元,较上个交易日12337亿元减少1061亿元;3)行业板块方面,以加权涨幅来看56家行业35家红盘,家居用品、银行、电力等板块涨幅居前;通信设备、矿物制品、通用机械等板块跌幅居前;4)市场延续结构型行情,题材热点快速轮动。详细解盘,可关注《翠霞首席课》的“热点直击”和“操盘指南”~~~ -
数字江恩今天 07:09:31
考虑到长假影响,节后的解盘在假期最后一日再发。祝大家春节愉快!!【更多独家重磅股市观点请点击】 -
徐小明今天 07:04:26
祝大家新春快乐! -
徐小明今天 07:02:59
【盘中直播】语音课见 -
东方红陈晨今天 07:02:11
行了,都散了吧,准备去过年吧,股民最辛苦,坚守最后一个工作日,好好过年,放心,好好玩8天,8天之后,涛声依旧,大涨长红 -
量化伏妖今天 07:02:10
【股票收评】:还是坚持半仓过节节前最后一天的交易偏清淡,指数表现还算强势,技术指标粘合线日线和周线都呈现上行态势,价值陡峭日线和周线也都还向上运行中,指数依然站在市场内在价值线3234点之上,虽然下午14点后冲了一波,但是成交量非常低迷,节前犹豫,不敢押注,临阵脱逃的不少,微跌2点报收。技术指标向好,毕竟假期时间较长,不确定因素很多,谨慎对待很有必要。板块方面AI智能体,eSIM,可燃冰,低碳冶金,转基因,粮食概念等板块涨幅靠前;铜缆高速连接,F5G概念,CPO概念,人形机器人(sz300024),液冷概念,超导概念,机器人(sz300024)执行器,光通信模块等前期涨幅较好的科技股板块跌幅靠前。总体看多空各占一半力量较为客观,没有绝对的一边倒倾向,还是建议半仓过节。 -
冯矿伟今天 07:00:52
祝大家新年快乐,节后见! -
趋势领涨今天 07:00:46
尾盘还出现了一波跳水,主要都是在担心节日消息面,但只要你的个股没有退市风险,还是建议持有过节吧,2024年最难受的行情都挺过来了,2025年,你还担心什么呢?今天到此。祝大家春节愉快!来年股票天天涨停!!