AI经济学 | 第六章:产业AI化的双刃剑效应及应对分析

AI经济学 | 第六章:产业AI化的双刃剑效应及应对分析
2024年06月29日 07:38 中金点睛

  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!

在全球化放缓背景下,中国产业链面临着纵向卡脖子与横向去中心化两大挑战。应对前者需要加速追赶式创新,促进引领式创新有利于应对后者。以大语言模型为代表的新一轮AI技术进步,在生产力层面为兼顾追赶与引领式创新带来了新的机遇与挑战。以制造业为例,国际竞争视角下的产业AI化对中国而言是把双刃剑,既有利于中国制造在质上加速追赶先发国家,也有利于先发国家克服劳动成本高的供给劣势加速对中国制造量的追赶,甚或会削弱中国在锂电池等新兴制造中初步建立的领先地位,也有可能为印度等后发国家制造业加速追赶提供需求侧契机。

大国规模是产业AI化助力中国加速追赶的重要优势。伴随着大模型演进,AI规模定律越发凸显。以制造业为例,中国生产规模大意味着潜在可用数据规模也大,有能力支撑中国率先探索大模型等AI赋能场景。将潜在可用数据变为现实可用数据存在一些挑战,精密制造数据问题尤为严峻,需优化生产关系予以支撑,除借鉴先发国家的数据库建设经验外,还需要一些具有针对性的措施,例如:加强国企市场竞争约束,设置专门规则以提升其对数据问题的重视程度;对企业尤其是民企给予专项优惠贷款,支持有利于产业AI化的数据收集、使用等项目;在芯片等追赶问题突出的精密制造领域,打造大企业主导的追赶式创新模式,通过纵向一体化组织架构来便利稀缺数据汇集。

产业AI化可能因增强仿制能力带来另一把双刃剑,即有利于加速追赶,却未必有利于高度依赖原创的引领式创新。对于大模型等AI知识产权保护而言,算法可专利性存在较大争议,大模型或激化内在的公地悲剧与私地悲剧矛盾,致使专利更多地被用作竞争工具而非创新激励。此外,规模定律意味着大模型更有利于大型企业增强市场势力,简单加强知识产权保护有利于进一步提升大企业对中小企业发起专利诉讼的能力,会导致大企业享受的行政壁垒也被强化。考虑到中小企业引领式创新意愿通常高于大企业,单纯强调加强专利保护是否能够有效促进大模型时代的引领式创新,可能存在不确定性。

在全球化放缓背景下,中国产业链面临着纵向卡脖子与横向去中心化两大挑战[1]。应对前者需要加速追赶式创新,应对后者需要促进引领式创新。为此,《大国产业链》一书提出了“双支柱举国体制”构想,即以“大企业+大银行+大政府”推动追赶式创新,以“中小企业+资本市场+制度建设”推动引领式创新。这是从生产关系变革角度来探索如何应对产业链纵横挑战的思路,生产力层面有没有什么值得期待的方式?目前看,以大语言模型“涌现式”突破为标志的AI技术新进展值得关注。不过,追赶问题主要存在于制造业,目前有关大语言模型的应用探讨似乎大多集中在服务领域。这是否意味着AI无法加速制造业的追赶式创新?如果AI能够显著增强追赶式创新能力,是否意味着有利于中国制造对先发国家的追赶?对于引领式创新是否有同样确定的含义?如果生产力层面的产业AI化能够兼顾追赶与引领式创新,是否意味着无需再推动生产关系方面的变革?对于回应产业AI化是否有助于中国应对国际竞争下纵横挑战的关切而言,上述问题值得深入探讨,也是本文的主旨所在。详细分析如下。

一、AI助力追赶式创新的可能性分析

2022年以来人工智能大模型快速进步,AI产业化与产业AI化探索快速推进,制造业也不例外。Symphony AI在2023年11月推出基于开源大模型Llama 2的工业[2]大语言模型,在无监督阶段采用工业数据进行补充训练,能够根据文本输入回答机器故障情况。开发者认为若配合预测模型,Symphony AI有望实现基本的早期系统预警、自动根源问题寻找、制造过程和流程优化以及预测性维护等功能[3]。但与服务业AI化已经出现Sora那种令人震撼的进展相比,制造业AI化的成绩似乎要逊色一些。这也与OpenAI的研究相一致。在2023年关于大语言模型对各领域就业影响程度的分析中,OpenAI认为零售、金融等服务业受到的影响较大,电子产品等制造行业受到的影响有限[4]。

图表6.1:AI对制造业不同环节的影响力评估 

注:以上评估面向机械、电子通信、电力设备新能源、汽车、医药、家电、纺织服装、轻工家居、食品饮料等9个制造行业。具体而言,本文将上述九个制造业标准化为产品设计、材料开发、生产制造、市场营销、专项服务(例如售后)等5个环节,而后由中金行业分析师、文心大模型3.5以及ChatGPT-4分别对AI在不同行业不同环节的影响力进行打分,最高分为5、最低分为0,而后取九个行业的各环节平均数。

资料来源:文心大模型3.5,ChatGPT-4,中金公司研究部,中金研究院

即便是在制造业内部,大语言模型给出的结果似乎也显示其对于制造环节的影响力不及服务环节。如图表6.1左图所示,虽然中外大语言模型关于AI对各环节的影响力评估系统性高于行业分析师的判断(ChatGPT-4更乐观些),但在产品设计、市场营销、专项服务三个服务环节,行业分析师与中外大语言模型的判断差别其实并不大。真正的显著分歧出现在材料开发、生产制造这两个制造类环节,行业分析师认为大模型影响力有限,文心大模型3.5与ChatGPT-4对于大模型在这两个制造环节的影响力虽然比人类分析师乐观,但这种信心相比于前述三个服务环节还是要低些。与此形成鲜明对照的是,关于AI在这两个制造环节的影响力,大语言模型尤其是ChatGPT-4对传统深度学习代表的小模型似乎很有信心,甚至认为小模型在制造环节的影响力要大于在服务环节的影响力(图表6.1右图)。综上,这是否意味着AI大模型助力制造进步的空间有限,或者说对于通过产业AI化来实现制造加速追赶而言,希望应主要寄托在小模型方面,而非大模型?下文将从AI助力制造的逻辑基础、可能场景以及现实挑战等方面尝试回答这个问题。

(一)产业AI化赋能制造的逻辑分析

关于AI大模型的内涵,除了广为人知的大语言模型之外,还有特斯拉FSD等智能驾驶大模型,未来也许还会出现其他类型的大模型。也就是说,即便OpenAI关于大语言模型在各领域就业的影响程度分析是准确的,也不能延伸解读为AI大模型赋能制造的空间有限。更重要的是,Transformer作为支撑大语言模型成功开发的关键基础算法,其提出最初虽是为解决自然语言序列数据的处理问题,但其能力是普遍适用于系统性序列数据处理的。从方法论层面看,对序列数据的分析大致可以分为两类:一类是基于还原论去分析,也即序列整体的信息通过对每一个局部的认识来提取;另一个是需要从系统论角度去把握,也即整体包含的信息并非由局部的简单加总构成,而是由局部、局部所在整体中的位置、局部与局部之间逻辑关系等多要素共同表达。自然语言处理明显更适合采用后者,因为语言所表达的信息不仅包含在作为局部的每一个具体词汇中,也包含在以语法等语言学逻辑所覆盖的词汇所在位置、词汇与词汇之间的关系等要素中。相较于先前的深度神经网络,以自注意力、多头注意力等机制为核心的Transformer架构较好解决了系统性序列数据的处理问题,能够很好地应用在自然语言处理方面[5],最终促成了大语言模型的开发。

图表6.2:2000年以来不同类型AI文献的发表数量

资料来源:OpenAlex, 中金研究院

资料来源:OpenAlex, 中金研究院

不过,满足系统性序列数据信息表达多要素特点的不仅有自然语言数据,一些制造领域的序列数据也具有这种系统性,因而也可以使用Transformer进行处理。例如,2023年已经有文献探讨使用Transformer分析转台周期性运转序列数据,以识别机器错误状态信息的可能性[6]。更重要的是,作为本轮AI进步焦点的大语言模型虽是基于Transformer算法的,但并不意味着Transformer是本轮AI进步的全部。如图表6.2所示,在2017年Transformer算法提出后,出现快速增长的不仅是有关Transformer的文献,其他类型的AI文献也在2017年后出现加速增长态势。也就是说至少从文献角度看,2017年后AI进步或许不能简单以Transformer算法突破来概括,而是可能呈现一种全面进步态势。大语言模型的涌现式突破也印证了这一点,是算法、算力、数据三方面的共同进步,而非算法的单兵突破带来了AI能力的全面提升。事实上,即便是Transformer算法本身也在快速演进,当前支撑各类大模型的所谓Transformer已经相较于2017年早期的Transformer算法出现了很多变化。

也是得益于AI能力的这种全面进步,才有望建立起能够有效助力包括制造等产业进步的科研第四范式。回顾历史,17世纪以前,人类普遍通过对自然现象和实验的观察与总结来获得经验证据,但缺少系统性方法、规则来表达规律,这是作为第一范式的经验范式;此后到20世纪中叶,科研进入到作为第二范式的理论范式,即强调对自然规律做出原理性解释,在科学原理的指导下推动研究工作,如果说第一范式是只“知其然”,那么第二范式则更强调“知其所以然”;20世纪下半叶,随着超大规模集成电路的发展,研究进入第三范式阶段,也即计算科学与模拟仿真范式,这一时期研究普遍通过计算模型与系统模拟对各领域复杂过程进行研究;21世纪之后,伴随传感器、边缘计算、云服务、数据库等数字收集处理相关技术的发展、普及,研究进入到了以数据驱动为特点的第四范式,也即在算力不断增长的基础上,研究者可利用AI工具将经验数据、理论推导、模拟仿真等结合起来以提高研究工作的效率[7]。

无论是第二范式还是第三范式,均是高度依赖科学理论指导的研究范式。例如在第三范式中,仿真模拟器通常是建构在基于科学原理的建模或物理引擎之上的。强调科学理论指导产业技术也是自工业革命以来越发成熟定型的研究范式,1940年代《科学:无尽的前沿》对此也进行了系统化阐述[8]。然而“理论是灰色的,现实之树常青”,这个特点在制造领域尤为显著。很多制造落后问题或者追赶问题,根源并不在于科学原理方面,而是出现在制造工艺方面;或者说对于导致制造落后的诸多现实工艺问题,人类现在的科学认识还一时难以给出充分的科学理论解释。但早在工业革命之前的第一范式即已证明,即便“不知其所以然”,仅凭“知其然”的经验认识依旧可以推动生产力进步。不过,对于高度复杂的现代制造而言,人类智能在形成经验认识效率方面存在处理大数据、高维数据的能力不足等问题,而这正是AI的长处。因此,相比于单纯强调科学理论指导产业实践的科研范式而言,AI主导的第四范式可能更适合助力制造等产业进步,这也是AI赋能制造的逻辑基础。接下来,本文将结合汽车产业链的具体场景来探讨AI赋能制造业的可能性。

(二)场景探讨:以AI赋能汽车产业链为例

中国拥有全球规模最大、门类最齐全的制造业体系,拥有联合国产业分类中所列41个工业大类、207个工业中类、666个工业小类的全部门类。因此,很难在有限篇幅中详细阐述AI对所有类型制造业或者不同行业的所有制造环节的赋能作用。本文选择以汽车产业链为代表进行典型场景分析,主要出于如下几项考虑(图表6.3):①汽车产业链比较复杂,不仅涉及零部件等常规制造环节,也涉及车规芯片等精密制造环节;②中国是全球第一大汽车生产国、消费国、出口国,整体生产规模大,但以毛利率衡量的竞争力仍有待提升,这与中国制造整体庞大、局部待强的特点比较一致;③汽车产业链既包含规模较大的汽车底盘等传统制造,也包含规模较大的电动化、智能化等新兴制造,这也与中国制造目前的新老转换格局比较类似;④如前述,在全球化放缓背景下,中国制造面临着纵向卡脖子和横向去中心化两大风险挑战,当前中国新能源汽车面临的去中心化风险已经开始显现,在自动驾驶AI训练芯片等高端芯片上,卡脖子风险也不容忽视。

图表6.3:整体庞大、局部待强的中国汽车产业链(2022年)

注:横轴圆圈大小代表营收规模;传统零部件包含汽车热管理、内外饰、结构件等供应商;底盘件包括传动、行驶、转向、制动系等供应商;汽车电子包括电子电气架构、车内通信、电控、域控制器、传感器等供应商;车规芯片主要为车规MCU、算力芯片供应商。

资料来源:相应公司年报,中金公司研究部,中金研究院

与此同时,借鉴ISA-95的划分标准[9],可以将制造场景问题大致划分为系统层、材料层、环节层三个方面:材料层问题主要涉及材料性能关键特征识别、材料性能预测、材料加工过程优化等;环节层主要涉及机械设备的加工、运行等过程处理问题,例如实现故障识别和误差修正、过程参数优化和部件选型,以及预测性维护等设备环节的优化等;若将每个制造环节抽象为点,这些点与点之间或者环节点集群所涉及的整体问题则可归类为系统层问题,包括整体流程优化、质量控制以及资源调度、分配等。

综上,结合着中国汽车产业链在传统制造、电动化、智能化领域面临的国际竞争形势,下文将重点探讨AI通过识别、诊断、预测、决策[10]等方式,助力整车制造、锂电池材料开发以及芯片制造环节优化等问题。

1、在系统层面,以汽车底盘为代表的整车制造是中国在传统汽车制造领域需要攻破的重要堡垒之一。整车制造既包含了传统的燃油车制造,也包含了新兴的电动汽车制造。从整体的营收规模来看,中国整车制造规模已经较大,基本与美国、欧洲大致相等,远超日韩。但从毛利率衡量的竞争力来看,中国还落后于其他老牌汽车强国。这背后既有品牌偏见等主观因素,也有整车制造工艺有待进一步提升的问题,尤其是在对整车质量具有重要意义的底盘方面,中国在系统集成与调校优化方面仍有提升空间。汽车底盘具备多个子系统,开发阶段需注重各个子系统的协同开发。受限于整车研发历史较短,中国底盘系统的调校能力相较于老牌汽车强国有所欠缺。AI方法有助于赋能中国底盘调校能力追赶。例如,基于道路平整度、车辆速度和质量、悬挂状态等数据,可利用长短期记忆网络(LSTM)等深度神经网络方法进行AI训练学习,助力优化悬挂系统控制、调节,最终实现通过AI赋能调校底盘舒适性的目标[11]。汽车制造环节间流程优化以及环节问题早期预测等也是AI能够在系统层发挥作用的重要体现。例如,当下消费者对汽车个性化产品的高需求容易导致序列生产混乱,有可能造成运营成本上升。研究表明,通过利用机器学习模型分类识别,50%左右的序列偏差可以提前预测,有利于减少生产中断、提高生产效率、优化供应链管理[12]。AI也可以预测识别汽车零部件尺寸的变异,在早期介入以减少缺陷向下游生产环节的传播,从而提升整体质量控制能力[13]。

2、在材料层,AI有望增强中国在动力电池新材料方面的开发能力。如图表6.3所示,中国汽车产业链虽然在整车制造方面仍有所落后,但在汽车电动化方面已经具有领先优势。以动力电池为例,无论是量的营收规模方面还是以毛利率衡量的质的方面,中国均有明显优势,这在很大程度上受益于中国制造的规模经济效应。不过,动力电池作为新兴产业,技术路线仍在持续演进,尤其是新型锂电池材料的开发仍有颠覆现有产业格局的可能性。在这方面,作为后发者的中国尚未建立起生产规模的领先优势,仍存在一定的追赶空间。AI有望通过赋能材料属性预测、特征材料筛选、最优成分配比等方式加速新材料的开发[14]。

传统的化学材料合成一般基于已有研究,人为挑选材料组成成分和配比,通过实验筛选符合设定的目标材料,耗时可能长达10-20年[15]。目前比较前沿的新材料开发模式是基于元素周期表中的代表元素,根据基本晶体结构原理形成大量简单分子结构,而后通过实验、模拟计算等对分子属性特征因子和材料属性进行分析,从而筛选出符合目标属性的材料,AI可以基于已有的材料数据库大幅加速这一过程。另外在材料属性预测方面,AI算法也可以通过大量已知晶体结构和材料属性数据库进行挖掘,进而识别出不同材料之间的结构与属性相关性,并根据所训练模型推断和预测新材料的晶体结构与构效关系。在新材料预测方面,与AlphaFold预测蛋白质结构相类似,AI可通过训练学习已有元素组合可能性,预测新的材料方案[16]。

图表6.4:大语言模型作为规划和调度员串联起整个实验流程

资料来源:Boiko et al (2023)[17],中金研究院

资料来源:Boiko et al (2023)[17],中金研究院

值得注意的是,除了利用AI提升现有开发流程的效率外,也有探索AI在材料开发中发挥实验助手的案例。例如2024年的一篇文章显示,中科大一科研团队利用神经网络等算法实现了科学实验的全流程自动化[18],使得规模化高效的AI实验发现成为可能。在开发AI化的实验助手方面,也有文献在探讨应用大语言模型的可能性。如图表6.4所示,通过统筹利用搜索引擎和编程软件等工具,大语言模型能够通过自动搜寻已有文献库中的化学反应等信息来完成实验设计、试剂比例计算等工作;在具体实验阶段能够通过自动查阅本地硬件API控制文件并接入云实验室的方式实现对实体实验仪器的控制[19]。在这个过程中,大语言模型发挥着规划员、调度员的功能,衔接串联起整个实验流程,在新材料开发中起到了科研助手的作用。这些案例也展示了大语言模型的另一种应用可能,也即并非完全替代传统数字工具(例如搜索引擎)、传统深度神经网络(小模型),而是可以实现彼此间的互相赋能,或者说通过由大模型统筹小模型、数字工具乃至实体设备的方式,从调度控制、运行操作等层面共同打造更有效的AI实验助手,以进一步提升材料等开发效率。

3、在环节层,芯片问题在很大程度上反映的是精密制造存在短板。对于汽车产业链的转型升级而言,电动化只是第一步,未来更广阔的空间在于智能化。目前,在SOC(System on a Chip)、MCU(Microcontroller Unit)等中低端芯片上,中国虽然有所落后但并不存在追赶问题;在自动驾驶AI训练芯片等高端芯片上,芯片算力、功耗比和制程的要求较高,英伟达处于领先位置。目前中国很多汽车企业是基于英伟达的芯片打造自动驾驶训练中心,全球化放缓或在一定程度上影响中国自动驾驶训练以及现有车型L2+级辅助驾驶功能验证和升级迭代,以及高级别自动驾驶功能上车量产落地进度。如果无法尽快实现芯片产业链突破,国产汽车在电动化阶段累积的优势可能面临被智能化削弱的风险,不利于产品竞争力的持续提升,最终或体现为销量和驾驶数据的规模劣势、代际差距扩大[20]。

对于高端芯片制造而言,极紫外光刻机(EUV)是推动芯片进入更先进制程的关键。极紫外光刻机由诸多精密零部件组成,物镜是重要组成部分之一。加工物镜涉及到超精密磨削、超精密抛光、镀膜等精密制造步骤,高度依赖于超精密磨削机床主轴、转台、导轨、刀具等硬件,以及数控系统软件等所能达到的制造精度。当前国际先进的超精密机床分辨率可达0.1nm,定位精度可达1nm,高频粗糙度约为0.1nm[21]。目前,国产磨削机床与国际先进水平仍存在一定差距,主要壁垒包括系统设计、硬件材料、数控系统等。单看AI赋能超精密磨削机床,也存在如何优化系统、开发材料等问题,这在一般原理上与前述AI赋能锂电池材料开发与实现底盘系统优化并无本质不同,因而此处重点关注AI如何提升加工精度的环节问题。

图表6.5:华中9型工艺优化机理与智能补偿效果

资料来源:华中数控官网

资料来源:华中数控官网

通常而言,机床刀具运行轨迹由数控系统的运算规则控制,但受到热变形等环境因素影响,真实的刀具运行轨迹与数学公式经常并不吻合,从而影响加工精度。数控系统可以借助机器视觉、强化学习、深度神经网络等AI技术,通过调节刀具轨迹与运行参数的方式进行误差补偿以提高加工精度。例如可以建立光学超精密车床加工模型,改进蛙跳算法,优化径向基函数神经网络权值,以缩窄轨迹跟踪误差[22]。在实际的产业应用中也有相关探索。例如在2021年发布的华中9型智能数控系统中,在数理模型和大数据模型融合建模的基础上,借助深度神经网络模型来归纳机床热变形规律、预测零部件误差,以实现刀具轨迹误差补偿、优化工艺效果,从磨削速度、轮廓补偿以及砂轮修整控制等方面提升磨床工作精度(图表6.5)。

二、跨越数据门槛:将可能转变为现实的关键一环

(一)产业AI化的双刃剑效应:加速追赶,还是被加速追赶?

无论是从科研第四范式角度对AI产业赋能逻辑的探讨,还是结合着汽车产业链对系统层、材料层、环节层的AI赋能分析,上一节有关AI助力制造进步可能性的阐述不仅对中国适用,对其他国家同样适用。这意味着产业AI化不仅有利于中国追赶先发国家,也有可能导致中国制造被加速追赶。例如,美国虽然在精密制造领域领先于中国,但在常规制造的规模方面,美国是落后于中国的,很重要的一个原因在于美国劳动力成本远高于中国(图表6.6)。但这个劣势有可能因大模型进步而得到一定程度弥补。在本轮AI进步之前,已经有研究表明美国制造业中平均每增加1个机器人,将会取代3.3名工人的岗位[23]。伴随着大模型的涌现式突破,本文认为人形机器人有望进一步增强机器对劳动者的替代能力。也就是说,美国制造未来可能面临这样一种供求态势:需求侧,去中心化为美国制造带来订单;供给侧,《通胀削减法案》促成大量投资,大模型赋能下的人形机器人有望缓解劳动供给约束。在此背景下,美国制造有望在产量方面实现对中国的加速追赶。

图表6.6:主要经济体制造业月薪

注:因数据可得性原因,印度与德国更新至2022年,中国与日本更新至2021年。

资料来源:国际劳工组织,UNIDO,中金研究院

图表6.7:中、欧、墨、印占美国货物进口比例

资料来源:Census Bureau,Haver,Eurostat,中金研究院

资料来源:Census Bureau,Haver,Eurostat,中金研究院

更加值得注意的是,对于技术路线仍在持续演进的锂电池等新兴产业,新型材料开发有可能重塑现有的产业格局。如图6.8所示,2024年1月的一篇文章表明,美国已经在这方面展现出利用AI开发新型锂电材料的潜力[24]。具体而言,美国太平洋西北国家实验室(PNNL)与微软Azure Quantum的研究员进行了联合研究,主要步骤如下:①基于54种锂电解质元素,利用无机晶体结构数据库(ICSD)和Pymatgen生成3260万种潜在材料;②从3260万种潜在材料中,利用ML算法对热力学稳定性等属性进行筛选,将备选材料锁定至58万种;③围绕电子、电化学等目标特征,基于机器学习算法进行筛选,将备选材料进一步锁定至771个;④利用密度泛函、分子动力学验证、ML算法等将目标材料进一步筛选至18个;⑤最终由专家从18个候选材料种选出一种最优材料。整个材料发现过程的基础是用来训练AI模型的、包含12万条材料数据的Materials Project 2021数据库,以及能够有效学习处理庞大数据库的M3GNet深度神经网络架构,人工参与程度较之于传统材料开发方法显著降低。

图表6.8:AI赋能美国新型固态电解质材料的发现过程

资料来源:Chen et al (2024)[25],中金研究院

资料来源:Chen et al (2024)[25],中金研究院

本文认为有可能因本轮AI进步而实现对中国制造量加速追赶的不只有美国,还有印度。如果说人口红利是造就中国制造目前庞大规模的重要因素之一,印度在这方面也有潜力。印度制造业劳动力成本比中国还要低(图表6.6),2023年劳动力数量接近6亿,仅次于中国的近8亿、位居全球第二。本文认为印度人口年龄结构较年轻,未来劳动力总量有可能进一步增长。更重要的是,根据世界银行数据,印度劳动年龄人口平均受教育年限上升很快,1980年仅有2.46年,2020年已上升至7.8年。过去几十年一直也不乏印度制造即将腾飞的猜测[26],但一直未得到事实验证。为此,出现了各种各样的解释,诸如印度储蓄不足等[27]。如果从发展经济学“大推力”角度看,可能还有一个解释是对印度制造的外需不足,导致印度难以摆脱制造业发展不足的路径依赖(图表6.7)。但AI本轮进步有可能加速这种局面的改变。AI大模型显示出越来越强的通用性,具有显著促进生产力发展的潜力,因而也难免对现有国际生产关系造成冲击,或进一步加大全球化放缓与去中心化压力,从而可能为印度制造提供助力其加速追赶中国外需的“大推力”。

(二)从规模定律到规模经济:关键在于产量规模优势能否转化为数据规模优势

综上,本轮AI进步有可能通过人形机器人等具身智能方式缓解美国劳动力不足约束,也有可能因加大全球化放缓与去中心化压力而给印度制造带来外需扩张机遇。因此,AI能够助力制造进步,不仅意味着中国制造获得在质上加速追赶先发国家的机遇,也意味着美国、印度获得在量上加速追赶中国制造的可能。面对双刃剑挑战,规模定律(Scaling Law)或成为AI助力中国加速追赶,而不是被加速追赶的支撑因素。

对于大模型的涌现式突破,OpenAI将其归结为规模定律(Scaling Law)[28]。值得注意的是,既定算法下的规模定律,并非仅是指数据越多越有效,而是呈现一种S曲线形态(图表6.9)。也就是说,规模定律并非是说伴随着数据投入量的增加,模型效果呈现规模报酬不变的线性增加态势,而是当数据规模达到一定程度后模型效果出现规模报酬递增,因而呈现出“数据门槛”现象。与此同时,规模定律并非大模型所独享,之前的深度神经网络也具有这种效应[29]。两者结合起来意味着,并不存在着全局最优的AI模型,或者说只有数据投入量达到某种程度之后,一种AI模型才能体现出相较于其他模型更好的效果。从训练数据量来看,支持向量机、决策树等传统机器学习、浅层神经网络、深度神经网络发挥性能优势的对应数据规模依次升高(图表6.9)。

在有关AI模型的量化研究中,也发现了这种数据门槛现象。以深度神经网络为例,研究发现要充分发挥模型潜能所需投入的数据量需要达到7万条以上,当训练数据量小于5000条时深度神经网络模型相较其它模型并无优势[30];利用同一算法进行岩石图像识别,在7千条训练样本时准确率仅有70%,10万条训练数据量则能将识别准确率提高到90%以上[31]。这也在一定程度上解释了为什么1943年Warren McCulloch和Walter Pitts即已提出神经网络的计算模型,但直到2010年代后该模型才在各领域大放异彩,很大程度上或许得益于过去几十年数据积累达到了模型有效发挥效果所需的门槛。

图表6.9:各AI模型规模定律的S曲线

注:Transformer的S曲线为本文依据规模定律的一般规律绘制,目前尚未观察到其S曲线的第二拐点。

资料来源:Tang (2018)[32],中金研究院

图表6.10:Materials Project数据量

资料来源:Materials   Project,中金研究院

资料来源:Materials   Project,中金研究院

这个角度也有助于理解为什么前文说大模型虽然是本轮AI进步中最吸引眼球的焦点,但并不是本轮AI进步的全部。因为伴随着传感器、互联网、云计算等技术的普及,各领域可用数据规模实现显著增长、数据质量得到明显提升,出现了许多标准化、规模化可以用于AI模型训练的数据库,使得很多非Transformer架构的模型也得以跨越数据门槛,支撑了AI模型近些年在各领域实现性能突破。以材料领域为例,美国奥巴马政府早在2011年便推出材料基因组计划(MGI),这是广泛利用AI模型加速新型材料发现、缩减合成周期的重要基础。在该计划推动下,美国于当年开始推动材料工程数据库(Materials Projects)等标准化、高质量材料数据库建设。数据库建设与数据积累是需要时间的,前文提到的美国太平洋西北国家实验室,之所以能够在2024年初在AI赋能锂电池材料开发方面取得进展,在一定程度上便是得益于Materials Projects在2020年版本中积累了较完备的数据集(图表6.10)[33]。

从这个角度看,虽然本轮AI进步有可能在中长期削弱中国制造劳动力成本低、外部需求大的优势,但短期内无法撼动中国已经形成的较大生产规模优势。如图表6.11所示,在常规制造方面,无论是在新三样代表的新兴领域,还是老三样[34]代表的传统领域,中国生产规模均位居世界前列,很多领域都达到了全球过半的水平。而且在锂电池、新能源汽车、纺织服装、家电等领域,本文认为之所以中国制造占全球的比重较高,很大程度上是因为中国自身占全球需求的比重也很大,这也是相关产业应对去中心化压力的重要保障。

图表6.11:2022年各行业中国供给、需求占全球的比重

资料来源:工信部,各国行业协会与上市公司网站,中国机床工业协会,中国光伏行业协会,印度品牌价值基金会(IBEF),高工机器人,高工锂电,医械数据云,弗若斯特沙利文,产业在线,Wind,Bloomberg,Statista,BP,SIA Factbook,EVTank,IBISWorld,Marklines,WSTS,Bnef,Reuters,S&P Global,Euromonitor,Textile World,Marketresearch,Aero Dynamic Advisory,Off-highway,USGS,MB,Grandviewresearch,IQVIA,中金公司研究部,中金研究院

中国制造庞大的生产规模意味着可用数据的潜在规模也是非常庞大的,不但有能力支撑深度神经网络模型的广泛应用,也有能力支撑中国制造率先探索大模型与制造业的结合问题。因此,面对产业AI化带来的双刃剑效应,中国制造究竟是能够抓住加速追赶的机遇,还是主要面临被加速追赶的挑战,一定程度上要看究竟是中国能够率先将生产规模优势转化为数据规模优势,还是美国能够率先利用AI削弱自身的劳动供给约束,再或者是印度能否率先抓住去中心化机遇大力发展制造业。

对于精密制造而言,从AI助力加速追赶的原理角度看,与常规制造区别不大。以AI赋能先进制程的EUV光刻胶开发为例,与AI赋能新能源锂电池材料开发有着相似的路径:AI模拟配方实验过程,根据每种化合物的性能参数,将筛选出来的可用化合物进行模拟实验,选出更加符合要求的组合,不断优化在光刻机上实际测试的次数,并不断调节配方组成和比例,反复测试以完成开发。但在实践上,中国精密制造与常规制造存在一个重要差异,即是起步晚、产量少,导致潜在可用数据规模不足。以先进光刻胶的开发为例,现阶段中国可量产的KrF光刻胶主要用于250nm-130nm制程[35];更先进制程的ArF光刻胶尚处于研发阶段,量产规模不大、数据积累不足;由于缺乏EUV光刻机配合,在最先进制程的EUV光刻胶方面能够积累的有效数据更为有限,研发也因而受到限制。

但这并不意味着AI无法赋能中国精密制造的进步,而是可以更多重视小模型的作用。如前所述,由于AI模型规模定律呈现为S曲线,这意味着并不存在全局最优的算法。对这个规律的更严格证明体现为“没有免费午餐定理”(No Free Lunch Theorem),即没有算法能够在任意数据集下均优于其它算法,每一算法都有其优势区间[36]。这意味着虽然大模型在训练数据量足够时,能够获得很好的性能表现;但当可用数据量有限时,无论在预训练还是强化学习精调阶段,大模型的表现未必优于小模型。

也就是说,不同场景、不同类型问题的解决无需都依赖大数据支撑下的大模型,小模型在数据不足的情况下,有可能实现更优的模型效果。例如在石油工程中管道腐蚀度预测场景中,与数据依赖性较高的深度神经网络模型相比,SVM等低数据依赖算法更易实施、精确度更高[37]。根据美国安全与新兴技术研究中心的研究,中国在小模型方面与美国各有千秋,在强化学习、迁移学习等领域具有一定优势[38]。考虑到精密制造卡脖子造成的大模型算力约束后,更有理由在数据稀缺的精密制造领域重视小模型的使用。因为中国常规算力规模庞大,不存在明显的算力约束,能够支撑小模型的广泛应用。

需要强调的是,传统“十倍经验法则”认为机器学习训练数据量至少需要为模型参数的十倍[39],也有研究认为训练基于深度学习算法的模型,每个被识别对象的训练样本规模至少要达到5000个以上[40]。也就是说即便是使用小模型,对数据规模也是存在一定要求的。更重要的是,小模型对数据需求量较小,只是相对于大模型千、万亿参数规模的庞大数据需求量而言,并不是相对于制造业领域能够采集的数据量而言的。制造业数据采集面临着商业和技术两个方面的障碍。根据美国国家标准与技术研究院的研究,工业部门潜在数据规模远超金融部门,位居各产业门类首位,但相关数据具有一定私域性,导致能够汇集起足够数据规模以训练AI模型的企业较少[41]。对于很多制造类企业而言,数据中包含着大量商业机密,甚至可能承载着企业核心竞争力,因而庞大的潜在数据规模被商业壁垒分割成一个个的数据孤岛,导致难以汇集起有效支撑小模型应用的数据量。大语言模型的开发则不同,虽然需要的数据规模极其庞大,但互联网上有海量公开数据可供使用,足以构建起能够支撑大模型规模定律的数据库。另一个制造领域数据的采集困难体现在技术层面。对于AI模型的训练而言,需要的不只是数据,而是高质量数据。与训练大语言模型的互联网文本数据相比,制造业生产过程和机器所处场景千差万别,相关数据的采集频率、格式、精确度等存在巨大差异,实验数据、模拟数据、分析数据以及模型预测数据等生成数据面临着不同程度的不确定性、一致性、完整性、可重复、透明度乃至成本等问题[42],导致企业在整合提炼有价值的高质量数据方面存在较大的技术难度[43],因此在制造领域数据采集时需要权衡各类数据优劣,对齐数据处理工具以及不同场景数据的处理标准。

但正如美国国家标准与技术研究院指出的,如果能够实现工业数据的有效整合,便能够通过AI赋能的方式激发工业数据的巨大隐含价值[44]。也就是说,一旦汇集起高质量的工业数据库,便有望将AI技术层面的规模定律,转化为经济层面的规模经济效应。因此,即便工业数据库的汇集面临着诸多挑战,美国政府还是锐意推进相关数据库建设,例如:2011年“先进制造业伙伴关系”(AMP)提出了建立制造业数据库相关的倡议;2022年《先进制造业国家战略》倡议使用数字制造技术,要求制定数据兼容性标准,实现智能制造的无缝集成,并提出通过研究发展机器学习、数据访问、机密性、加密和风险评估技术以增加人工智能技术在制造业的适用性,突出了建立数据标准、增强数据共享的必要性[45]。

由于材料在众多制造业,尤其是精密制造、新兴制造领域的基石性作用,2011年推出的“材料基因组倡议”(MGI)成为奥巴马政府旨在重振美国制造业的重要倡议之一[46]。该倡议聚焦生物、能量储存、轻质结构等9大关键材料领域、63个重点方向,对量子信息技术、太空探索、可持续能源、生物科技等制造领域提供了重要支持。材料基因组倡议的根本目标是通过整合实验、算力和理论,利用基于实验数据开发的高端仿真工具、模型和分析代码共享系统等,完成材料开发范式向实验与计算、理论和数据利用深层融合的转变,以加速新材料的开发与落地。在该项计划中,数据、知识共享是材料基因组计划的核心[47],旨在通过理论研究和实验探索以及产学研间的紧密合作,在材料发现、开发、性能优化、设计整合、验证、制造以及落地等环节实施知识共享机制。材料信息基础设施(Material Information Infrastructure)特别是数据库建设是知识共享机制的重要组成部分,获得了美国主要政府部门的重点支持。Materials Project数据库作为材料基因组计划信息基础设施的关键数据库之一,由美国能源部资助加州大学伯克利分校建立。截至2024年5月,已有46万余注册用户,包含15.4万种材料、17.2万种分子的组成与性质数据,已成功支撑多种新型电池材料的开发工作[48]。为响应材料基因组计划,美国国家标准与技术研究院分级材料设计中心建立了材料数据设施(Materials Data Facility)以整合管理中心的材料数据,并在美国能源部支持下建立DLHub(The Data and Learning Hub for Science)来支持AI模型开发,以帮助研究员对材料数据的进一步挖掘,目前已在电池、显微镜等材料领域取得成效。

图表6.12:美国“材料基因组计划”知识共享图示

资料来源:美国国家科学技术委员会,中金研究院

资料来源:美国国家科学技术委员会,中金研究院

图表6.13:2019年全球主要制造业企业AI应用率

注:对象为全球前300制造企业,美国89家,欧洲73家,日本44家,中国32家。

资料来源:Capgemini (2019)[49],中金研究院

从上述材料数据库的建设来看,美国有这样几个经验值得参考。①在建设之初,根据技术层面的轻重缓急原则确立数据库建设步骤:按照不同物理尺度,分短期和长期确定了数据及其标准需要解决的主要问题。例如在宏观尺度下认定多场景数据标准的不统一为主要问题,微观尺度下则认为数据检索与存储可能是需要应对的主要挑战。此外,还梳理了不同制造领域面临的紧迫性问题,例如在高温合金方面数据的自动提取以及机械热疲劳优化模型等亟待提升,电力存储领域则亟需标准化的仿真分析工具并增强开发与应用落地间的合作联系[50]。②在中长期规划中重视数据标准一致性和配套分析工具研发,以降低数据在科研、商业间的流通共享成本,不断提升数据库建设在经济层面的可持续性。例如,对于数据及其分析工具,力求达到跨领域、研发环节间的标准一致性以降低知识互通成本。为尽可能发挥AI在材料开发方面的革命性力量,按照便利AI使用的方式来建设数据库。③数据库建设与使用并重,采取项目激励等多种措施积极推动数据库的广泛使用,以构建有利于提升数据库社会收益与可持续性的生态,也成为提升数据库建设质量的重要约束机制。美国能源部、国防部、标准化科学与技术研究院、美国科学基金会等作为主要参与机构,在自身深度参与材料数据共享与应用的同时,也会通过多种方式着力推动学术界、产业界对材料数据库的高效利用[51]。一个比较典型的代表是美国科学基金会于2012年成立的“设计材料以革新和工程化我们的未来”(Designing Materials to Revolutionize and Engineer our Future,DMREF)计划,旨在为小型研究团队提供持续四年、金额在150万到200万美元的资金支持,以激励其利用AI与自动化高通量方式进行材料开发研究,有效促进了材料数据库的使用[52]。

中国制造领域相关数据库建设仍有待完善。以前文所提的锂电池新型材料开发为例,如图表6.3所示,无论是从营收规模的量还是毛利率衡量的质的角度看,中国锂电池产业在全球均处于领先位置,意味着中国应该更有能力构建起支撑AI赋能锂电池材料开发的数据库。但至少从公开案例来看,反而是锂电池产业规模有限的美国似乎在这方面走得更快些(图表6.8)。除了AI赋能锂电池材料开发所需数据并不完全依赖锂电池产业自身提供外,更一般地看,中国尚未将制造业产量规模优势有效转化为数据规模优势,可能也是一个不容忽视的原因。对此,工信部曾在2020年做出这样的总结[53]:企业在数据层面存在问题,例如信息化基础差、设备接口不开放等造成数据采集不上来;企业数据底账不清,不知道自己有哪些数据、分布在哪里,大部分工业数据处于“睡眠”状态;因设备不互联,通信协议不兼容等造成不同数据不匹配、不互认,数据孤岛现象普遍;数据失真、失准及一致性差等因素导致数据汇聚质量不高。在应用层面,大部分企业应用单点、局部、低水平。对数据的不重视,“不想用”;数据分析的手段、人才等缺乏,“不会用”;对数据应用规律缺乏认识,数据应用投入大,“不敢用”。产量规模优势尚未有效转化为数据规模优势,或许在一定程度上解释了为什么中国头部制造类企业应用AI的比例较低(图表6.13)。

这背后可能存在工业数据库起步较晚的因素。例如美国于2011年即提出了“先进制造业伙伴关系”(AMP)战略[54],德国于2013年提出了“工业4.0”,均强调加强制造业数据的采集和利用力度。中国则是在2015年的“中国制造2025”中提出了工业大数据建设计划,相关政策起步晚于美德两国。2020年《工业和信息化部关于工业大数据发展的指导意见》等政策指导意见,强调了工业数据汇集、共享、应用,提出统筹建设“国家工业大数据平台”等,但相关数据库仍在建设过程中。更重要的原因或许还是在于微观方面。除了前述美国制造数据采集面临的商业与技术障碍外,中国制造数据采集还存在如下特殊困难。

①中国制造从产量视角看整体规模大、从毛利率视角看局部待强,部分企业难以承受数据采集等产业AI化成本开支。根据IDC&量子位2019年的人工智能行业调研问卷结果,33%的中国企业认为难以支撑投资AI技术的成本。这个原因对于存在卡脖子或去中心化风险的行业而言尤为值得重视。因为这些领域的企业往往生存环境更为恶劣,承受数据采集等AI化成本投入的能力更弱些。

②作为数据采集的关键支撑行业,中国传感器产业与先发国家仍有一定距离。2020年第十六届全国敏感元件与传感器学术会议指出,中国传感器行业设计和应用技术落后发达国家15-20年,产业化技术方面的差距更是达到20-25年[55]。

③由于产权激励等原因,部分企业对于数据采集及其AI化使用的重视程度不足。类似于合资模式下中国汽车工业“以市场换技术”策略的成效不高[56],在将生产规模优势转化为数据规模优势、利用AI把量的优势转化为质的优势方面,民营车企和造车新势力的积极性要高于其他类型的车企。

④与常规制造相比,产业链过于割裂是精密制造汇集数据面临的特殊挑战。由于中国精密制造起步较晚、产量较少,行业可汇集的潜在数据总量不如常规制造那么大,过于割裂的产业组织模式进一步限制了可用数据规模。以面临着严峻卡脖子风险挑战的芯片产业链为例,形成于全球化时期的分工协作模式并不利于不同企业间的数据汇集,过去几年甚至出现了进一步割裂产业链的迹象,加大了稀缺数据汇集与使用困难,既不利于技术层面的AI规模定律发挥来加速突破追赶问题,也不利于发挥规模经济效应来增强产业AI化的成本承受能力。

除针对上述原因补齐真实数据短板外,另外一个可能但具有争议的路径是充分利用仿真与合成数据。根据数据的生成方式,仿真与合成数据可大致分为两类。一类是基于演绎构建逻辑,通过预先设定的规则或编写的物理引擎对目标进行公式化计算,例如英伟达开发的工业元宇宙Omniverse,已在西门子风力发电叶片优化、百事集散中心吞吐量优化,以及英国原子能管理局的核聚变反应堆有所应用[57]。计算仿真的精确度依赖预设模型的复杂度与最小单位的精细度,较精确的仿真系统需要先进算力支持,而先进算力本身即是中国制造需要加速追赶的领域。更重要的是,演绎构建逻辑的计算仿真高度依赖先验性的理论知识,对理论规则的精细度和解释能力有较高要求。然而从目前的科学进展看,不同尺度下的物理、化学基础理论不同而难以统一,描述微观粒子的量子理论较难与描述大尺度的相对论在同一理论框架下共同工作,因此当前仿真系统及其所基于的理论均有适用尺度空间的限制。例如材料领域的密度泛函、分子动力学、有限元分析分别代表从原子、微观到宏观尺度的模拟方法,暂未形成统一的框架或通用目的仿真系统。总之,如果仅试图通过仿真来弥补制造现实数据的采集不足问题,难度和复杂度可能也不小。

另一类是基于归纳构建逻辑对可能性空间进行补充。当前,生成式AI是归纳构建逻辑下仿真与合成数据的典型代表,目前已经能够将某一类场景下AI算法的生成数据,用以训练另一场景下的AI模型。例如,特斯拉、小米等都已开始使用虚拟生成道路场景,来训练自动驾驶大模型。即便在同一场景下,某一算法架构下的生成数据也能对另一架构下的模型进行训练补充。例如2024年基于Diffusion算法的蛋白质模型AlphaFold3,就利用了AlphaFold2所生成蛋白质结构数据进行补充训练[58]。需要指出的是,虽然有观点认为Sora视频生成模型存在成为通用目的物理世界模拟器的可能[59],但也存在一些争议,例如:目前的Sora仍只是潜空间(Latent Space)的拼贴和插值,内部物理模型无法推广至新的情况;无法用Sora代替流体动力学模拟器设计新飞机[60];生成逼真视频不表明系统理解物理世界,与世界模型的因果预测非常不同[61];无法判断全局合理性,忽略物理过程临界态等。虽然这可能只是Sora的阶段性困难,但至少从目前来看还无法肩负起通用目的物理世界模拟器的重任。

三、新矛盾:利于追赶,未必利于引领式创新

如前述,鉴于生成数据可靠性、场景合理性等方面存在争议,Sora能否弥补真实数据的不足具有不确定性,但Sora依然有可能通过增强仿制能力的方式来助力加速追赶。所谓仿制,通常也称逆向工程,一般是指通过分析已有产品、设备或系统等的结构、功能、工作原理等内容,来获得设计、制造等方面的技术信息和数据的方法,广泛应用于从制造到服务的各个领域,例如制造业的机械设计和模具制造、软件业的代码结构和功能分析、半导体行业的芯片设计等均是仿制能力的重要应用场景。与此同时,所谓追赶式创新,是指创新方向、路径都是大致确定的,后发国家需要大致沿着先发国家走过的路加速追赶。这意味着,增强仿制能力在加速追赶式创新的过程中大有可为,而产业AI化有助于显著增强仿制能力(图表6.14)。

一方面,产业AI化可以对传统仿制工艺中数据采集和数据分析等环节进行赋能。例如在制造业中,逆向工程一般包括数据采集、数据处理、三维建模、分析和测试、原型制造和生产等环节,这些都是AI擅长或可以有效赋能的领域。进一步地,当AI赋能仿制与3D打印等其他制造技术结合后,能够进一步提升仿制效率。例如,可以利用机器学习和图像识别相结合的方式,先通过微断层扫描得到部件每一层的图像,再使用机器学习方法根据图像数据推断出具体的3D打印路径等参数,而后将相关参数输入到3D打印装置中以实现对仿制对象的逆向开发[62]。此类仿制通常也被称为利用AI的仿制(AI-assisted reverse engineering)。

另一方面,伴随着算法优化、算力提升和数据积累,基于AI的新型仿制将越发成熟(AI-based reverse engineering)。如果说传统仿制不但强调“知其然”也强调“知其所以然”,那么这种新型仿制的一个重要特点就是不再追求“知其所以然”,而是只要能够获取足够多的交互数据,AI可以在无需探讨仿制对象真实开发逻辑的情况下,重现内在逻辑或许不同但外在形象、行为结果相近的成果。目前,这种新型仿制的一些实际案例主要集中在软件和游戏领域。例如在2020年,英伟达利用神经网络模型,通过提取屏幕画面和键盘操作,在不借助游戏引擎的情况下,不但成功复刻了《吃豆人》游戏(1980年发行的街机游戏),甚至可以生成符合仿制对象风格的全新游戏布局画面[63]。本轮AI大模型的发展有望进一步增强新型仿制能力,例如前面提到的Sora在技术层面展示了大模型对3D建模的强大仿制能力,有望将新型仿制对追赶式创新的助力作用延伸到制造业等更多领域。

图表6.14:AI已使得诸多领域仿制的难度和成本快速下降

资料来源:Yanamandra et al.(2020)[64],Azriel et al.(2021)[65],中金研究院

资料来源:Yanamandra et al.(2020)[64],Azriel et al.(2021)[65],中金研究院

总之,无论是基于AI赋能制造的逻辑与场景分析,还是从中国制造具有将产量规模优势转化为数据规模优势的潜力,再或者从AI技术进步从两个方面增强仿制能力的角度看,产业AI化均有助于后发者加速追赶式创新。但正如本章开篇所述,对于当下中国而言重要的不只是追赶式创新,也需要增强引领式创新能力。产业AI化有助于加速追赶式创新的逻辑,是否同样适用于引领式创新?尤其是AI增强仿制能力,是否会因其导致搭便车的创新者增加而抑制引领式创新?下文将对此进行探讨。

(一)产业AI化对于引领式创新的双刃剑效应:增强能力VS抑制意愿

对于引领式创新而言,仿制能力增强是把双刃剑。一方面,AI对创新能力的增强具有一般性,不仅会增强仿制型、追赶式创新,也会增强原创型、引领式创新。以制药公司Insilico Medicine研发用于治疗肺部纤维化疾病的创新药为例,如果采用传统的药物研发方法,大概需要花费4亿多美元,时间可能长达6年;在AI技术的赋能下,传统研发开发周期长、不确定性高的问题得到了明显改善,该公司仅用两年半就完成了临床试验的第一阶段,成本也仅为原来的1/3[66]。在一般性的新产品开发中也有类似效果。2018年德国一项有关创新的调查数据显示,在使用AI的企业中,25%的新产品研发与AI使用有关;使用AI的公司推出新产品的可能性比不使用AI的公司高8.5%,而且更可能推出原创程度更高的全球首创类产品[67]。更重要的是,仿制能力增强有助于被仿制的新技术、新产品以更低廉的价格快速扩散,降低了使用新技术、新产品进行衍生创新的成本,这个机制既有利于追赶式创新,也有利于引领式创新。

另一方面,仿制可能降低引领式创新意愿。罗默认为垄断利润是研发投入的发动机[68]。引领式创新作为一种差异化竞争策略,有望给创新者带来垄断性的超额利润,从而激励创新者从事引领式创新活动。仿制能力增强意味着引领式创新带来的市场壁垒会被削弱,差异化竞争带来的超额利润空间下降,因而有可能抑制引领式创新意愿。来自仿制药的实证研究显示,仿制药在某个细分领域的占比(数量指标)每增加10%,该领域的原研药的早期创新成果数量会减少6.74%[69]。但也有另一种观点认为,仿制品加剧市场竞争,由此导致的产业平均利润率下降可能会促使企业增加引领式创新,以规避同质竞争、维护超额利润[70]。

综上,无论是AI技术进步本身还是由此带来的仿制能力增强,对于追赶式创新的促进作用都比较确定,对于引领式创新的逻辑与实证含义却是矛盾的,同时存在抑制和增强的可能性。传统深度学习时代的大量理论文献与实证案例尚且得不出确定结论,对于缺乏经验数据的大模型时代之于引领式创新的含义,更是不得而知。本文认为,与其执着于探讨有没有清晰明确的结论,不如从更具有现实意义的角度出发探讨如何趋利避害,以尽可能发挥大模型对于引领式创新的积极作用,削弱其消极作用。要实现这个目标,一个常见的思路是加强专利保护。如前述,垄断利润是研发投入的发动机。从引领式创新的角度看,垄断利润不仅来自于差异化竞争策略(即引领式创新带来的市场壁垒),很大程度上也来自于专利制度对于原创技术、产品等的保护(即专利制度授予引领式创新的行政壁垒)。新制度经济学领域的诺奖获得者诺思曾在《西方世界的兴起》一书中,高度评价了专利保护制度在英国18世纪工业革命兴起中扮演的重要角色[71]。现代专利私权制度建构在美国1836年颁布的《专利法》基础上,核心理念是以公开知识换取一定期限的垄断权利,通过授予使用、销售和进一步开发其发明的专有权来实现创新成果货币化,对美国经济及其创新能力产生了重要影响[72]。

由此而来的推论似乎是,即便大模型因显著强仿制能力导致引领式创新自发形成的市场壁垒被削弱,但只要增强专利保护制度,依旧可以防止对引领式创新造成抑制作用。事实上,目前确实也有诸多文献要求在AI时代加强知识产权保护,内容涵盖了算法、软件、开源内容等相关领域[73]。问题是这些工业时代的经验和深度神经网络时代的讨论,是否适用于大模型时代?有关公地悲剧与私地悲剧的讨论或有助于回答这个问题。

(二)公地悲剧VS私地悲剧:大模型时代加强专利保护未必有利于引领式创新

虽然过去数百年的历史经验,似乎能够一再印证知识产权保护对于创新尤其是引领式创新的积极意义,但这并不意味着加强知识产权保护必然有利于促进引领式创新。就知识产权保护制度而言,存在着公地悲剧与私地悲剧的内在冲突。所谓公地悲剧是指创新具有正外部性,如果没有知识产权保护制度则意味着人人都可以免费或者低成本地使用创新成果,由此形成的搭便车问题造成创新投入不足,不利于增进社会福利。因此,加强知识产权保护有助于将创新正外部性内部化,以防范公地悲剧、提高创新者的积极性。阿罗在理论层面也证明了这一点,即专利制度对于技术创新的激励作用是重要的,解决了创新收益独占性问题[74]。

但这并不意味着一味加强知识产权保护必然有利于创新。因为创新尤其是引领式创新之所以能够促进经济增长、增进社会福利,不只是因为能够实现0到1的突破,更需要创新成果实现由1到n的扩散,以及通过创新成果对其他领域的广泛赋能衍生出更多引领式创新。因此,过度强调知识产权保护虽有可能提高0到1的创新概率,但也会增强创新成果向n扩散的交易成本,不利于充分发挥原始创新对于经济增长、社会福利与衍生创新的积极作用,形成“私地悲剧”问题。例如,“专利蟑螂”[75]“专利丛林”[76]“垃圾专利”[77]“许可(金麒麟分析师)费膨胀”[78]等现象是专利保护中私地悲剧问题的体现。

因此,考虑到上述公地悲剧与私地悲剧的内在冲突后,不宜将专利保护有利于创新过度延伸为加强专利保护必然有助于促进创新。研究表明,在创新周期快、技术交叉复杂度高的行业中,专利更多地被用作竞争工具而非作为创新激励[79],意味着在这些领域一味强调加强专利保护可能会激化私地悲剧与公地悲剧之间的矛盾。大模型也具有创新周期快、技术交叉复杂度高的特点,因此有必要慎重对待以强化知识产权保护来促进引领式创新的思路,尤其是应重视如下两个可能激化私地悲剧问题的风险。

1、在大模型时代加强知识产权保护,可能会强化囚徒困境,造成交易成本上升与社会无谓损失增加。当前的专利制度保护的主要是发明创造,主要包括产品专利和方法专利。专利权给予发明者一定时间内的创新收益独占权。专利一般需要公开详细信息,专利保护期满后该发明通常成为公共品。在AI三要素中,算法和数据是主要的知识创造体现。一般而言,数据并不属于专利保护的范畴,但一些被认定为具有独创性的数据内容选择和编排,仍可以获得版权方面的保护。模型是AI技术的核心,与之相关的算法保护虽然重要但存在较大争议。单纯的AI算法属于智力活动规则和方法的范畴,通常被认为不可申请专利。当前的算法专利,通常需要与技术特征(即需要明确具体的技术手段、技术问题、技术效果)作为一个整体来进行申请。另外,软件往往通过版权的方式予以保护,因此理论上也可以将AI算法视为软件的一部分加以保护。不过,版权只是保护“算法”的表现形式,而并非“算法”的核心思想,实践中依旧可绕开“算法”代码这种表现形式而对算法进行事实上的使用。

更重要的是,由于算法可专利性本身存在较大争议,因而要求加强AI算法保护的观点在实践中面临着是否可行的挑战。以作为大语言模型核心算法的Transformer为例,谷歌从2018年开始为Transformer相关技术进行了一系列的专利申请。在中国,国家知识产权局虽在2024年批准了谷歌“基于关注的图像生成神经网络”的专利申请,但也驳回了谷歌以“基于注意力的序列转换神经网络”为名提出的关于Transformer的另一项专利要求,理由是该申请不是专利法意义上的技术问题[80]。美国对算法专利的处理也比较谨慎。这一方面是因为美国知识产权保护制度是高度分权的,也即美国专利审查呈现出不同行政层级、司法部门间互相制衡的特点。更重要的是由于算法作为新兴领域,专利适用性往往存在较大争议,导致相关政府部门倾向于谨慎应对。以美国最高法院在2014年Alice Corp. Pty. Ltd.诉CLS Bank Int’l案中创立的两步法原则为例:第一步是判断专利主张是否涉及自然法则、自然现象或抽象概念;若涉及,第二步再判断是否有额外要素(如具体的技术方案),将抽象概念转换为具体的发明[81]。但该原则仍较为模糊,不同部门对同一问题的理解并不完全一致,导致存在即便被美国专利局授予了算法专利但依然无法得到美国法院专利保护的风险。以2021年Trinity Info Media诉Covalent为例,Trinity Info Media起诉对方侵犯了自己两项与“基于用户调查数据的信息推荐系统”算法有关的专利(美国专利编号9087321和10936685),美国联邦巡回上诉法院在2023年7月的判决中支持了对Trinity Info Media的专利驳回决定,认为案件中所涉及的两项算法专利属于抽象概念,不具有可专利性[82]。

也就是说,由于存在较大可专利性争议,即便算法按技术方案等标准成功获批专利,后续也可能因专利挑战被专利局撤回、或在专利诉讼中被法院认定专利无效。或许也是因为这个原因,谷歌公司虽然申请并获批了Transformer专利,但并没有借此对OpenAI或者其他使用Transformer的公司提起侵权诉讼。然而有意思的是,根据美国专利局(USPTO)对AI的专利分类,21世纪后被授予的各类AI专利数量均大幅增加[83]。

既然申请专利也不能确保自身的独占性,那为什么AI企业还要花费成本积极地为算法等寻求专利保护?一个可能的解释是这是专利保护制度给AI企业造成的囚徒困境。由于AI模型尤其是大模型所使用的算法比较复杂,各创新者之间存在大量的交叉引用。以大模型为例,虽然Transformer是核心算法,但这并不意味着大模型的成功开发仅用到Transformer,例如在AlphaFold3、Sora等生成式功能要求更强的大模型中Diffusion的重要性同样不容忽视。这样一个交叉度较高的技术特点叠加专利保护制度,导致AI企业不得不广泛申请专利、积累专利组合,以建立起可以确保相互毁灭(mutually assured destruction)的专利防御机制[84],防止被其他公司反诉。很明显,这种专利保护情形更多的是提高了全社会的交易成本,而非激励创新。

2、规模定律意味着大模型更有利于增强大企业的市场势力,这种情况下持续强化知识产权保护可能不利于促进引领式创新。来自于德国2018年的创新调查显示,与小企业相比,大企业的AI利用率明显更高:当公司员工规模100人以下时,企业AI使用率不足10%;而员工规模大于1000人的企业,AI使用率可达30%以上[85]。基于美国2010-2018年的实证研究也表明,现金更充裕的企业对于AI投资的增长更快,而对AI投资越多、初始规模越大的企业,销售额增加得更明显[86]。如何理解这种AI与大企业更加匹配的特征事实?一个可能的解释是规模定律,也即AI性能往往伴随着参数规模的扩大而提升,背后是算法优化、算力增长、数据增加的三要素支撑。无论是哪个要素的进步都是需要投入大量资源的,因而AI模型技术层面的规模定律,在经济层面的一个重要含义即是自发的有利于大企业的“强者恒强”。

然而,中小企业才是引领式创新的主体[87]。因为引领式创新通常具有较强的颠覆性和不确定性,意味着大企业推动引领式创新可能会对现有业务带来较大风险,甚至可能会颠覆大企业已经占据的市场优势地位,因此大企业尽管有很强的引领式创新技术能力,但将引领式创新技术转化为引领式创新产品的动力相对不足。相较之下,中小企业想要击败占据市场主导地位的大企业,往往只能依靠换道超车似的颠覆性创新,因此中小企业通常更有引领式创新意愿[88]。这一规律在大模型开发中再次得到印证。谷歌作为大型科技企业,率先开发出Transformer算法是其强大的AI创新能力的一个体现,但谷歌之所以迟迟未将该算法进一步开发为具有引领性的创新产品ChatGPT,一定程度上是担心可能会对搜索引擎广告这一核心业务的收入产生负面冲击[89]。此外,与中小企业相比,大企业天然地更受到舆论关注,引领式创新的颠覆性效果可能因为引发舆情而影响大企业经营的稳定性,也会导致大企业存在规避激进的引领式创新的倾向。例如2020年谷歌搜索引擎中的AI技术偏见造成负面舆情,在一定程度上抑制了谷歌对AI的应用意愿[90]。

然而,规模定律意味着中小企业的生存空间可能因AI的发展而受到遏制,因为它们的潜在可用数据规模本身就小,也缺乏支撑算力增长与算法优化的足够资源。当前,大模型展现出远超传统深度神经网络几个数量级的规模效应,这意味着大模型对大企业市场势力的赋能作用可能也会远超传统AI模型,或将进一步增强大企业对中小企业的竞争优势,压缩中小企业的生存空间。

与此同时,一些大企业存在侵犯中小企业知识产权的行为,并将专利保护制度变成一种针对中小企业进行不公平竞争的策略。以美国专利挑战为例,是指第三方向美国专利局(USPTO)下设的专利审判和上诉委员会(Patent Trial and Appeal Board),提出对已授予专利有效性的异议或重新审查请求[91]。根据美国专利商标局(USPTO)的数据,2021年其受理的专利挑战审查申请中,有超过80%的专利挑战申请来自10家大型企业[92]。这意味着如果在大模型时代进一步加强知识产权保护,大企业的市场势力不但会因为规模定律而得到自发增强,还会因为行政力量而进一步增强专利挑战的能力,本文认为这将导致中小企业生存空间面对由大模型增强的大企业市场壁垒与行政壁垒的双重挤压,因而可能不利于促进引领式创新。例如,谷歌作为Transformer的开发者和专利拥有者,如果严格保护其对Transformer的专有权,OpenAI或许难以基于该算法去开发大语言模型;对于大模型开发所需要的海量数据(维权),如果严格保护每一位数据来源方的知识产权,则OpenAI可能迟迟无法汇集起足够支撑涌现的数据规模[93]。

四、思考与启示

综上所述,以大模型为代表的本轮AI技术进步,在生产力层面展示了兼顾追赶式创新与引领式创新的可能性。从国际竞争角度看,AI的这种产业赋能作用具有双刃剑效应,既有利于中国制造在质上加速追赶先发国家,也有利于先发国家克服劳动成本高的供给侧劣势加速对中国制造量的追赶,甚至有可能颠覆我国在新兴产业方面暂时确立的优势格局。更重要的是,大模型等AI进步有可能进一步强化先发国家的去中心化动机,为印度等后发国家制造业加速追赶提供需求侧契机。在AI带来的这种复杂国际竞争形势下,大国规模优势是产业AI化助力中国制造加速追赶的根本保障。在常规制造方面,无论是在新三样代表的新兴领域,还是在老三样代表的传统领域,中国生产规模均位居世界前列,很多领域都达到了全球市场过半的水平。与此同时,从传统深度学习到大模型,AI的规模定律越发凸显,数据在大模型时代的重要性进一步上升。中国制造庞大的生产规模意味着可用数据的潜在规模也是非常庞大的,有能力支撑中国率先探索大模型与制造业的结合问题。

但是,中国常规制造的生产规模优势转化为数据规模优势,还面临着一系列挑战,例如数据采集不上来、大部分工业数据处于“睡眠”状态、数据孤岛现象普遍、数据汇聚质量不高、存在“不想用”“不会用”“不敢用”等问题。对于追赶问题比较突出的芯片产业链等精密制造而言,数据问题更突出一些。这些领域起步晚、产量少,潜在可用的数据规模不如常规制造那么大,产业链割裂进一步加大了稀缺数据的汇集困难,不利于AI赋能精密制造加速追赶。值得注意的是,随着国际竞争逐步加剧,各国对数据安全和隐私问题的关切日益加深。2024年2月,美国总统拜登签署《关于防止关注国家获取美国公民大量敏感个人数据和美国政府相关数据的行政命令》[94],可能影响美国国家生物技术信息中心(NCBI)“高通量基因表达数据库”(GEO)、“癌症基因组图谱”(TCGA)、“美国药监局不良事件报告系统”(FAERS)等数据库的访问使用。

这意味着加速完善国内数据采集、存储与使用分析生态已经刻不容缓。在这方面,美国“材料基因组计划”相关数据库建设经验具有一定启发意义:①根据技术层面的轻重缓急确立数据库建设基本原则;②在中长期规划中重视数据标准一致性和配套分析工具研发,以降低数据在科研、商业间的流通共享成本,提升数据库建设在经济层面的可持续性;③既重视统筹各政府部门形成支持数据库建设的合力,也重视通过经济激励等方式推动数据库在产业界、学术界的广泛使用,有利于提升数据库社会收益和政治可持续性,也为高水平建设数据库提供了外部约束。不过,更重要的还是针对中国数据汇集、处理的现实问题采取针对性措施,例如:①加强国企面临的市场竞争约束,设置相关考核规则以提升其对数据汇集和使用的重视程度;②对企业尤其是民企给予专项优惠贷款,以支持其进行数据库建设等AI化改造;③在芯片等追赶问题突出的精密制造领域,着重打造大企业主导的追赶式创新模式,通过纵向一体化组织架构来便利稀缺数据汇集。

值得强调的是,在易被卡脖子的精密制造领域,潜在可用数据规模本就不大,产业链过度割裂更加不利于AI赋能。在这方面英特尔的经验值得借鉴。英特尔官网在2022年对AI赋能芯片制造的实践进行了披露,包括先进过程控制、自动缺陷分类、根本原因分析等一系列AI应用(图表6.15)。英特尔之所以能够实现AI赋能,一定程度上得益于纵向一体化的产业组织模式,能够在涉及几十个掩膜层、数百个工艺步骤、数千台设备的庞大生产场景中实现各环节联通与高标准、高质量数据提取,进而支撑产业AI化的赋能作用。

图表6.15:英特尔在芯片制造中的产业AI化实践

资料来源:英特尔官网

资料来源:英特尔官网

除了旨在加大真实数据汇集力度的上述措施外,生成式AI在未来有望成为弥补数据短板的重要方式。目前看,由于生成数据可靠性、场景合理性等方面仍存在较大争议,其短期可能还无法有效弥补真实数据不足。不过,生成式AI在增强仿制能力方面的潜力依旧值得重视,由此也带来了另一种双刃剑效应,即AI增强仿制能力虽有助于追赶式创新,但对高度依赖原创的引领式创新的含义却并不清晰。一方面,仿制能力增强有助于新技术、新产品以更低廉的价格快速扩散,降低了使用新技术、新产品进行创新的成本,这个机制既有利于追赶式创新,也有利于引领式创新;另一方面,对于创新意愿而言,仿制能力增强侵蚀引领式创新者的垄断利润,有可能抑制引领式创新意愿,但仿制品加剧了市场竞争,由此导致的产业平均利润率下降可能会促使企业加强引领式创新,以规避竞争、维护超额利润。实证方面,关于仿制究竟会促进还是抑制引领式创新也是莫衷一是。

有鉴于此,在大模型等AI技术进步进一步增强仿制能力的背景下,需要采取措施来尽可能发挥AI进步对于引领式创新的积极效应,削弱其抑制作用。一个常见思路是加强知识产权保护,现在也不乏主张加强对算法等AI知识产权保护的观点。就理论分析而言,由于知识产权保护内在固有的公地悲剧与私地悲剧冲突,一味地强化知识产权保护未必能够起到促进创新的效果。伴随着AI进步,尤其是大模型的发展,知识产权保护制度内在的矛盾冲突存在激化可能性。例如,若严格保护算法专利,则大模型的诞生时间可能会被拖后;若过度保护数据的知识产权归属,则可能迟迟难以聚齐足够支撑大模型“涌现”的数据量。更重要的是,大模型的规模定律,意味着自发地更有利于大型企业增强市场势力;此时如果进一步加强知识产权保护,则意味着进一步提升了大企业对中小企业发起专利诉讼的能力,结果会导致大企业享受的行政壁垒受到强化。但大企业引领式创新意愿通常低于中小企业,中小企业才是引领式创新的主力。因此在大模型自发强化大企业市场势力的背景下,单纯强调加强知识产权保护是否有利于引领式创新,效果可能具有较大不确定性。

[1]有关卡脖子和去中心化内涵的详细阐述,参见《大国产业链》之“第七章 产业链纵横与双支柱举国体制”,中金公司研究部、中金研究院,中信出版社2023年。

[2]严格来讲,制造业只是工业的一部分,而非全部。考虑到制造业是工业的最主要部分,以及本文的研究目的,本文不再严格区分工业和制造业。

[3]Symphony AI 官网. https://www.symphonyai.com/industrial/

[4]Eloundou, et al., GPTs are GPTs, 2023.

[5]Vaswani A, Shazeer N, Parmar N, et al. Attention is all you need[J]. Advances in neural information processing systems, 2017, 30.

[6]Wu H, Triebe M J, Sutherland J W., A transformer-based approach for novel fault detection and fault classification/diagnosis in manufacturing: A rotary system application, 2023.

[7]Tansley S, Tolle K M. The fourth paradigm: data-intensive scientific discovery, 2009.

[8]Bush V. Science: The Endless Frontier: A Report to the President on a Program for Postwar Scientific Research,1945

[9]Arinez J F, Chang Q, Gao R X, et al. Artificial intelligence in advanced manufacturing: Current status and future outlook, 2020. ISA-95标准是由国际自动化协会(ISA)制定的国际标准,作为从生产流程控制到业务决策和管理各层级建立信息交流的通用框架,致力于降低各系统的风险、成本和错误。

[10]Wang J, Ma Y, Zhang L, et al. Deep learning for smart manufacturing: Methods and applications, 2018.

[11]Dridi I, Hamza A, Ben Yahia N. Control of an active suspension system based on long short-term memory (LSTM) learning, 2023.

[12]Stauder M, Kühl N. AI for in-line vehicle sequence controlling: development and evaluation of an adaptive machine learning artifact to predict sequence deviations in a mixed-model production line, 2022.

[13]Peres R S, Barata J, Leitao P, et al. Multistage quality control using machine learning in the automotive industry, 2019.

[14]Schleder G R, Padilha A C M, Acosta C M, et al. From DFT to machine learning: recent approaches to materials science–a review, 2019; Pyzer-Knapp E O, Pitera J W, Staar P W J, et al. Accelerating materials discovery using artificial intelligence, high performance computing and robotics, 2022.

[15]杨小渝,王娟,任杰(金麒麟分析师),等。支撑材料基因工程的高通量材料集成计算平台[J].计算物理,2017。

[16]Schleder G R, Padilha A C M, Acosta C M, et al. From DFT to machine learning: recent approaches to materials science–a review, 2019; Pyzer-Knapp E O, Pitera J W, Staar P W J, et al. Accelerating materials discovery using artificial intelligence, high performance computing and robotics, 2022.

[17]Boiko D A, MacKnight R, Kline B, et al. Autonomous chemical research with large language models, 2023.

[18]Zhu Q, Huang Y, Zhou D, et al. Automated synthesis of oxygen-producing catalysts from Martian meteorites by a robotic AI chemist, 2024.

[19]Boiko D A, MacKnight R, Kline B, et al. Autonomous chemical research with large language models, 2023.

[20]详见《大国产业链》之“第十四章 汽车:从大国到强国”,中金公司研究部、中金研究院,中信出版社,2023年。

[21]王磊,卢秉恒。中国工作母机产业发展研究[J]. 中国工程科学,2020。

[22]张樊,王晶。基于人工智能技术的复杂光学曲面加工轨迹跟踪[J].激光杂志,2023。

[23]Acemoglu D, Restrepo P. Robots and jobs: Evidence from US labor markets, 2020.

[24]Chen C, Nguyen D T, Lee S J, et al. Accelerating computational materials discovery with artificial intelligence and cloud high-performance computing: from large-scale screening to experimental validation, 2024.

[25]Chen C, Nguyen D T, Lee S J, et al. Accelerating computational materials discovery with artificial intelligence and cloud high-performance computing: from large-scale screening to experimental validation, 2024.

[26]https://www.mckinsey.com/industries/industrials-and-electronics/our-insights/a-new-growth-formula-for-manufacturing-in-india

[27]https://www.bloomberg.com/opinion/articles/2023-10-02/india-s-economy-will-stumble-because-of-low-savings

[28]Kaplan J, McCandlish S, Henighan T, et al. Scaling laws for neural language models, 2020.

[29]Hestness J, Narang S, Ardalani N, et al. Deep learning scaling is predictable, empirically, 2017.

[30]Passafaro T L, Lopes F B, Dórea J R R, et al. Would large dataset sample size unveil the potential of deep neural networks for improved genome-enabled prediction of complex traits? The case for body weight in broilers, 2020.

[31]Dawson H L, Dubrule O, John C M. Impact of dataset size and convolutional neural network architecture on transfer learning for carbonate rock classification, 2023.

[32]Tang A, Tam R, Cadrin-Chênevert A, et al. Canadian Association of Radiologists white paper on artificial intelligence in radiology, 2018.

[33]https://matsci.org/t/materials-project-database-release-log/1609/11

[34]http://paper.people.com.cn/rmrb/html/2023-12/11/nw.D110000renmrb_20231211_4-01.htm

[35]《大国产业链》之“第十章 化工:大宗产品强优势,高端材料补短板”,中金公司研究部、中金研究院,中信出版社,2023年。

[36]Wolpert D H. The lack of a priori distinctions between learning algorithms, 1996.

[37]Pan Y, Sun F, Teng Z, et al. Detecting web attacks with end-to-end deep learning, 2019.

[38]Chahal H, Toner H, Rahkovsky I. Small data’s big AI potential[J]. Center for Security and Emerging Technology, 2021.

[39]Alwosheel A, van Cranenburgh S, Chorus C G. Is your dataset big enough? Sample size requirements when using artificial neural networks for discrete choice analysis, 2018,

[40]Goodfellow I, Bengio Y, Courville A. Deep learning, 2016.

[41]Towards Resilient Manufacturing Ecosystems Through Artificial Intelligence,美国国家标准与技术研究院,2022。

[42]Ramalli E, Pernici B. Challenges of a Data Ecosystem for scientific data, 2023.

[43]Cui Y, Kara S, Chan K C. Manufacturing big data ecosystem: A systematic literature review, 2020.

[44]Towards Resilient Manufacturing Ecosystems Through Artificial Intelligence,美国国家标准与技术研究院,2022。

[45]Council N S. National strategy for advanced manufacturing. 2022.

[46]Materials Genome Initiative Strategic Plan,美国国家科学技术委员会,2014。

[47]Materials Genome Initiative Strategic Plan,美国国家科学技术委员会,2021。

[48]Materials Genome Initiative Strategic Plan,美国国家科学技术委员会,2021。

[49]Scaling AI in Manufacturing Operations: A Practitioners’ Perspective, Capgemini, 2019.

[50]Building the Materials Innovation Infrastructure: Data and Standards,美国国家标准与技术研究院,2012。

[51]Materials Genome Initiative Fourth Principal Investigator Meeting, MGI, 2018.

[52]https://new.nsf.gov/funding/opportunities/designing-materials-revolutionize-engineer-our.

[53]工业和信息化部,2020. https://www.cac.gov.cn/2020-05/16/c_1591178516877644.htm

[54]https://obamawhitehouse.archives.gov/the-press-office/2011/06/24/president-obama-launches-advanced-manufacturing-partnership

[55]《中国传感器(技术,产业)发展蓝皮书》,中国仪器仪表行业协会传感器分会、中国仪器仪表学会传感器分会、中国仪器仪表学会仪表元件分会、传感器国家工程研究中心,第十六届全国敏感元件与传感器学术会议,2020。

[56]详见《大国产业链》之“第十四章 汽车:从大国到强国”,中金公司研究部、中金研究院,中信出版社,2023年。

[57]https://www.nvidia.com/en-us/omniverse/solutions/digital-twins/

[58]Abramson J, Adler J, Dunger J, et al. Accurate structure prediction of biomolecular interactions with AlphaFold 3, 2024.

[59]Sora官网. https://openai.com/index/sora/

[60]Francois Chollet X账号。

[61]Yann LeCun X账号。

[62]Yanamandra, Kaushik, et al. “Reverse engineering of additive manufactured composite part by toolpath reconstruction using imaging and machine learning.” Composites Science and Technology 198 (2020): 108318.

[63]Kim, Seung Wook, et al. "Learning to simulate dynamic environments with gamegan." Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2020.

[64]Yanamandra K, Chen G L, Xu X, et al. Reverse engineering of additive manufactured composite part by toolpath reconstruction using imaging and machine learning, 2020.

[65]Azriel, Leonid, et al. A survey of algorithmic methods in IC reverse engineering, 2021.

[66]Ren, F., Aliper, A., Chen, J. et al. A small-molecule TNIK inhibitor targets fibrosis in preclinical and clinical models, 2024.

[67]Rammer, Christian, Gastón P. Fernández, and Dirk Czarnitzki, Artificial intelligence and industrial innovation: Evidence from German firm-level data, 2024.

[68]The Committee for the Prize in Economic Sciences in Memory of Alfred Nobel, Economic Growth, Technological Change, and Climate Change, 2018.

[69]Branstetter, Lee, Chirantan Chatterjee, and Matthew J. Higgins, Generic competition and the incentives for early-stage pharmaceutical innovation, 2022.

[70]Aghion, Philippe, et al., Competition and innovation: An inverted-U relationship, 2005.

[71]诺思、托马斯 著,厉以平等 译:西方世界的兴起,华夏出版社,1999年出版。

[72]袁峰:专利制度的历史变迁——一个演化论的视角,中国人民大学出版社,2021年出版。

[73]杨延超,人工智能对知识产权法的挑战[J]. 治理研究,2018。Picht P G, Freund B. Competition (law) in the era of algorithms,2018;付娜,毕春丽。开源软件与标准协同发展中的知识产权问题研究[J]. 信息通信技术与政策,2023。

[74]Arrow, Kenneth Joseph. Economic welfare and the allocation of resources for invention. Macmillan Education UK, 1972.

[75]也称专利流氓。主要表现为滥用专利诉讼权利,以获取不正当经济利益。比如,通过收购劣质专利,再以起诉或以诉讼相威胁,向其他使用其专利的企业实施敲诈,以获取巨额和解费或赔偿金。蔡元臻,美国专利蟑螂的新近立法评析及其启示[J].知识产权,2021,(1): 66-76。

[76]指在专利系统中,由于专利技术的重叠性和技术被多个主体拥有,导致专利的应用和创新被阻碍的一种现象。这种现象通常与高科技产业紧密相关,如半导体、生物技术、计算机软件和互联网等领域。袁晓东,侯帆.专利丛林:内涵、测量与解决机制[J].知识产权,2019,(6): 58-65。

[77]指那些没有实际贡献或价值,对社会和市场秩序无益的专利,可能会造成社会资源浪费。樊耀峰,崔越.垃圾专利的鉴定、成因与对策[J].经济研究导刊,2011,(31): 91-93。

[78]指的是拥有垄断地位的单个专利权人在专利有效期内对专利产品收取过高价格的行为。丁茂中.论专利高价许可的反垄断规制[J].知识产权,2016,(3): 70-75。

[79]张平。“互联网开放创新的专利困境及制度应对”知识产权,4(2016):83-88。

[80]国家知识产权局 https://cpquery.cponline.cnipa.gov.cn/ 谷歌有限责任公司于2018年5月提交了“基于注意力的序列转换神经网络”的发明专利申请(申请号:201880007309X),截至2024年5月,该申请已发布驳回决定,案件状态为“等待前置审查返回”。谷歌有限责任公司于2018年10月提交了“基于关注的图像生成神经网络”的发明专利申请(申请号:2018112704649),2024年3月12日该专利的发明授权被公告。

[81]https://supreme.justia.com/cases/federal/us/573/208/

[82]https://www.bitlaw.com/source/cases/patent/Trinity.html

[83]USPTO将AI专利分为知识处理、语言技术、AI硬件、进化计算(如遗传算法)、自然语言处理、机器学习、机器视觉、计划控制等八类,每个专利可能属于多类。

[84]https://www.businessinsider.com/google-patents-weapon-ai-competitors-openai-chatgpt-2023-5

[85]Rammer C, Fernández G P, Czarnitzki D. Artificial intelligence and industrial innovation: Evidence from German firm-level data, 2022.

[86]Babina, Tania, et al., Artificial intelligence, firm growth, and product innovation, 2024.

[87]详见《大国产业链》之“第七章 产业链纵横与双支柱举国体制”,中金公司研究部、中金研究院,中信出版社,2023年。

[88]详见《大国产业链》之“第七章 产业链纵横与双支柱举国体制”,中金公司研究部、中金研究院,中信出版社,2023年。

[89]https://www.businessinsider.com/chatgpt-may-hurt-googles-ad-business-former-exec-says-report-2022-12

[90]https://www.forbes.com/sites/richardnieva/2023/02/08/google-openai-chatgpt-microsoft-bing-ai/?sh=d287dfc4de4f

[91]https://www.uspto.gov/learning-and-resources/newsletter/inventors-eye/patent-trial-and-appeal-board-who-are-they-and-what

[92]https://hbr.org/2022/08/big-tech-has-a-patent-violation-problem

[93]2023年12月,《纽约时报》起诉OpenAI和微软,指责对方未经许可使用其数百万篇文章来训练AI大模型,侵犯了其作品的版权https://www.nytimes.com/2023/12/27/business/media/new-york-times-open-ai-microsoft-lawsuit.html

[94]Executive Order on Preventing Access to Americans’ Bulk Sensitive Personal Data and United States Government-Related Data by Countries of Concern, 2024.

本文摘自:2024年6月29日已经发布的《第六章 产业AI化的双刃剑效应及应对分析》

谢超 分析员 SAC 执证编号:S0080520100001 SFC CE Ref:BTM576

陈显帆 分析员 SAC 执证编号:S0080521050004 SFC CE Ref:BRO897

邓学 分析员 SAC 执证编号:S0080521010008 SFC CE Ref:BJV008

裘孝锋 分析员 SAC 执证编号:S0080521010004 SFC CE Ref:BRE717

白皓 联系人 SAC 执证编号:S0080122080037

李根 分析员 SAC 执证编号:S0080523030009 SFC CE Ref:BUO963

郭威秀 分析员 SAC 执证编号:S0080521120004 SFC CE Ref:BSI157

王梓琳 分析员 SAC 执证编号:S0080523080005

张杰敏 联系人 SAC 执证编号:S0080122120010

鲁烁 联系人 SAC 执证编号:S0080122080590

孟辞 联系人 SAC 执证编号:S0080123100107

任丹霖 分析员 SAC 执证编号:S0080518060001 SFC CE Ref:BNF068

常菁 分析员 SAC 执证编号:S0080518110003 SFC CE Ref:BMX565

张嘉祺 联系人 SAC 执证编号:S0080123030040

厍静兰分析员SAC 执证编号:S0080522080010

崔力丹 联系人 SAC 执证编号:S0080123070118

贾雄伟 分析员 SAC 执证编号:S0080518090004 SFC CE Ref:BRF843

海量资讯、精准解读,尽在新浪财经APP

VIP课程推荐

加载中...

APP专享直播

1/10

热门推荐

收起
新浪财经公众号
新浪财经公众号

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)

股市直播

  • 图文直播间
  • 视频直播间

7X24小时

  • 07-11 科力装备 301552 --
  • 07-01 乔锋智能 301603 26.5
  • 06-26 键邦股份 603285 18.65
  • 06-24 安乃达 603350 20.56
  • 06-17 爱迪特 301580 44.95
  • 新浪首页 语音播报 相关新闻 返回顶部