来源:远川研究所
在全球算力需求持续提升,AI驱动新型计算架构层出不穷的大背景下,可扩展开源芯片架构RISC-V正在迅速走向万众瞩目的舞台中央。
RISC-V作为一种开源的CPU指令架构,自2010年在加州大学伯克利分校诞生以来,就得到了学术和产业界的一致推崇。
在X86和ARM相继占据主流的世界里,它代表的是一股新兴的开放且独立的力量,正逐渐成为“第三极”。
从2015年RISC-V国际基金会成立(RVI),2017年首次进入中国,2019年国内领先公司发布RISC-V IP产品,到2021年RISC-V芯片产品陆续发布,2022年从端到云的各类Linux发行版陆续支持、Google Android接纳RISC-V架构,2023年国内外陆续发布服务器类的芯片产品。
过去的10年时间,RISC-V架构以一种完全超出预期的速度发展,而更为重要的是中国的力量在其中发挥重要的作用。
在刚刚结束的WAIC2024上,就有一场名为《“智”由“芯”生——RISC-V和生成式AI》的论坛,数位国内外RISC-V行业领军人物一同探讨了在AI爆发的浪潮下,RISC-V为何会趁势成为继X86、ARM之外的第三大架构,其中,就有知合计算CEO孟建熠博士。
孟建熠博士,从2003年开始从事自主指令集CPU研发工作,2017年开始从事RISC-V架构的研发,曾担任阿里平头哥副总裁,现任知合计算CEO,同时也是中国RISC-V标准工作委员会候任轮值主席。
在论坛后,新硅对孟博士进行了一次专访,他表示:“RISC-V出生在新型计算架构爆发的时代,它始于CPU盛于AI,而把它推到‘未来主流计算架构’这一地位的根本原因,是它正在改变处理器架构的生产关系。”
我们和孟博士独家访谈了两个小时,其实只想尝试得到一个问题的答案:
国产RISC-V处理器在AI浪潮下的机会到底在哪?
01
生产关系变革的力量
对于绝大多数行业来说,每当生产关系发生改变,整个生态中上下游玩家的身份往往会发生翻天覆地式的变化。
最为我们所熟知的,是互联网时代平台经济的诞生,从而促使个体户成为供给者的门槛被无限降低,打开一台电脑就能成为淘宝商家、拥有一部手机就能直播带货。
这种类似的变革在芯片发展史上已经发生过多次,其中较为大家熟悉的便是X86架构和ARM架构的兴起。
20世纪80年代初期,PC时代方兴未艾。市场上存在大量不同标准的个人电脑,例如Apple机、TRS-80机、日本的PC-9801机等,各自搭载不同架构的处理器,自成体系。
1981年,IBM发布搭载Intel首款X86架构处理器的IBM PC并大获成功,次年,IBM携产品成功之势,公开了IBM PC上除BIOS之外的全部技术资料,制定了一个开放标准,从而使得不同厂商的标准部件可以互换。
“开放标准”这种全新的生产关系推动了PC产业的繁荣,也一举将与之绑定的X86架构推成PC时代主流。
时间来到上世纪90年代,当时Intel等科技公司都是自己设计处理器核与芯片,但ARM推出了一种新的模式——设计IP核并授权给这些公司,自己并不设计芯片。
“IP授权”模式极大的降低了芯片公司设计高端芯片的难度,当时间进入21世纪,随着移动互联网时代的到来,芯片行业被再一次改变生产关系,成功让ARM架构在移动设备上大获成功,并促使了一大批基于ARM架构的移动时代巨头诞生,比如高通、苹果、联发科等。
而在芯片生产领域,台积电的崛起也诠释了生产关系变革对产业的重大影响。
上世纪80年代,当时的芯片生产模式以IDM(Integrated Device Manufacture)模式为主,也就是从设计到制造、封测全部由一家企业完成,这意味着只有摩托罗拉、Intel、德州仪器这样的巨头才能够参与到“芯片游戏”中。
1987年,张忠谋创立台积电,并力排众议确立了纯代工(Foundry)的模式,不参与芯片设计,而是以中立的产业定位为所有客户提供制造、封测等需要重资产投入的服务,创造了“Fabless + Foundry”的全新生产关系。
这种全新的生产关系让越来越多的无晶圆芯片设计商能够以轻资产的方式参与到“芯片游戏”中,大幅提升了芯片产业的创新活力。
在这些涌入的新“玩家”中,不乏苹果、高通等日后的芯片巨头。可以说“Fabless + Foundry”模式开启了芯片生产的全新时代。
而当下,孟建熠认为AI时代带来的全新应用需求,正在芯片产业催生一次全新的生产关系变革。
此前X86占据PC大部分市场,而ARM在移动时代成为霸主,在这两个领域基本上都是上游的芯片来定义下游产品。整个产业的逻辑往往是软件基于硬件开发,应用在软硬件的限制下进行开发。
可在如今摩尔定律发展趋缓的时代,上游芯片反过来是被下游软件所影响的。AI浪潮刚刚兴起的时候,产业仍然使用独立的CPU或者GPU,在之前软硬件框架的限制下进行应用层面的开发。
然而,随着AI发展进入全新阶段,越来越多的应用开发者/公司希望能够反过来定义上游的软硬件产品,获得最适合应用的软硬件产品。
比如英伟达的Grace Hopper超级芯片,结合超大型模型需求,打破了CPU到CPU的边界,形成了以并行计算为中心的新型计算架构。
比如Google的TPU,正是Google从其实际应用场景出发,由下而上定义的AI加速硬件。
再比如,随着大模型爆发式的发展,不少芯片初创企业瞄准了大模型推理场景中传统GPU无法满足的独特需求,推出了Groq、Sohu等针对大模型推理的专用芯片,实现了十几倍乃至数十倍于现有GPU产品的性能提升。这些都是应用需求反过来定义上游软硬件产品的体现。
今天我们所看到针对AI应用层出不穷的GPGPU、DSA、ASIC等,都是在这种概念下而诞生的,下游的AI应用已经开始追求更加适合自己的专用芯片,生产关系的转变几成定势。
而这种转变,实际上代表着一次生产关系的重大需求,在X86和ARM架构无法进行深度定制化,以及缺乏公有或可对外授权的GPU架构的语境中,厂商会自发的寻求一种可接受高度自定义的架构,将现有的架构揉碎了再组装出新的架构。
RISC-V的开源特性,自此迎来了机会。
02
开源和生态协同的力量
RISC一词最早可以回溯到1981年——这一年加州大学伯克利分校教授David Patterson和他的博士生一起提出了RISC(精简指令计算机)概念,并因此获得了图灵奖。
在RISC理念的大旗下,斯坦福的MIPS、Sun公司的SPARC、DEC的Alpha等陆续对CISC(复杂指令计算机)架构阵营——尤其是Intel的X86架构——发起长达几十年的对抗。
最终,获得最大战果的是凭借智能终端逆袭的ARM架构。
2010年,伯克利的另一位教授Krste Asanović筹备一个开源芯片架构,David Patterson加入合作——由于这是Patterson教授基于RISC理念的第五代项目,因此最终的成果被命名为了RISC-V。
这一指令集旗帜鲜明地拥抱开源——任何人都能基于RISC-V指令集设计、制造和销售芯片,不需要获得授权。
与之相比,Intel的X86架构完全封闭,同属RISC阵营的ARM架构在使用时,则需要向ARM公司缴纳不菲的授权费用。
此前,X86和ARM架构经过很长时间的发展,软件和硬件都已经开始独立构成生态,软件越来越脱离于硬件而独立发展,而硬件依托于摩尔定律的前进提升性能。
近年来摩尔定律的发展跟不上上层软件对算力的需求,使得算力领域突显出瓶颈,越来越多的人开始通过创新软硬件的体系来获得10倍以上的性能提升。
孟建熠认为,开源的RISC-V架构是一个允许扩展的架构,开发人员可以通过优化架构和指令,并开发相应的软硬件协同加速的新型处理器,有望得到性能的大幅提升。
开源的特性,使得软硬件协同设计成为可能,而生态,则决定了RISC-V架构是否能长久的生存下去。
业内闻名的芯片架构师Jim Keller最近就公开表示:“开源总是胜利的。当许多人合作时,创新就会蓬勃发展。RISC-V 将成为下一代架构的标准。”
对于生态的力量,孟建熠早在中天微工作时就有了充分的认识。
杭州中天微成立于2001年,创始人便是浙江大学教授、目前担任知合计算董事长的严晓浪教授。当时,中天微选了一条十分艰巨的路:做自主指令集架构。
而当中天微的CPU成功量产进入商业化落地阶段,不得不“单打独斗”自建生态成为孟建熠至今难以忘记的经历:
“当时因为缺乏生态的支持,去推广自主指令集的处理器,就好比去一个新地方跑业务,发现连路都没有修好,要推广得先自己修路,那真的是非常痛苦。”
彼时,认识到共建生态重要性的孟建熠便选择了投身RISC-V架构的研发与生态建设。而产业生态的逐渐繁荣,也是他敢于开启RISC-V芯片创业的一个重要的先决条件。
RISC-V生态发展力量异常强劲,RISC-V基金会在2015年之时仅有17家会员,到2023年底之时就已经达到了4,037家;在目前21家RISC-V基金会Premier Members中,中国公司占到7家。
过去几年,阿里达摩院对RISC-V生态的贡献极大,不仅推出了全系列的稳定可靠的玄铁系列处理器,让RISC-V更加普及,而且投入大量的精力推动了软件生态的成熟。
2023年底Google宣布安卓支持RISC-V,成为业界的里程碑事件,而阿里是这一进程的最大的推手,累计进行了12万余行代码的修改,发挥了核心作用。
这些生态积累,也让RISC-V得以从更成熟的终端嵌入式场景逐渐向更高性能、云端场景扩展,当然开发难度也水涨船高,RISC-V下阶段的发展,就需要进一步突破对生态有引领性的标杆产品。
孟建熠在加入知合计算后,将产品的方向指向了AI高性能可扩展处理器这一最难啃的领域。
在孟建熠看来,要让RISC-V架构的“能力圈”能够触达更高性能需求的场景,需要生态里的伙伴共同努力,去针对这些更高算力的需求场景,围绕高性能、灵活扩展性两个方向进行联合攻关,这恰是知合计算的核心技术发展方向。
在AIGC浪潮出现的前后,全球科技大厂不约而同地在实现更高性能的AI处理器上做了广泛的探索,一个结果便是各类“xPU”几乎要占掉字母表。
在孟建熠看来,未来一定会有一个大家公认的新型计算架构来统一生态,而RISC-V是最接近业界共识的一位选手。
“我们要为RISC-V生态进一步突破确立一个标杆”, 孟建熠这样描绘知合的“野心”。这是一个需要耐心的事业,显然他们做好了准备。
以下为访谈全文:
新硅: 您认为RISC-V架构现在发展到了什么阶段?
孟建熠:
我认为,在应用市场强驱动的情况下,一个架构从诞生到形成成熟的生态并实现大规模落地,通常需要10年以上的时间。对于RISC-V架构而言,其发展的驱动力毫无疑问是AI。
而在以AI应用驱动RISC-V架构发展这条路上,我们已经走了5年多的时间,这段时间里其实阿里做得非常好,不仅在国内领先,在国际上也有很大的影响力,阿里的IP已经逐步被生态接受了。
经过5年多的发展,目前RISC-V架构所处的阶段恰好是最关键的一步,那就是在应用核心需求上确立标杆企业和产品。
对于AI而言,就是“高性能”。RISC-V架构需要往更高性能的方向去进步,以标杆产品为核心,构建广度和深度更大的生态。
新硅:您曾经提过自己始终看好RISC-V这个领域,坚定走这条路是什么原因呢?
孟建熠:
RISC-V的开源特性以及巨大的生态潜力,是我坚持RISC-V必将成功的信心所在,这是全球处理器架构正在走的一条新路。
我想用一个轨道交通系统的比喻来解释架构、生态和应用场景的关系——架构本身就是一段段轨道,应用场景就像是一个个需要通轨交的商圈和居民区,架构的应用落地其实就是以轨道联通不同的商圈和居民区,最后形成的轨交网络就是生态。
当前已经形成成熟生态的X86和ARM,便是已经建成的轨交网络。当你试图用X86架构或者ARM架构去落地一个新的AI应用场景时,相当于你需要铺设新的轨道将一个新的商区和原有的轨交网络连接。
然而,此时你会面临两个问题:首先X86和ARM的生态特点意味着你对于轨道铺设是没有决定权的。
其次,由于这两个生态最初是基于PC和移动两个应用领域而诞生的,所以他们现有的网络可能离你很远,你需要很高的花费才能连接上。
而RISC-V的开源特性则给了一个全新的选择。每个商圈和居民区都能够参与轨道的规划和铺设,这意味着我们可以没有历史包袱地构造一个最高效匹配AI应用的生态。
而巨大的生态潜力则意味着我们无需依靠一家或者少数几家企业去铺设从主干道到辅路的整个轨道网络,而是不同的生态合作者共同协作,每个人向轨道网络贡献自己最擅长的技术,一起去完成一个高效、先进的轨道网络。
新硅:所以开源和生态就是RISC-V架构现在被行业看好的原因吗?还有其它什么力量推动它成熟吗?
孟建熠:
实际上包括开源和生态在内,还有第三种力量,就是芯片设计行业的生产关系正在发生改变。
我就举两个例子,第一个例子其实就是台积电。台积电开创了“Fabless + Foundry”的模式。
相较于以Intel为代表的重资产投入的IDM模式,台积电让无晶圆设计公司以轻资产的形式参与芯片产品开发成为可能,也让流片、封装等后端环节变成了标准的服务,大大降低了芯片开发的成本。
这种生产关系的变化一下子解放了芯片产业的创造力和生产力,并在台积电的下游由大量Fabless公司形成了庞大的生态。
这种类似的变革也发生在X86架构和ARM架构上。
1981年,IBM发布搭载Intel首款X86架构处理器的IBM PC并大获成功,次年,IBM携产品成功之势,公开了IBM PC上除BIOS之外的全部技术资料,制定了一个开放标准,从而使得不同厂商的标准部件可以互换。
“开放标准”这种全新的生产关系推动了PC产业的繁荣,也一举将与之绑定的X86架构推成PC时代主流。
时间来到上世纪90年代,当时Intel等科技公司都是自己设计处理器核与芯片,但ARM推出了一种新的模式——设计IP核并授权给这些公司,自己并不设计芯片。
“IP授权”模式极大的降低了芯片公司设计高端芯片的难度,当时间进入21世纪,随着移动互联网时代的到来,芯片行业被再一次改变生产关系,成功让ARM架构在移动设备上大获成功,并促使了一大批基于ARM架构的移动时代巨头诞生,比如高通、苹果、联发科等。
到了AI时代,面对应用场景远比PC和移动设备丰富的情况,应用端已经产生了对新的生产关系的需求雏形,那就是自应用侧由下而上定义软硬件开发。
Google针对其AI计算需求定制专用TPU芯片就是很好的例子。而在我看来,完成这一全新的生产关系变革的答案就是RISC-V。
首先,RISC-V特别容易被人接纳,经过这几年的发展,基于RISC-V开发应用已经不需要从零开始了。RISC-V已经形成了基本的生态,有些基本的学习成本也已经投入进去了,后续可以不用重复投入学习成本。
其次,RISC-V的开源特性,大家可以自由地基于自己的需求由下而上去定义硬件。而不用像以前一样,等着英特尔和ARM去做适配。
而生态层面,则让应用侧在做创新硬件的时候可以依靠生态合作伙伴进一步简化创新过程,以更低的成本获取所需的创新硬件。
新硅:那么在AI时代,RISC-V的产品的最终形态是怎样的?比如X86在PC上,ARM在手机上。
孟建熠:
很多人都问我这个问题,目前还比较难回答,就像AI会用到什么地方一样难回答。因为在AI时代,算力并不会具象到某一种单独的计算设备上,而是可能以各种形态存在于云端、边缘端和终端设备中。
所以,我认为RISC-V现在还处于渗透阶段,依靠AI原生的优势在各种AI算力的部署场景中进行渗透。RISC-V当前已经在CPU领域证明了自己,技术已经相对比较成熟。
但随着AI应用的发展和变化,应用对于不同算力架构的需求正不断变大,如果把AI算力归纳成一个更大的架构概念,那么必然是需要开源的,其存在的形态一定是多样化的。
新硅:在RISC-V的生态里,您会给知合定位在什么位置?他会在这个产业上的哪个节点去起到推动作用?
孟建熠:
我给知合的定位,就是聚焦AI智算、高性能、可扩展的标杆产品,做RISC-V下一阶段发展的标杆企业。
正如我在刚才的访谈中提到的,我相信RISC-V是芯片产业新生产关系变革的答案。而知合所做的事情就是利用RISC-V架构去支持广大AI应用开发者实现自下而上定义的软硬件协同开发。
过去我们一直在推动RISC-V生态不断突破,今天我们要继续把旗子竖到更高的地方去,用有竞争力的产品让合作伙伴与我们一起去做RISC-V的生态扩张。这是开源带来的价值,这也是我们提供的价值。
新硅:知合计算这个名字是咋来的。
孟建熠:
知这个字,通假智慧的智,我们就说知合计算,就是“智能融合计算”。它的Logo中融合着AI的元素。
另一方面也有文化维度,知行合一,技术为体,商业为用。
新硅:您认为知合最大的竞争优势会在什么地方?
孟建熠:
我觉得知合的优势总结起来就是三个关键词——人才、国际化、生态影响力。
我们的人才拥有强大的软硬件开发综合能力,也拥有国际化生态运营的能力。我们与国际合作伙伴良好的关系让我们的贡献能够更容易被生态所接受。
在一个生态为重的环境中,获得生态的优先支持对于我们做移植和优化很关键。生态接受移植的意愿越高,意味着实际落地成本越低,而应用越多,我们的贡献就更容易成为事实标准。
总结来说其实就是知合有能力去更快地将自身的产品与技术形成标准化的准则。产品交付就是最大的竞争力,我们知道要去跟谁合作,能够很快的做出生态影响力,或者说知道在哪个地方去做生态,这套体系我们比较熟。
新硅:如果知合要树一杆旗,这面旗上会绣什么呢?
孟建熠:
技术领先。
没有技术领先,生态就对你没有感知度。我们要做的事,是进入RISC-V的无人区,带领大家去探索RISC-V新高度,我们要为行业定一个性能上的标杆。
全文完。
作者:张泽一
编辑:戴老板
视觉设计:疏睿
责任编辑:张泽一
(声明:本文仅代表作者观点,不代表新浪网立场。)