【西部计算机】(深度)寒武纪:AI芯片开拓者,软硬件协同构筑核心竞争力

【西部计算机】(深度)寒武纪:AI芯片开拓者,软硬件协同构筑核心竞争力
2024年07月25日 11:20 市场资讯

  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!

特别声明

特别声明《证券期货投资者适当性管理办法》、《证券经营机构投资者适当性管理实施指引(试行)》于2017年7月1日起正式实施。通过新媒体形式制作的本公众号推送信息仅面向西部证券的专业投资者。若您并非西部证券的专业投资者。请取消关注本公众号,不再订阅、接收或使用本公众号中的任何推送信息。因本公众号受限于访问权限的设置,若给您造成不便,烦请谅解!感谢您给予的理解与配合。

核心观点:我们预测公司有望在2024年-2026年分别实现营业总收入13.44亿元、22.44亿元、33.48亿元,对应当前PS为77.2x、46.2x、31.0x。首次覆盖给予“增持”评级。

· 公司成立以来,专注于人工智能芯片产品的研发与技术创新。

公司向客户提供云边端一体、软硬件协同、训练推理融合、具备统一生态的系列化AI芯片产品,先后推出了用于终端场景的寒武纪1A、寒武纪1H、寒武纪1M系列智能处理器,基于思元100、思元270、思元290芯片和思元370的云端智能加速卡系列产品,以及基于思元220芯片的边缘智能加速卡。此外,公司新一代的云端智能芯片思元590芯片也正在快速迭代中。公司相关产品多次中标各地智能算力基础设施项目。

· 公司作为芯片公司,重视软件平台生态的打造。

在芯片设计日趋成熟的情况下,与AI芯片相匹配的软件平台,是各厂商竞争的关键领域。公司推出Cambricon NeuWare软件开发平台和MagicMind推理加速引擎等配套软件,支撑客户便捷地开展智能算法基础研究、开发各类人工智能应用产品,帮助客户以较低的开发成本将模型部署到公司产品上。公司对软件平台开发持续投入,有望提升实际计算性能,强化在AI芯片领域的核心竞争力。

· 以运营商和国内互联网厂商为代表的需求端正在加速建设AI算力,有望推动国产加速卡在推理场景率先放量。

我们认为:运营商和国内互联网厂商的持续部署,有助于支撑生成式AI应用落地,从而在实际运用中不断对国产加速卡的推理性能迭代升级,促进推理场景下国产加速卡加速放量。

在这一过程中,公司作为AI芯片设计领域的开拓者,有望在软硬件的协同发展下,塑造自身的核心竞争力,实现新的突破。

             关键假设             

(1)智能计算集群系统:将公司自研的加速卡或训练整机产品与合作伙伴提供的服务器设备、网络设备与存储设备结合,并配备公司的集群管理软件组成数据中心集群。考虑到国内智算中心建设不断推进,预计2024年-2026年收入增速分别为95%、70%、50%;考虑到智能计算集群系统业务的主要产品为AI芯片及加速卡,存在一定的壁垒,而且随着规模的扩大,部分零部件的采购价有望下降,因此或使得毛利率有望相对上升,预计2024年-2026年毛利率分别为71.5%、71.9%、72.2%。

(2)云端产品线:包括云端智能芯片及加速卡和训练整机产品。我们认为:随着互联网厂商加速投入生成式AI,来自互联网厂商的需求有望增加,从而带动云端产品线持续增长。预计2024年-2026年收入增速分别为65%、50%、45%;考虑到云端产品线以AI芯片及加速卡的形式交付,与智能计算集群系统业务类似,存在壁垒且随着出货量增加,成本有望降低,预计2024年-2026年毛利率分别为61.8%、62.3%、62.8%。

(3)边缘产品线:公司边缘计算产品主要在智能制造、智能零售、智能教育、智能家居、智能电网等场景落地,预计2024年-2026年收入增速分别为8%、6%、4%;边缘侧公司的竞争壁垒不如云端明显,同赛道厂商较多,因此在竞争格局恶化的情况下,毛利率或有小幅下降,预计2024年-2026年毛利率分别为55.1%、54.2%、53.3%。

             区别于市场的观点            

市场的观点是:在海外高性能算力暂时满足需求的情况下,国产推理芯片会以更稳健的方式提高渗透率。

我们认为:

(1)需求端:随着国内生成式AI模型训练算力的逐步提高,模型参数量会持续上升,八卡消费级GPU服务器或将无法满足生成式AI模型的推理需求。在存量高性能算力有限,增量高性能算力优先满足训练需求的情况下,模型厂商有望在推理场景增加对国产推理芯片的使用。

(2)供给端:先进的海外高性能算力供给存在一定的限制,为国产推理芯片的放量提供了可能性。

             股价上涨催化剂             

国内AI算力基础设施投入超预期;生成式AI训练和推理算力需求超预期。

             估值与目标价             

我们预计:公司有望在2024年-2026年分别实现营业总收入13.44亿元、22.44亿元、33.48亿元,对应当前PS为77.2x、46.2x、31.0x。根据前瞻产业研究院的数据,预计2024年国内人工智能芯片市场规模将突破1000亿元,2027年市场规模将达到2881.9亿元。我们认为:考虑到公司作为国产AI芯片供应商所具有的稀缺性,以及国内生成式AI算力需求的可持续增长,公司可享受一定的估值溢价。首次覆盖给予“增持”评级。

下游需求不及预期;人工智能技术落地和商业化不及预期;产业政策转变;宏观经济不及预期。

一、国产AI芯片龙头,生成式AI引领需求上升

1.1 深耕算力领域,长期布局AI芯片研发

中科寒武纪科技股份有限公司成立于2016年,专注于人工智能芯片产品的研发与技术创新,致力于打造人工智能领域的核心处理器芯片。公司向客户提供云边端一体、软硬件协同、训练推理融合、具备统一生态的系列化AI芯片产品和平台化基础系统软件,支撑客户便捷地开展智能算法基础研究、开发各类人工智能应用产品。

公司成立以来,先后推出了用于终端场景的寒武纪1A、寒武纪1H、寒武纪1M系列智能处理器,基于思元100、思元270、思元290芯片和思元370的云端智能加速卡系列产品,以及基于思元220芯片的边缘智能加速卡。同时,公司也先后中标南京智能计算中心项目(一期)智能计算设备、沈阳市汽车城新型基础设施建设项目、浙东南数字经济产业园数字基础设施提升工程(一期)项目等智能算力基础设施项目。此外,公司与阿里巴巴等头部互联网企业在搜索推荐等领域展开合作,与浪潮信息等服务器厂商建立了合作关系。

通用型智能芯片(AI芯片)及其基础系统软件的研发是复杂的系统工程,其中处理器微架构与指令集两大类技术属于底层核心技术。公司在智能芯片领域掌握了智能处理器微架构、智能处理器指令集、SoC芯片设计、处理器芯片功能验证、先进工艺物理设计、芯片封装设计与量产测试、硬件系统设计等七大类核心技术;在基础系统软件技术领域掌握了编程框架适配与优化、智能芯片编程语言、智能芯片编译器、智能芯片数学库、智能芯片虚拟化软件、智能芯片核心驱动、云边端一体化开发环境等七大类核心技术。

公司重视智能芯片和基础系统软件领域的专利布局,在智能处理器微架构、编程框架适配 与优化等领域均取得了多项专利。截至2023年12月31日,公司共取得专利1164项,其中发明专利1092项。

公司自2021年以来营业收入保持稳健,2023年实现营业收入7.09亿元,同比减少2.70%,归母净利润-8.48亿元,亏损同比收窄32.47%,利润情况有所改善。2024年一季度,受到市场波动的影响,公司营业收入为0.26亿元,同比下降65.91%,归母净利润-2.27亿元,亏损同比收窄11.12%。

1.2 生成式AI驱动,国产加速卡有望在推理场景率先放量

OpenAI于2022年11月推出生成式AI应用ChatGPT,在不到两个月的时间内,月活跃用户数突破1亿人。以ChatGPT为代表的生成式AI应用快速迭代、落地,模型训练、推理的算力需求逐渐显现。随着生成式AI模型参数和Token数量不断增加,模型单次推理所需的算力持续攀升。同时,ChatGPT、Gemini、Kimi等聊天机器人的用户数逐步上升,Microsoft Copilot、Adobe Firefly、WPS AI等办公助手持续落地,用户侧的流量不断上升,推理算力需求有望高速增长。

目前生成式AI模型仍处于快速迭代,各厂商相互追赶的阶段,随着模型性能的逐步稳定和应用的陆续落地,算力的推理需求或将超过训练需求。根据施耐德电气的测算,到2028年人工智能的推理负载有望占比达到85%。生成式AI模型的推理需求与训练需求对算力的要求存在差异:训练需求通常对显存大小、显存带宽和外部通信接口带宽有较高的要求,而推理需求主要要求算力和显存达到平衡,算力和显存越大,推理的并发数越多。

量化技术(Quantization)是决定生成式AI推理成本的关键因素。模型量化指的是通过降低网络模型参数数值表示所需的位宽,在不影响模型任务性能情况下达到降低精度和内存容量的效果。深度神经网络模型存在参数冗余的问题,所有参数均使用32位浮点型数值(FP32),但神经网络模型实际使用的精度远不到FP32所表示的范围。如果针对低位宽的数值计算进行优化,使用低数值进行大规模矩阵运算,模型推理过程会有明显的加速效果。假设将一个参数全部是FP32的神经网络的权值和激活值全部量化到16位整型数值(INT16)或8位整型数值(INT8),其内存占用和精度理论上均可减少至原先的四分之一,如果部署的处理器低精度运算较快,则能够有效加速推理过程。

量化技术的快速发展,为国产推理算力的放量提供了技术基础。人工智能模型的量化技术从最初的FP16量化快速发展到目前应用最成熟的FP8量化,再到正在进一步研究中的FP4量化,呈现出数据精度逐步降低,显存使用不断减少的趋势。我们认为:这一趋势有助于国产算力通过增加低精度计算单元,以及优化运行库、算子库等方式,以较成熟的制程工艺实现可用的推理算力。

国产加速卡快速发展,已在推理和部分训练场景下落地,未来有望迎来重大发展机遇。以Kimi和WPS AI为代表的C端和B端应用陆续落地,国内的推理算力需求正在快速上升。衡量算力大小的维度不仅包括集群峰值算力的大小,也要考虑到算力在实际部署中的使用效率和优化程度。实际可使用的算力是工程化的结果,涉及从芯片到开发工具包的多个层次,对算力提供者的工程能力及案例经验都有要求。我们认为:国产加速卡在多个推理场景下的部署,有助于国产算力厂商迭代优化自身产品,根据实际需求优化芯片设计及对应的开发工具包,加速形成软硬件一体的开发生态。

以运营商和国内互联网厂商为代表的需求端正在加速建设AI算力,有望推动国产加速卡在推理场景率先放量。2023年以来,通信运营商加速部署推理和训练算力。在新建成的AI算力基础设施中,国产加速卡的比例较高,中国移动智算中心(呼和浩特)部署的AI加速卡国产化率超85%,中国联通则基于华为昇腾AI基础软硬件在北京建立了的全国产化的智算中心。2023年,百度订购了200台服务器,搭配1600块昇腾910B。我们认为:运营商和国内互联网厂商的持续部署,有助于支撑生成式AI应用在国内落地,从而在实际运用中不断对国产加速卡的推理性能迭代升级,促进推理场景下国产加速卡加速放量。

二、云边端产品体系完善,软硬件协同形成竞争优势

2.1 产品体系不断扩增,满足不同应用场景需求

公司能为云端、边缘端、终端提供全品类系列化智能芯片和处理器产品,是同时具备人工智能推理和训练智能芯片产品的企业,也是国内少数具有先进集成电路工艺(如7nm)下复杂芯片设计经验的企业之一。

公司于2018年发布第一款云端智能芯片—思元100,经过多次产品迭代,于2021年推出思元370系列智能加速卡。以思远370 X8加速卡为例,其配置双芯思元370,提供,同时提供丰富的FP16、BF16等多种训练精度。同时MLU370-X8搭载MLU-Link多芯互联技术,每张加速卡可获得200GB/s的通讯吞吐性能,是PCIe 4.0带宽的3.1倍,支持单机八卡部署,可高效执行多芯多卡训练和分布式推理任务。此外,公司新一代的云端智能芯片思元590芯片也正在快速迭代中。

公司同样重视边缘侧的推理需求,于2019年推出专门用于边缘计算应用场景的加速卡—思元220。思元220寒武纪MLUv02架构,集成4核ARM CORTEX A55,LPDDR4x内存及丰富的外围接口,既可以作为AI加速协处理器,也可以使用其实现SOC方案。思元220 M.2加速卡具备8TOPS的理论峰值性能(INT8),功耗仅为8.25W,能够实现各种业务的边缘端智能化解决方案。

2.2 重视软件平台开发,软硬件协同创造竞争力

公司作为芯片公司,同样重视软件平台生态的打造。通过对软件平台生态进行持续研发投入,打造了功能较完整、普适性较好的软件开发平台,支撑了公司各产品线的客户交付和商业应用,助力开发者在相关智能芯片产品上进行应用开发,并形成了一定的开发者影响力。

公司推出了Cambricon NeuWare软件开发平台,采用训推一体架构,可同时支持云、边、端的全系列产品。公司的终端IP、边缘端芯片、云端芯片共享同样的软件接口和完备生态,方便进行应用的开发、迁移和调优。NeuWare包括:为用户提供了编译、调试、分析和运行基于BANG架构的工具集CNToolkit,以及涵盖算子库、推理引擎和通讯库等在内的加速库。

公司还推出了MagicMind推理加速引擎,MagicMind是业界首个基于MLIR图编译技术并达到商业化部署能力的推理引擎,支持跨框架的模型解析、自动后端代码生成及优化,使得用户能够将训练好的模型,以较低的开发成本快速部署到公司的全系列产品上。

此外,公司还致力于与AI框架和开源生态系统的整合,以便更好地支持MLU硬件平台。公司于2024年5月开源了跨平台AI编译器前端项目Triton-Linalg,该项目将Triton语言转换为Linalg语言,以支持寒武纪硬件后端作为Triton编译器的前端表示,能够有效帮助开发者降低硬件适配的难度与成本。

我们认为:在芯片设计日趋成熟的情况下,与AI芯片相匹配的软件平台,是各厂商竞争的关键领域。公司对软件平台开发持续投入,有望提升实际计算性能,强化在AI芯片领域的核心竞争力。

三、盈利预测与估值分析

我们认为:随着生成式AI模型训练和推理算力需求的持续上升,面向生成式AI模型训练和推理的算力基础设施有望加速建设,其中:

(1)智能计算集群系统:将公司自研的加速卡或训练整机产品与合作伙伴提供的服务器设备、网络设备与存储设备结合,并配备公司的集群管理软件组成数据中心集群。考虑到国内智算中心建设不断推进,预计2024年-2026年收入增速分别为95%、70%、50%;考虑到智能计算集群系统业务的主要产品为AI芯片及加速卡,存在一定的壁垒,而且随着规模的扩大,部分零部件的采购价有望下降,因此或使得毛利率有望相对上升,预计2024年-2026年毛利率分别为71.5%、71.9%、72.2%。

(2)云端产品线:包括云端智能芯片及加速卡和训练整机产品。我们认为:随着互联网厂商加速投入生成式AI,来自互联网厂商的需求有望增加,从而带动云端产品线持续增长。预计2024年-2026年收入增速分别为65%、50%、45%;考虑到云端产品线以AI芯片及加速卡的形式交付,与智能计算集群系统业务类似,存在壁垒且随着出货量增加,成本有望降低,预计2024年-2026年毛利率分别为61.8%、62.3%、62.8%。

(3)边缘产品线:公司边缘计算产品主要在智能制造、智能零售、智能教育、智能家居、智能电网等场景落地,预计2024年-2026年收入增速分别为8%、6%、4%;边缘侧公司的竞争壁垒不如云端明显,同赛道厂商较多,因此在竞争格局恶化的情况下,毛利率或有小幅下降,预计2024年-2026年毛利率分别为55.1%、54.2%、53.3%。

针对公司所处的AI芯片设计领域,我们根据主营业务相似度,选取海光信息(主营业务为研发、设计和销售应用于服务器、工作站等计算、存储设备中的高端处理器)、龙芯中科(主营业务为处理器及配套芯片的研制、销售及服务)作为同行业可比公司。截至2024年7月23日,上述两家同行业可比公司2024年-2026年PS均值分别为:35.18x、25.50x、19.54x。

我们预计:公司有望在2024年-2026年分别实现营业总收入13.44亿元、22.44亿元、33.48亿元,对应当前PS为77.2x、46.2x、31.0x。根据前瞻产业研究院的数据,预计2024年国内人工智能芯片市场规模将突破1000亿元,2027年市场规模将达到2881.9亿元。我们认为:考虑到公司作为国产AI芯片供应商所具有的稀缺性,以及国内生成式AI算力需求的可持续增长,公司可享受一定的估值溢价。首次覆盖给予“增持”评级。

四、风险提示

下游需求不及预期。下游客户分布在多个行业,需求的影响因素多。若下游客户需求量不及预期,将影响行业的收入和利润。

人工智能技术落地和商业化不及预期。从长期看,以人工智能技术为支撑的公司需要以事实证明其现阶段的成长潜力,若不能及时将技术转化为长期壁垒和现金流回报,可能影响后续市场对人工智能领域的关注和信心。

产业政策转变。生成式人工智能模型的训练需要算力和数据支持,前期投入巨大,需要相关产业政策予以倾斜,若产业政策方向发生转变,可能影响关键领域的技术突破。

宏观经济不及预期。宏观经济影响居民消费,若经济增速放缓,可能导致居民消费信心下降,消费需求受到抑制,相关人工智能业务或将承压。

             分析师声明             

             免责声明             

证券研究报告《寒武纪(688256.SH)首次覆盖--AI芯片开拓者,软硬件协同构筑核心竞争力》

对外发布时间:2024年7月24日

对外发布机构:西部证券研究发展中心

参与人员信息:

分析师:郑宏达 

执业编号:S0800524020001

邮箱:zhenghongda@research.xbmail.com.cn

在任何情况下,本公众号所载的观点、结论和建议仅供投资者参考之用,并非作为购买或出售证券或其他投资标的的邀请或保证。客户不应以本公众号取代其独立判断或根据本报告做出决策。该等观点、建议并未考虑到获取本报告人员的具体投资目的、财务状况以及特定需求,在任何时候均不构成对客户私人投资建议。投资者应当充分考虑自身特定状况,并完整理解和使用本公众号内容,不应视本公众号为做出投资决策的唯一因素,必要时应就法律、商业、财务、税收等方面咨询专业财务顾问的意见。西部证券以往相关研究报告预测与分析的准确,不预示与担保本公众号及西部证券今后相关研究报告的表现。对依据或者使用本公众号及西部证券其他相关研究报告所造成的一切后果,西部证券及作者不承担任何法律责任。

本公众号版权仅为西部证券所有。未经公司书面许可(金麒麟分析师),任何机构或个人不得以翻版、复制、发表、引用或再次分发他人等任何形式侵犯本公众号版权。如征得西部证券同意进行引用、刊发的,需在允许的范围内使用,并注明出处为“西部证券研究发展中心”,且不得对本公众号进行任何有悖原意的引用、删节和修改。如未经西部证券授权,私自转载或者转发本公众号,所引起的一切后果及法律责任由私自转载或转发者承担。西部证券保留追究相关责任的权力。本公司具有中国证监会核准的“证券投资咨询”业务资格,经营许可证编号为:91610000719782242D。

海量资讯、精准解读,尽在新浪财经APP
ai芯片 推理 AI 芯片 云端

VIP课程推荐

加载中...

APP专享直播

1/10

热门推荐

收起
新浪财经公众号
新浪财经公众号

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)

股市直播

  • 图文直播间
  • 视频直播间

7X24小时

  • 07-26 龙图光罩 688721 18.5
  • 07-23 博实结 301608 44.5
  • 07-22 力聚热能 603391 40
  • 07-15 绿联科技 301606 21.21
  • 07-11 科力装备 301552 30
  • 新浪首页 语音播报 相关新闻 返回顶部