源达研究报告:Gemini 1.0有望拉动新一轮AI产业革新,算力产业链受益确定性强

源达研究报告:Gemini 1.0有望拉动新一轮AI产业革新,算力产业链受益确定性强
2023年12月12日 15:22 市场资讯

  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!

  来源:源达

  Gemini 1.0有望拉动新一轮AI产业革新,算力产业链受益确定性强 ——人工智能专题研究系列三

  投资要点

  • 谷歌发布Gemini 1.0,多方面性能得分超过GPT-4

  2023年12月6日谷歌发布大语言模型Gemini 1.0。该模型具备原生多模态特性,可以实现对文本、图像、视频和音频等多模态信息的无缝理解和操作,有望使大模型在更多行业内得到应用。模型共有Ultra、Pro和Nano三个版本,支持不同应用场景使用。通过谷歌官网的技术报告,Gemini 1.0在多方面的能力测评中得分均要高于GPT-4,该模型的推出标志着AI技术已达到更先进的水平。我们认为谷歌推出Gemini 1.0将拉动AI产业新一轮竞争和革新的序幕,增强ChatGPT等其他AI厂商的竞争意识,利好AI产业长期发展。

  • 关注算力产业链机会,核心芯片国产化率亟待突破

  AI产业发展的前提是算力建设,建议关注AI算力产业链的相关机遇。AI芯片的数量决定AI大模型的算力。以Nvidia H100为例,在我们测算下一个日均访问量在12亿次(3亿人访问×访问4次)的AI大模型对GPU的需求在13889台。在美国出口管制情况下芯片国产化日益迫切,目前寒武纪等国内公司的下一代人工智能芯片研发进展顺利,而华为打造的昇腾AI生态致力于从算力、存力、互联技术和计算架构等方面为世界提供第二选择,打造算力坚实底座。

  • 高速光模块需求加快放量,国产公司在全球份额领先

  AI大模型中东西向流量大幅增加,更适配叶脊网络架构,将会显著增加400G/800G等高端光模块的用量。以Nvidia DGX H100网络架构为例,一个4-SU单元的Nvidia DGX H100网络架构中GPU、800G光模块和400G光模块的用量比约是1:1.5:1。目前国产光模块已在全球市场中占有较高份额,2022年全球光模块企业TOP10中有7家中国企业,并在400G/800G高速光模块和CPO/LPO等前沿技术上布局领先。

  • 投资建议

  1)光模块:AI产业拉动高速光模块需求,建议关注:中际旭创新易盛等;

  2)光芯片:光芯片决定光通信效率和稳定性,25G及以上光芯片国产化率仍有较大提升空间,建议关注:源杰科技等。

  3)AI芯片:人工智能芯片是构成AI模型算力的关键,建议关注:寒武纪等。

  • 风险提示

  AI技术发展不及预期,AI商业化推进不及预期,中美贸易摩擦加剧,国产化及市场开拓不及预期。

  一、事件:谷歌推出Gemini 1.0,多方面性能表现优于GPT-4

  2023年12月6日谷歌发布大语言模型Gemini 1.0。该模型为多模态模型,可支持文本、图片、视频和音频的输入,并输出文本和图片。模型共有三个版本:

  1. Gemini Ultra:性能最强,可完成推理及多模态任务。模型可在TPU加速器上运行;
  2. Gemini Pro:在平滑成本和延迟性基础上可完美完成多个任务,在推理和多模态任务中表现优异;
  3. Gemini Nano:用于移动设备运行的大模型。该模型具有1.8B(Nano-1)和3.25B(Nano-2)两个版本,供高/低内存设备使用。

图1:Gemini 1.0是多模态模型,支持文本、视频、图像和音频输入及文本和图像输出

资料来源:谷歌官网,源达信息证券研究所

图2:Gemini 1.0各个版本间的性能对比

资料来源:谷歌官网,源达信息证券研究所

  Gemini 1.0具备原生多模态特性。Gemini 1.0可以实现对文本、图像、视频和音频等多模态信息的无缝理解和操作。下文图示中,Gemini 1.0实现了图像识别、图像对应代码的推理、按照要求生成子图并重新排列及对于输出图像进行抽象推理等任务,可以生动体现出Gemini 1.0的多模态特性。

图3:Gemini 1.0具备原生多模态特性,可根据图表推理代码,并重新排列生成子图

资料来源:谷歌官网,源达信息证券研究所

  Gemini 1.0的多模态特性可以对图像和文本进行理解和联想,并输出图像和文本。示例1中Gemini 1.0根据题目举例及指定的绿色和粉色纱线,创作出了对应的牛油果和兔子玩偶;此外示例2中Gemini 1.0还可以完成对数学几何题的解答。通过以上示例,均可看出Gemini 1.0具备优质的多模态特性。

图4:Gemini 1.0按照要求完成纱线玩偶的创作

图5:Gemini 1.0完成对数学几何题的解答

资料来源:谷歌官网,源达信息证券研究所

资料来源:谷歌官网,源达信息证券研究所

  通过各个方面的能力对比,Gemini Ultra的得分均超过GPT-4。首先是MMLU(大模型的多任务语言理解能力测评),Gemini Ultra的得分是90.04%,而人类专家的得分仅为89.8%;此外在GSM8K(小学数学问题数据集)、数学、代码等方面Gemini 1.0均有较好表现,在现有大模型中得分第一。仅在HellaSwag(检测常识推理能力)上得分为87.8%,低于GPT-4的95.3%。

图6:Gemini 1.0在多方面的能力测评中得分均超过GPT-4等其他大模型

资料来源:谷歌官网,源达信息证券研究所

  Gemini 1.0将推动AI行业发展。Gemini 1.0具备原生多模态特性,有望推动AI大模型在更多行业的渗透和应用。此外通过谷歌官网技术报告,Gemini 1.0在多层次能力测评中的得分均要高于GPT-4,该模型的推出标志着AI技术已达到更先进的水平。我们认为谷歌推出Gemini 1.0将拉动AI产业新一轮竞争和革新的序幕,增强ChatGPT等其他AI厂商的竞争意识,利好AI产业长期发展。从中短期来看,算力仍是发展AI产业的首要基础,建议关注AI算力产业链的相关机遇。

  二、算力产业链:芯片是算力核心构成,期待国产化进展

  人工智能芯片是AI算力的核心构成。目前主流的AI芯片中GPU占据绝对百分比,根据IDC数据,2022年GPU在中国人工智能芯片市场中占有率为89%。根据我们测算,假设国内每日访问单个语言大模型的人数达到3亿的情况下,对GPU需求台数为13889块。

  • 基本假设:
  1. 假设每日人均访问次数为4次/人,单个问题的运算量为2PFlop/s;
  2. 假设采用的AI芯片为Nvidia H100,根据Nvidia官网资料,该芯片在FP32/FP16精度工况下的算力为2PFlop/s;
  3. 假设芯片每日工作24小时,折算下为86400s。

  表1:语言大模型访问量对GPU需求量测算

访问人数(亿人)

1

2

3

4

5

访问次数(次/人)

4

4

4

4

4

访问量(亿次)

4

8

12

16

20

单个问题运算量(PFlop/s)

2

2

2

2

2

所需算力(E+8PFlop/s)

8

16

24

32

40

芯片算力(PFlop/s)

2

2

2

2

2

每日工作时间(s)

86400

86400

86400

86400

86400

GPU需求量(块)

4630

9259

13889

18519

23148

  资料来源:Nvidia官网,OpenAI,源达信息证券研究所测算

  Nvidia H100是目前最先进的人工智能芯片。2023年3月22日Nvidia推出新款人工智能芯片GPU H100,与公司上一代产品A100相比性能得到大幅提升,在主流AI和HPC模型中,采用InfiniBand互连技术的H100性能最高可达A100的30倍。

图7:Nvidia GPU H100芯片示意图

图8:H100较A100相比在性能上有大幅提升

精度工况

A100

H100 SXM5

FP32/FP16

312/624

1000/2000

FP16/FP16

312/625

1000/2001

FP32/FP8

/

2000/4000

 

资料来源:Nvidia,源达信息证券研究所

资料来源:Nvidia,源达信息证券研究所

  国产AI芯片短板明显,下一代产品推进顺利。我们通过对国内寒武纪、华为昇腾和沐曦等国产公司旗(金麒麟分析师)下的AI旗舰芯片与Nvidia H100 SXM的性能指标对比,可以看到国产AI芯片与Nvidia H100在性能上仍存在较大差距。同时国产芯片公司仍在加快研发推进下一代AI芯片产品,并有望在未来对标Nvidia H100,如寒武纪在研的思元590、沐曦在研的MXC500等。

  表2:国产AI芯片性能指标仍与国际顶尖水平存在较大差距

公司

Nvidia

寒武纪

华为

沐曦

产品型号

H100 SXM

思元370

昇腾910

曦思N100

FP32

67TFlop/s

24TFlop/s

/

/

FP16

1979TFlops/s

96TFlop/s

320TFlop/s

80TFlop/s

INT8

3958Top/s

256Top/s

640Top/s

160Top/s

  资料来源:各公司公告,源达信息证券研究所

  美国对AI芯片出口管制,自主可控要求下国产芯片需求迫切。2022年10月7日美国商务部工业安全局(BIS)发布《美国商务部对中华人民共和国(PRC)关于先进计算和半导体实施新的出口管制制造》细则,其中管制物项3A090、4A090包含高性能AI芯片产品,而Nvidia A100和H100均符合管制要求。在此背景下,Nvidia推出性能阉割的中国特供版芯片A800和H800。我们认为在国内自主可控大背景下,国内AI产业对国产芯片需求迫切,或加大对国产芯片公司支持力度,国产AI芯片有望迎来技术进步和市场机遇。

  表3:BIS禁令限制高性能AI芯片向中国出口

管制物项

管制范围

3A090

1、输入输出(I/O)双向传输速度高于600GB/s;

2、算力性能与精度指令比特长度乘积超过4800

4A090

1、含有超过3A090技术指标芯片的计算机、电子组件和相关部件

  资料来源:美国商务部,源达信息证券研究所

  华为打造算力坚实底座,AI产品生态持续健全。华为致力于打造昇腾AI产业生态,目前昇腾AI基础软硬件平台的产品矩阵包括Atlas系列硬件、异构计算架构CANN、全场景AI框架昇思MindSpore、昇腾应用使能MindX以及一站式开发平台ModelArts等。上述产品已实现从算力、存力、互联技术和计算架构等方面为世界提供第二选择,打造算力坚实底座。

  图9:华为昇腾AI基础软硬件平台产品矩阵

  资料来源:《加速行业智能化白皮书》,源达信息证券研究所

  三、算力产业链:高速光模块加快放量,国产厂商有望充分受益

  高算力需要与高效传输架构相匹配。AI大模型通常由多个服务器作为节点,并通过高速网络架构组成集群合作完成模型训练。因此在模型中东西向流量(数据中心服务器间的传输流量)大幅增加,而模型训练过程中南北向流量(客户端与服务器间的传输流量)较少,由于叶脊网络架构相较传统三层架构更适用于东西向流量传输,成为现代数据中心主流网络架构。

图10:AI大模型中东西向流量显著增加

图11:叶脊网络架构适用于东西向流量传输

资料来源:华为云,源达信息证券研究所

资料来源:鹅厂网事,源达信息证券研究所

  叶脊网络架构大幅增加对光模块数量需求。由于叶脊网络架构中东西向流量大,因此服务器与交换机相连均需使用光模块,从而大幅增加对光模块数量需求。同时AI大模型的高流量对带宽提出更高要求,800G光模块相较200G/400G光模块具有高带宽、功耗低等优点,有望在AI大模型网络架构中渗透率提升。

  表4:叶脊网络架构对光模块数量需求大幅提升

架构类型

传统三层架构

改进等三层架构

叶脊网络架构

光模块相对于机柜倍数

8.8

9.2

44/48

  资料来源:中际旭创定向增发募集说明书,源达信息证券研究所

  我们以Nvidia DGX H100 网络架构为例。该架构适配Nvidia H100 GPU,采用叶脊网络架构,分为1-4个SU单元类型(8个GPU组成一个H100服务器节点,32个服务器节点组成一个SU单元)。其中4-SU单元架构由127个服务器节点组成(其中一个节点用于安装UFM网络遥测装置),具有1016个H100 GPU、32个叶交换机、16个脊交换机。

  表5:Nvidia DGX H100 架构所需GPU、交换机数量

  资料来源:Nvidia,源达信息证券研究所

  我们以Nvidia DGX H100架构为例测算GPU与光模块的对应数量。在4-SU的Nvidia DGX H100架构中,每32台服务器节点组成一个SU单元,并与8台叶交换机相连,因此服务器节点与叶交换机之间共有1024个连接(32×8×4);32台叶交换机需分别与16台脊交换机相连,因此叶交换机与脊交换机之间共有512个连接(32×16);

  在Nvidia DGX H100的目前方案中,脊-叶连接采用800G光模块,需要1024个800G光模块;叶-服务器连接中,每个服务器节点通过一个800G光模块与两台叶交换机向上连接,需要512个800G光模块(128×4),同时每台叶交换机通过一个400G光模块与一个服务器节点连接,需要1024个400G光模块(128×8)。综上计算得一个4-SU单元的DGX H100架构需要1016个GPU、1536个800G光模块、1024个400G光模块,GPU:800G光模块:400G光模块的比例约等于1:1.5:1。

  图12:Nvidia DGX H100 架构示意图

  资料来源:Nvidia,源达信息证券研究所

  国产光模块厂商在2022年全球光模块企业TOP10排名中占据7席。TOP10中国内企业为中际旭创(Innolight)、华为(Huawei)、光迅科技(Accelink)、海信(Hisense)、新易盛(Eoptolink)、华工正源(HGG)、索尔思光电(已被华西股份收购)。而在高端光模块领域,中际旭创已在2022年实现800G光模块批量出货。

  表6:中际旭创在2022年全球光模块企业排名中位居第一

2018

2021

2022

Finisar

Ⅱ-Ⅳ&Innolight

Innolight&Coherent

Innolight

Hisense

Huawei(HiSilicon)

Cisco(Acacia)

Accelink

Cisco(Acacia)

Huawei(HiSilicon)

FOIT(Avago)

Hisense

Accelink

Lumentum/Oclaro

Broadcom(Avago)

Hisense

Acacia

Eoptolink

Eoptolink

Intel

Accelink

HGG

Aoi

Molex

Intel

Sumitomo

Intel

Source Photonics

  资料来源:Light counting,源达信息证券研究所

  四、建议关注

  1.中际旭创

  中际旭创是全球光模块行业的领军企业,并持续拓展高速光模块产品。公司于2020年推出首个800G光模块产品,并积极布局CPO和LPO等新技术。在AI算力建设加速情况下,公司已成为北美重点客户的高速光模块的长期供货商。截至2023年前三季度,公司实现营收70.30亿元,同比增长2.41%;归母净利润12.96亿元,同比增长52.01%。营收增速放缓系受传统电信行业的需求减弱拖累,公司归母净利润的快速增长系高速光模块保持放量趋势,产品结构优化及费用和成本的持续有效管控带来的。

图13:中际旭创2018-2023年前三季度营收情况

图14:中际旭创2018-2023年前三季度归母净利润情况

 

 

资料来源:Wind,源达信息证券研究所

资料来源:Wind,源达信息证券研究所

  2.新易盛

  公司是全球光模块行业的领先企业,2022年在全球光模块企业TOP10中排名第7。公司积极布局前沿产品,2019年即实现400G光模块的批量出货,2020年推出800G光模块样品,并已具有基于硅光基数的400G、800G光模块和产品和基于LPO技术的800G光模块产品,有望充分受益算力建设浪潮。截至2023年前三季度,公司实现营收20.87亿元,同比下降13.56%;归母净利润4.30亿元,同比下降43.66%。业绩出现下滑系传统电信行业的需求不佳所致,期待公司后续高速光模块产品的放量及相关订单兑现。

图15:新易盛2018-2023年前三季度营收情况

图16:新易盛2018-2023年前三季度归母净利润情况

 

 

资料来源:Wind,源达信息证券研究所

资料来源:Wind,源达信息证券研究所

  五、投资建议

  我们认为谷歌推出Gemini 1.0将拉动AI产业新一轮竞争和革新的序幕,增强ChatGPT等其他AI厂商的竞争意识,利好AI产业长期发展。从中短期来看,算力仍是发展AI产业的首要基础,建议关注AI算力产业链的相关机遇:

  1)AI芯片:人工智能芯片是构成AI模型算力的关键,在美国对华出口管制和自主可控背景下,我们认为国产芯片公司有望迎来发展机遇,建议关注:寒武纪等;

  2)光通信模块:AI时代的网络架构对400G/800G等高端光模块用量有望大幅提升,目前国产光模块企业在全球市场中已占据一定市场地位,建议关注:中际旭创、新易盛等;

  3)光芯片:光芯片的性能决定光通信效率和稳定性,25G及以上光芯片国产化率仍有较大提升空间,出于保供考虑光芯片国产化率有望提升,建议关注:源杰科技等。

  六、风险提示

  AI技术发展不及预期;

  AI商业化推进不及预期;

  中美贸易摩擦加剧;

  国产化及市场开拓不及预期。

股市回暖,抄底炒股先开户!智能定投、条件单、个股雷达……送给你>>
海量资讯、精准解读,尽在新浪财经APP

责任编辑:刘万里 SF014

VIP课程推荐

加载中...

APP专享直播

1/10

热门推荐

收起
新浪财经公众号
新浪财经公众号

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)

股市直播

  • 图文直播间
  • 视频直播间

7X24小时

  • 12-18 鼎龙科技 603004 --
  • 12-15 国际复材 301526 --
  • 12-13 宏盛华源 601096 1.7
  • 12-12 西磁科技 836961 8.09
  • 12-12 兴欣新材 001358 41
  • 新浪首页 语音播报 相关新闻 返回顶部