源达研究报告：Gemini 1.0有望拉动新一轮AI产业革新，算力产业链受益确定性强_新浪财经

　　炒股就看金麒麟分析师研报，权威，专业，及时，全面，助您挖掘潜力主题机会！

　　来源：源达

　　Gemini 1.0有望拉动新一轮AI产业革新，算力产业链受益确定性强 ——人工智能专题研究系列三

　　投资要点

谷歌发布Gemini 1.0，多方面性能得分超过GPT-4

　　2023年12月6日谷歌发布大语言模型Gemini 1.0。该模型具备原生多模态特性，可以实现对文本、图像、视频和音频等多模态信息的无缝理解和操作，有望使大模型在更多行业内得到应用。模型共有Ultra、Pro和Nano三个版本，支持不同应用场景使用。通过谷歌官网的技术报告，Gemini 1.0在多方面的能力测评中得分均要高于GPT-4，该模型的推出标志着AI技术已达到更先进的水平。我们认为谷歌推出Gemini 1.0将拉动AI产业新一轮竞争和革新的序幕，增强ChatGPT等其他AI厂商的竞争意识，利好AI产业长期发展。

关注算力产业链机会，核心芯片国产化率亟待突破

　　AI产业发展的前提是算力建设，建议关注AI算力产业链的相关机遇。AI芯片的数量决定AI大模型的算力。以Nvidia H100为例，在我们测算下一个日均访问量在12亿次（3亿人访问×访问4次）的AI大模型对GPU的需求在13889台。在美国出口管制情况下芯片国产化日益迫切，目前寒武纪等国内公司的下一代人工智能芯片研发进展顺利，而华为打造的昇腾AI生态致力于从算力、存力、互联技术和计算架构等方面为世界提供第二选择，打造算力坚实底座。

高速光模块需求加快放量，国产公司在全球份额领先

　　AI大模型中东西向流量大幅增加，更适配叶脊网络架构，将会显著增加400G/800G等高端光模块的用量。以Nvidia DGX H100网络架构为例，一个4-SU单元的Nvidia DGX H100网络架构中GPU、800G光模块和400G光模块的用量比约是1：1.5：1。目前国产光模块已在全球市场中占有较高份额，2022年全球光模块企业TOP10中有7家中国企业，并在400G/800G高速光模块和CPO/LPO等前沿技术上布局领先。

投资建议

　　1）光模块：AI产业拉动高速光模块需求，建议关注：中际旭创、新易盛等；

　　2）光芯片：光芯片决定光通信效率和稳定性，25G及以上光芯片国产化率仍有较大提升空间，建议关注：源杰科技等。

　　3）AI芯片：人工智能芯片是构成AI模型算力的关键，建议关注：寒武纪等。

风险提示

　　AI技术发展不及预期，AI商业化推进不及预期，中美贸易摩擦加剧，国产化及市场开拓不及预期。

　　一、事件：谷歌推出Gemini 1.0，多方面性能表现优于GPT-4

　　2023年12月6日谷歌发布大语言模型Gemini 1.0。该模型为多模态模型，可支持文本、图片、视频和音频的输入，并输出文本和图片。模型共有三个版本：

Gemini Ultra：性能最强，可完成推理及多模态任务。模型可在TPU加速器上运行；
Gemini Pro：在平滑成本和延迟性基础上可完美完成多个任务，在推理和多模态任务中表现优异；
Gemini Nano：用于移动设备运行的大模型。该模型具有1.8B（Nano-1）和3.25B（Nano-2）两个版本，供高/低内存设备使用。

图1：Gemini 1.0是多模态模型，支持文本、视频、图像和音频输入及文本和图像输出

资料来源：谷歌官网，源达信息证券研究所

图2：Gemini 1.0各个版本间的性能对比

资料来源：谷歌官网，源达信息证券研究所

　　Gemini 1.0具备原生多模态特性。Gemini 1.0可以实现对文本、图像、视频和音频等多模态信息的无缝理解和操作。下文图示中，Gemini 1.0实现了图像识别、图像对应代码的推理、按照要求生成子图并重新排列及对于输出图像进行抽象推理等任务，可以生动体现出Gemini 1.0的多模态特性。

图3：Gemini 1.0具备原生多模态特性，可根据图表推理代码，并重新排列生成子图

资料来源：谷歌官网，源达信息证券研究所

　　Gemini 1.0的多模态特性可以对图像和文本进行理解和联想，并输出图像和文本。示例1中Gemini 1.0根据题目举例及指定的绿色和粉色纱线，创作出了对应的牛油果和兔子玩偶；此外示例2中Gemini 1.0还可以完成对数学几何题的解答。通过以上示例，均可看出Gemini 1.0具备优质的多模态特性。

图4：Gemini 1.0按照要求完成纱线玩偶的创作

图5：Gemini 1.0完成对数学几何题的解答

资料来源：谷歌官网，源达信息证券研究所

　　通过各个方面的能力对比，Gemini Ultra的得分均超过GPT-4。首先是MMLU（大模型的多任务语言理解能力测评），Gemini Ultra的得分是90.04%，而人类专家的得分仅为89.8%；此外在GSM8K（小学数学问题数据集）、数学、代码等方面Gemini 1.0均有较好表现，在现有大模型中得分第一。仅在HellaSwag（检测常识推理能力）上得分为87.8%，低于GPT-4的95.3%。

图6：Gemini 1.0在多方面的能力测评中得分均超过GPT-4等其他大模型

资料来源：谷歌官网，源达信息证券研究所

　　Gemini 1.0将推动AI行业发展。Gemini 1.0具备原生多模态特性，有望推动AI大模型在更多行业的渗透和应用。此外通过谷歌官网技术报告，Gemini 1.0在多层次能力测评中的得分均要高于GPT-4，该模型的推出标志着AI技术已达到更先进的水平。我们认为谷歌推出Gemini 1.0将拉动AI产业新一轮竞争和革新的序幕，增强ChatGPT等其他AI厂商的竞争意识，利好AI产业长期发展。从中短期来看，算力仍是发展AI产业的首要基础，建议关注AI算力产业链的相关机遇。

　　二、算力产业链：芯片是算力核心构成，期待国产化进展

　　人工智能芯片是AI算力的核心构成。目前主流的AI芯片中GPU占据绝对百分比，根据IDC数据，2022年GPU在中国人工智能芯片市场中占有率为89%。根据我们测算，假设国内每日访问单个语言大模型的人数达到3亿的情况下，对GPU需求台数为13889块。

基本假设：

假设每日人均访问次数为4次/人，单个问题的运算量为2PFlop/s；
假设采用的AI芯片为Nvidia H100，根据Nvidia官网资料，该芯片在FP32/FP16精度工况下的算力为2PFlop/s；
假设芯片每日工作24小时，折算下为86400s。

　　表1：语言大模型访问量对GPU需求量测算

访问人数（亿人）	1	2	3	4	5
访问次数（次/人）	4	4	4	4	4
访问量（亿次）	4	8	12	16	20
单个问题运算量（PFlop/s）	2	2	2	2	2
所需算力（E+8PFlop/s）	8	16	24	32	40
芯片算力（PFlop/s）	2	2	2	2	2
每日工作时间（s）	86400	86400	86400	86400	86400
GPU需求量（块）	4630	9259	13889	18519	23148

　　资料来源：Nvidia官网，OpenAI，源达信息证券研究所测算

　　Nvidia H100是目前最先进的人工智能芯片。2023年3月22日Nvidia推出新款人工智能芯片GPU H100，与公司上一代产品A100相比性能得到大幅提升，在主流AI和HPC模型中，采用InfiniBand互连技术的H100性能最高可达A100的30倍。

图7：Nvidia GPU H100芯片示意图

图8：H100较A100相比在性能上有大幅提升

精度工况	A100	H100 SXM5
FP32/FP16	312/624	1000/2000
FP16/FP16	312/625	1000/2001
FP32/FP8	/	2000/4000

资料来源：Nvidia，源达信息证券研究所

　　国产AI芯片短板明显，下一代产品推进顺利。我们通过对国内寒武纪、华为昇腾和沐曦等国产公司旗（金麒麟分析师）下的AI旗舰芯片与Nvidia H100 SXM的性能指标对比，可以看到国产AI芯片与Nvidia H100在性能上仍存在较大差距。同时国产芯片公司仍在加快研发推进下一代AI芯片产品，并有望在未来对标Nvidia H100，如寒武纪在研的思元590、沐曦在研的MXC500等。

　　表2：国产AI芯片性能指标仍与国际顶尖水平存在较大差距

公司	Nvidia	寒武纪	华为	沐曦
产品型号	H100 SXM	思元370	昇腾910	曦思N100
FP32	67TFlop/s	24TFlop/s	/	/
FP16	1979TFlops/s	96TFlop/s	320TFlop/s	80TFlop/s
INT8	3958Top/s	256Top/s	640Top/s	160Top/s

　　资料来源：各公司公告，源达信息证券研究所

　　美国对AI芯片出口管制，自主可控要求下国产芯片需求迫切。2022年10月7日美国商务部工业安全局（BIS）发布《美国商务部对中华人民共和国（PRC）关于先进计算和半导体实施新的出口管制制造》细则，其中管制物项3A090、4A090包含高性能AI芯片产品，而Nvidia A100和H100均符合管制要求。在此背景下，Nvidia推出性能阉割的中国特供版芯片A800和H800。我们认为在国内自主可控大背景下，国内AI产业对国产芯片需求迫切，或加大对国产芯片公司支持力度，国产AI芯片有望迎来技术进步和市场机遇。

　　表3：BIS禁令限制高性能AI芯片向中国出口

管制物项

管制范围

3A090

1、输入输出（I/O）双向传输速度高于600GB/s；

2、算力性能与精度指令比特长度乘积超过4800

4A090

1、含有超过3A090技术指标芯片的计算机、电子组件和相关部件

　　资料来源：美国商务部，源达信息证券研究所

　　华为打造算力坚实底座，AI产品生态持续健全。华为致力于打造昇腾AI产业生态，目前昇腾AI基础软硬件平台的产品矩阵包括Atlas系列硬件、异构计算架构CANN、全场景AI框架昇思MindSpore、昇腾应用使能MindX以及一站式开发平台ModelArts等。上述产品已实现从算力、存力、互联技术和计算架构等方面为世界提供第二选择，打造算力坚实底座。

　　图9：华为昇腾AI基础软硬件平台产品矩阵

　　资料来源：《加速行业智能化白皮书》，源达信息证券研究所

　　三、算力产业链：高速光模块加快放量，国产厂商有望充分受益

　　高算力需要与高效传输架构相匹配。AI大模型通常由多个服务器作为节点，并通过高速网络架构组成集群合作完成模型训练。因此在模型中东西向流量（数据中心服务器间的传输流量）大幅增加，而模型训练过程中南北向流量（客户端与服务器间的传输流量）较少，由于叶脊网络架构相较传统三层架构更适用于东西向流量传输，成为现代数据中心主流网络架构。

图10：AI大模型中东西向流量显著增加

图11：叶脊网络架构适用于东西向流量传输

资料来源：华为云，源达信息证券研究所

资料来源：鹅厂网事，源达信息证券研究所

　　叶脊网络架构大幅增加对光模块数量需求。由于叶脊网络架构中东西向流量大，因此服务器与交换机相连均需使用光模块，从而大幅增加对光模块数量需求。同时AI大模型的高流量对带宽提出更高要求，800G光模块相较200G/400G光模块具有高带宽、功耗低等优点，有望在AI大模型网络架构中渗透率提升。

　　表4：叶脊网络架构对光模块数量需求大幅提升

架构类型	传统三层架构	改进等三层架构	叶脊网络架构
光模块相对于机柜倍数	8.8	9.2	44/48

　　资料来源：中际旭创定向增发募集说明书，源达信息证券研究所

　　我们以Nvidia DGX H100 网络架构为例。该架构适配Nvidia H100 GPU，采用叶脊网络架构，分为1-4个SU单元类型（8个GPU组成一个H100服务器节点，32个服务器节点组成一个SU单元）。其中4-SU单元架构由127个服务器节点组成（其中一个节点用于安装UFM网络遥测装置），具有1016个H100 GPU、32个叶交换机、16个脊交换机。

　　表5：Nvidia DGX H100 架构所需GPU、交换机数量

　　资料来源：Nvidia，源达信息证券研究所

　　我们以Nvidia DGX H100架构为例测算GPU与光模块的对应数量。在4-SU的Nvidia DGX H100架构中，每32台服务器节点组成一个SU单元，并与8台叶交换机相连，因此服务器节点与叶交换机之间共有1024个连接（32×8×4）；32台叶交换机需分别与16台脊交换机相连，因此叶交换机与脊交换机之间共有512个连接（32×16）；

　　在Nvidia DGX H100的目前方案中，脊-叶连接采用800G光模块，需要1024个800G光模块；叶-服务器连接中，每个服务器节点通过一个800G光模块与两台叶交换机向上连接，需要512个800G光模块（128×4），同时每台叶交换机通过一个400G光模块与一个服务器节点连接，需要1024个400G光模块（128×8）。综上计算得一个4-SU单元的DGX H100架构需要1016个GPU、1536个800G光模块、1024个400G光模块，GPU：800G光模块：400G光模块的比例约等于1：1.5：1。

　　图12：Nvidia DGX H100 架构示意图

　　资料来源：Nvidia，源达信息证券研究所

　　国产光模块厂商在2022年全球光模块企业TOP10排名中占据7席。TOP10中国内企业为中际旭创（Innolight）、华为（Huawei）、光迅科技（Accelink）、海信（Hisense）、新易盛（Eoptolink）、华工正源（HGG）、索尔思光电（已被华西股份收购）。而在高端光模块领域，中际旭创已在2022年实现800G光模块批量出货。

　　表6：中际旭创在2022年全球光模块企业排名中位居第一

2018	2021	2022
Finisar	Ⅱ-Ⅳ&Innolight	Innolight&Coherent
Innolight	Ⅱ-Ⅳ&Innolight	Innolight&Coherent
Hisense	Huawei（HiSilicon）	Cisco（Acacia）
Accelink	Cisco（Acacia）	Huawei（HiSilicon）
FOIT（Avago）	Hisense	Accelink
Lumentum/Oclaro	Broadcom（Avago）	Hisense
Acacia	Eoptolink	Eoptolink
Intel	Accelink	HGG
Aoi	Molex	Intel
Sumitomo	Intel	Source Photonics

　　资料来源：Light counting，源达信息证券研究所

　　四、建议关注

　　1．中际旭创

　　中际旭创是全球光模块行业的领军企业，并持续拓展高速光模块产品。公司于2020年推出首个800G光模块产品，并积极布局CPO和LPO等新技术。在AI算力建设加速情况下，公司已成为北美重点客户的高速光模块的长期供货商。截至2023年前三季度，公司实现营收70.30亿元，同比增长2.41%；归母净利润12.96亿元，同比增长52.01%。营收增速放缓系受传统电信行业的需求减弱拖累，公司归母净利润的快速增长系高速光模块保持放量趋势，产品结构优化及费用和成本的持续有效管控带来的。

图13：中际旭创2018-2023年前三季度营收情况	图14：中际旭创2018-2023年前三季度归母净利润情况

资料来源：Wind，源达信息证券研究所	资料来源：Wind，源达信息证券研究所

　　2．新易盛

　　公司是全球光模块行业的领先企业，2022年在全球光模块企业TOP10中排名第7。公司积极布局前沿产品，2019年即实现400G光模块的批量出货，2020年推出800G光模块样品，并已具有基于硅光基数的400G、800G光模块和产品和基于LPO技术的800G光模块产品，有望充分受益算力建设浪潮。截至2023年前三季度，公司实现营收20.87亿元，同比下降13.56%；归母净利润4.30亿元，同比下降43.66%。业绩出现下滑系传统电信行业的需求不佳所致，期待公司后续高速光模块产品的放量及相关订单兑现。

图15：新易盛2018-2023年前三季度营收情况	图16：新易盛2018-2023年前三季度归母净利润情况

资料来源：Wind，源达信息证券研究所	资料来源：Wind，源达信息证券研究所