天风·海外 | 展望Gemini 2/GPT Next,从Intelligence Per Token到Intelligence

天风·海外 | 展望Gemini 2/GPT Next,从Intelligence Per Token到Intelligence
2024年08月15日 07:39 天风研究

  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!

我们认为从Intelligence Per Token到Inlligence Per Task的模型变化是重要方向。1)训练阶段,大模型训练预计继续遵循“Scaling Law”。2)推理阶段,我们认为树状搜索/自博弈等方式有望快速提升Intelligence Per Token,我们看好在计算阶段GPU与CPU的高速互联。

模型架构之变:回应AI应用的六千亿美元之问

GPU投入与AI商业化收入之差--AI商业化的六千亿美元之问:

红杉认为,如果GPU在大模型训练的投入有商业化回报,那么英伟达数据中心年化1500亿美元收入应该对应着6000亿美元的终端市场。AI应用如何达到六千亿美元的市场规?

对于六千亿问题的三种最常见的回答:

1)“成熟度曲线”:大模型存在大量的前置投入

2)“Scaling Law”:大模型随着不断更大规模训练将会实现更强能力

3)加速计算/“AI+”:GPU已经在推荐算法等领域替代和加速传统CPU工作负载

与市场普遍观点不同,我们认为2024年模型架构的变化将成为最重要的变化,模型架构变化有望带来的能力进步将直接打开大模型应用的更广阔空间。

模型架构之变:Google Gemini2——添加AlphaGo/AlphaZero规划能力

模型架构之变:OpenAI——“Q*”与“Strawberry”强化记忆与规划能力

回顾大模型1.0时代:Intelligence Per Token

大语言模型训练——“Scaling Law”不断进行更大规模的模型训练,降低Next token predicion loss;硬件的耦合程度较高,数据并行、张量并行、流水线并行,形成万卡GPU互联集群。大语言模型推理--不断降低单token成本,计算复杂度和Token序列长度继续严格相关;不同难度和导向的任务都通过

Prompt token和大模型完成交互。

记忆——LLM token序列存储在HBM

规划——模型本身能力与简单的CoT

协作——Chatbot

展望大模型2.0时代:Intelligence Per Task

对于新一代2.0时代的大模型,我们认为他将成为“自我优化能力的智能体”

“慢思考”——人类在面对困难问题时通常会花更多时间思考,以更可靠地改进决策。理论上,通过在推理时应用额外的计算量,LLM能够超越其原本训练的水平。

随着推理token与预训练token的比率增加,在简单问题上,推理计算将会更优;对于难题或在推理时计算需求较高的情况下,增加预训练计算可能更有效地提高性能。

展望大模型2.0时代:CPU与GPU互联或成为模型效率焦点

“AlphaGO+大模型”的计算消耗我们认为更有可能接近推荐算法与排序算法

AlphaGO”架构中的MCTS需要大量CPU与GPU的共同计算:

在常规学习中,我们通常会考虑几个关键点:状态(state)和动作(action)。在进行仿真时,我们需要判断每个当前节点是否需要仿真。

首先,需要判断当前节点是否为叶子(金麒麟分析师)节点。如果是叶子节点,我们需要检查它的探索次数是否为零。如果该节点尚未被探索过,那么它就可以作为初始节点开始仿真。仿真过程会根据整个状态的累计值进行,从开始状态到结束状态。这一过程涉及对每一步状态的累积计算。

第二部分是在使用蒙特卡罗方法进行仿真时,通过强化学习的价值函数或价值网络来预估状态的迁移过程及其总价值。

在典型的AlphaGeometry实验中,CPU Worker超过100,000个,配合四个V100 GPU,实现接近人类奥林匹克奖牌水平。

类似于推荐算法超大集群中CPU处理稀疏特征,GPU处理稠密特征,瓶颈往往在互联。我们认为CPU、GPU互联或成为最重要的变化。

投资建议

1)训练阶段,大模型训练预计继续遵循“Scaling Law”。云、创业公司、主权AI将继续大量采购算力并建设数据中心,追求继续提升Intelligence Per Token,预计全球训练集群将持续扩容,

在训练集群超过10万片GPU后,对数据中心的建造、部署、供电、互联构成新挑战。计算密度、互联密度、功率散热密度与存储密度将有望快速提升。

2)推理阶段,我们认为树状搜索/自博弈等方式有望快速提升Intelligence Per Token,我们看好在计算阶段GPU与CPU的高速互联。以及在应用阶段,我们认为模型新架构带来的规划能力逐步提高;数学、代码与通用能力也将逐步提升。

我们建议关注标的:NVDA MSFT GOOG AMD ARM CFLT ESTC

风险提示行业竞争加剧;AI发展与需求不及预期;产品交付不及预期。

海量资讯、精准解读,尽在新浪财经APP
gpu 推理 AI cpu 美元

VIP课程推荐

加载中...

APP专享直播

1/10

热门推荐

收起
新浪财经公众号
新浪财经公众号

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)

股市直播

  • 图文直播间
  • 视频直播间

7X24小时

  • 08-23 益诺思 688710 --
  • 08-19 佳力奇 301586 --
  • 08-15 小方制药 603207 12.47
  • 08-13 太湖远大 920118 17
  • 08-12 国科天成 301571 11.14
  • 新浪首页 语音播报 相关新闻 返回顶部