【研报】AI应用专题报告:竞争持续聚焦,终端创新迎来突破

【研报】AI应用专题报告:竞争持续聚焦,终端创新迎来突破
2024年12月08日 08:03 市场资讯

(报告出品方/作者:国泰君安证券,李博伦、伍巍)

1. 投资分析

随着 AI 应用进程提速以及场景落地案例持续涌现,叠加云端应用与终端智 能双轮驱动产业升级,AI 赛道公司迎来重要发展机遇。建议重点关注以下 方向:具备产品力驱动的头部应用企业,尤其是在既有领域已形成技术壁 垒和用户粘性的公司;在云端应用创新和终端智能升级方面具备先发优势 的企业,以及在医疗、金融、教育等高壁垒场景已实现商业化落地的公司; 在中文语料建设领域具备核心技术和资源积累的企业。这些公司将在 AI 应 用生态完善过程中获得持续性竞争优势。

2. 国内 AI 应用加速崛起,AI 出海势头强劲

2.1. 创新赛道蓄势待发,垂类 AI 应用仍处于快速扩张期

中国 AI 软件在全球前十榜单占据二席。以豆包为代表的头部应用月活超 5000 万,显示出较强的用户规模优势。从 AI 产品榜发布的 10 月 AI 应用 MAU 数据看,ChatGPT 以 2.58 亿月活稳居全球榜首,但中国 AI 企业产品 同样表现突出。具体来看:字节跳动旗下豆包以 5130 万月活位居全球第二, 月环比增长 9.10%,领先 Nova 等其他国际竞品;在全球前十榜单中,除豆 包外,Talkie AI(2062 万月活)也成功入榜。在出海赛道,字节跳动布局的 Gauth 表现最为亮眼,月活 1626 万、环比增长 69.22%,体现出中国 AI 企 业在海外市场的强劲拓展势头。

海外 AI 市场创意工具高速增长,头部产品月环比增速超 400%。根据 AI 产 品榜 10 月数据,海外 AI 创意工具赛道呈现爆发式增长:Artrix(AI 艺术生成) 环比增长 401.82%,下载量突破 300 万;SelfyzAI(AI 照片舞蹈)环比增长 183.18%,全球活跃用户达 150 万;Donna(AI 音乐制作)环比增长 136.29%, 月活跃度超 80 万。这一增长态势表明,海外 AI 市场在经过 ChatGPT 等产 品培育后已趋于稳定,用户需求正加速向垂直细分领域延伸。

中国 AI 市场仍处通用平台竞争阶段,头部企业优势明显。AI 产品榜国内 10 月增速数据中,通用 AI 平台主导着国内市场增长,月之暗面的 Kimi 智 能助手以 36.45%的月环比增速位居增长榜首,日活跃用户突破 500 万;紧 随其后的是腾讯元宝(增速 34.39%)和智谱清言(增速 20.59%)。值得注意的 是,抖音系 AI 产品矩阵有星绘、猫箱、豆包三个产品全部进入增速前十, 体现出在国内 AI 市场快速普及阶段,大型科技公司正通过产品创新和规模优势持续扩大市场份额。

AI 应用获客效率呈现明显分化,垂直赛道转化率显著领先。根据 AI 产品 榜最新数据,尽管 ChatGPT 以 4685 万的月新增下载量位居全球榜首,但其 下载量/MAU 比值仅为 18.15%。相比之下,字节跳动旗下 AI 教育产品 Gauth 表现突出,新增下载量/MAU 比值高达 82.29%,充分展现了垂直赛道的高 效获客能力。此外,Remini(41.72%)、Genius(43.55%)等创意工具产品也都 实现了较高的转化效率。

国内 AI 市场呈现双轨发展态势,垂类应用显示出更强劲的增长潜力。 AI 产品榜数据显示,豆包凭借 1611 万新增下载量领跑国内市场,但在转化效 率方面,腾讯元宝(55.43%)、星绘(55.22%)等垂类应用表现更为出色。值得 注意的是,国内前十产品中有半数下载量/MAU 比值高于 30%,其中 Kimi 智能助手达到 45.91%,智谱清言达到 36.62%,表明国内垂类 AI 应用市场 正处于快速扩张期。

2.2. AI 网站出海呈差异化布局,爆款频出

在以 AI 为核心驱动的网站中,ChatGPT 以 37.8 亿月访问量独占鳌头。从 AI 产品榜 10 月数据看,市场呈现明显的分层特征:第一梯队是以 ChatGPT 为代表的纯 AI 对话产品,ChatGPT 月访问量达 37.8 亿,环比增长 17.16%; 第二梯队是搜索引擎的 AI 升级版本,New Bing 以 18.6 亿访问量位居次席, 但需要注意其流量可能包含传统搜索请求;第三梯队包括 Canva(8.17 亿)、 Salesforce(1.14 亿)等传统 SaaS 服务商,但其 AI 功能仅作为附加特性,实际 AI 业务规模需要谨慎评估,榜单中的纯 AI 产品数据更能反映实际的服务 渗透水平。

ChatGPT 凭借产品创新实现了纯 AI 应用领域的重要突破。2024 年 5 月, OpenAI 重磅发布了具备音频和视觉理解能力的 AI 语音助手,同时推出了 最新的旗舰 AI 模型 ChatGPT 4o。在当月,ChatGPT 的访问量出现了显著提 升,一举超越 Bing 成为访问量第一的 AI 相关网站。考虑到 Bing 的访问量 中包含大量传统搜索引擎的流量贡献,ChatGPT 作为纯 AI 原生应用却能实 现对 Bing 的超越,并在此后继续持续增长,快速拉开了与其他产品间的差 距,充分证明了其产品实力和当下无可撼动的市场竞争力。

豆包 AI 凭借强劲增长势头步入国内 ChatBots 第一梯队。根据 AI 产品榜的10 月数据,作为字节跳动旗下的 AI 对话产品,豆包实现了 25.01%的环比 增长,访问量达到 17.13M,增速在头部 AI 产品中位居前列。此前以 Kimi 和文心一言为代表的头部产品分别以 29.28M 和 21.25M 的月访问量占据领 先地位,但其增速分别为 16.63%和 2.86%,相比之下,豆包凭借更快的增 长速度正在快速缩小与头部产品的差距已经成为国内AI对话市场新的重要 竞争者。

中国 AI 企业在出海赛道呈现差异化布局,其中视频生成领域出现突破性增 长。从 AI 产品榜 10 月的 AI 网站出海数据来看,教育和创意工具是中国企 业主攻的两大方向,其中字节跳动旗下 Gauthmath 以 1938 万月访问量位居 榜首。特别值得关注的是视频生成赛道的快速崛起:MiniMax 旗下海螺 AI 凭借生成式视频技术实现环比增长 2772.92%,远超其他出海产品,与同赛 道的 Pika Art(增长 787.65%)一起,显示出 AI 视频生成工具正迎来爆发 期。这一增长态势也反映出海外市场对高质量 AI 视频内容的强劲需求,以 及中国企业在视频生成技术上的竞争优势。不过从整体访问量看,出海产品 的规模仍相对有限,单个产品月访问量均未突破 2000 万,表明市场仍处于 培育期。

MiniMax 通过海螺 AI 在文生视频领域实现技术突破,进军国际第一梯队。 MiniMax 由前字节跳动 AI 实验室负责人创立,核心团队来自 Google、微 软、字节跳动等科技巨头。截至目前已完成多轮融资,投资方包括高瓴创投、 五源资本等知名机构。海螺 AI 依托自研的万亿参数 MoE(混合专家)架构 模型 abab 6.5,实现了 200k tokens 的超长文本处理能力。其视频生成模型 abab-video-1 能够生成 1280×720 分辨率、25 帧每秒、时长 6 秒的高质量视 频,尤其在复杂动态场景渲染和人物动作细节方面表现卓越。在第三方机构 进行的全球独立测试中,海螺AI的画质、流畅性和连贯性评分均位居前列, 标志着中国企业在高端 AI 视频生成领域实现重要突破。公司已开放海螺 AI 的 API 接口,支持开发者将其视频生成和多模态处理能力集成到应用中。

全球市场正经历多个细分赛道的突破性增长。除视频生成工具外,客服机 器人(Chaport,290.76%)、SEO 工具(AISEO,212.29%)等垂直应用也 实现了超 200%的环比增速。相比之下,国内市场呈现出不同的增长特征: 一是增速普遍较低,排名第一的百度搜索 AI 助手增速为 49.94%;二是细分 赛道更加多元,从代码辅助(Marscode,47.13%)到金融服务(同花顺问财, 16.65%)再到设计工具(Pixso AI,12.98%),呈现出场景深耕的发展趋势; 三是头部产品体量普遍较大,如 360AI 搜索(2.88 亿)、Kimi(2928 万) 等,表明国内市场已形成相对稳定的用户规模。

AI 应用的用户粘性与市场规模呈现显著解耦,表明产品力而非用户规模是 决定用户深度参与的关键。从 AI 产品榜发布的 10 月人均时长数据可见, 访问量与用户粘性之间并不存在明显的正相关关系。以 Character AI 为例, 其 2.15 亿月访问量配合 14 分 25 秒的人均使用时长,显示出规模与粘性的 良好平衡;而 Superhuman 虽然月访问量仅为 225 万,却实现了 20 分 53 秒 的高使用时长,位居榜单第二。这种"小而美"与"大而强"并存的现象说明: 第一,AI 应用市场已进入差异化竞争阶段,单一赛道内可以同时存在规模 导向与精品路线;第二,用户规模增长不会自然带来使用时长的提升,产品 是否能提供差异化价值才是核心;第三,某些细分场景(如邮件助手 Superhuman)虽然总盘子较小,但用户需求强度高,更容易培养出高粘性的 核心用户群。

2.3. AI 应用场景各具特色,市场表现悬殊

AI 应用的使用场景决定了其设备端口的流量分布特征。根据 SimilarWeb 数 据,以文档协作和设计为主的 AI 工具如 Notion 和 Canva 呈现出显著的桌 面端偏好,其桌面端占比分别高达 93.5%和 87.3%,这反映了专业生产力工 具对大屏操作和精确控制的刚性需求。相比之下,以社交陪伴为主的 Character AI 则呈现出截然相反的分布特征,其移动端占比达到 80%,说明 休闲娱乐场景更依赖移动设备的便携性和即时性。而 ChatGPT 和 Bing 作为综合性 AI 搜索工具,则在桌面端和移动端之间保持相对均衡的分布,这体 现了通用型 AI 工具需要同时满足用户在不同场景下的使用需求。

AI 搜索引擎中,360AI 搜索依靠持续的技术创新和产品优化确立了行业领 先地位。从 2024 年 1 月公测开始,该产品经历了快速发展,通过不断完善 搜索功能和用户体验,在 7 月份首次超越 Perplexity AI 成为全球 AI 原生搜 索引擎流量第一。产品采用"AI+搜索引擎"而非传统的"搜索引擎+AI"模式, 在专业搜索能力方面建立了明显优势。到 2024 年 8 月,其搜索服务已支持 识别超过 1 亿种意图分类,涵盖 4000 种基础分类和 1000 多种专业领域, 为其保持行业领先地位奠定了坚实基础。

360AI 搜索全新的 CoE 架构部署和多项重要功能升级助力其在 8 月份实现 超 120%的访问量提升。AI 产品榜显示,8 月访问量达到 208.1M,环比增 长 122.26%,月独立访客量(MAU)突破 8000 万。这一增长可能源于两个 关键变化:第一,360AI 搜索于 8 月 1 日宣布与包括智谱 AI、商汤科技等 15 家主流大模型厂商建立合作,构建 CoE 专家网络架构,实现了精准的模 型调度机制;第二,8 月 20 日推出了"简洁回答"、"标准回答"、"深入回答 "三种搜索模式,并支持用户自主选择不同大模型重新生成答案;这些举措 使其进一步拉大与竞品的差距,比如同期秘塔 AI 搜索的 MAU 仅为 2000 万。

虚拟角色类AI产品展现出显著的赢家通吃效应。AI产品榜10月数据显示, 行业龙头 Character AI 以 214.67M 的月访问量遥遥领先于第二名 JanitorAI 的 63.89M,领先优势超过 3 倍。访问量前三名产品(Character AI、JanitorAI 和 SpicyChat AI)的访问量合计占据了该品类前十总流量的 88%,而排名第 6 到第 10 位的产品月访问量均不足 5M,且多数呈现负增长态势。这种极度 集中的流量分布特征表明,AI 角色扮演赛道已经进入存量竞争阶段,头部 效应日益凸显。用户在选择时表现出明显的羊群效应,更倾向于选择用户基 数大、互动体验更丰富的平台,这使得头部产品能够通过规模效应持续扩大 其竞争优势。

AI PPT赛道呈现出独特的地域多元化竞争格局。AI产品榜10月数据显示, 该赛道前五名产品的公司分别来自美国(Gamma)、匈牙利(Prezi)、西班牙 (Slidesgo)、中国(AiPPT)和德国(Pitch)。这种分散的市场格局很可能源于办 公软件的深度本地化需求——不同地域的用户在演示文稿的风格偏好、内 容结构和表达方式上存在显著差异。这一特征使得本地化公司能够依托对 本土文化的深度理解建立差异化优势,从而在全球市场中占据重要位置。这 种多元化的竞争格局表明,AI 办公赛道的成功不仅取决于技术实力,更需 要对用户文化习惯的深度理解。

AI 图片生成市场正上演反直觉的蓝海困局,功能趋同将市场推向红海化。 根据 SimilarWeb 提供的过去半年来的数据,AI 图片生成作为新兴技术市场, 头部平台的竞争却日趋白热化。从头部网站的流量总量看,在过去 6 个月 时间里,AI 图片生成的总量几乎没有增长。产品层面,各平台的功能和应 用场景却在不断趋同,将一个本应充满创新的市场推向红海化。Yodayo 在 5 月初周度 310 万的流量如今只剩 50 万左右,恰恰印证了在缺乏差异化创 新的情况下,即便是处于爆发期的市场,也会对同质化竞争者进行残酷的淘 汰,而过度聚焦用户争夺也可能抑制了根本性创新的动力。

AI 文生视频领域新兴平台异军突起,但产品生命周期短暂、后劲不足的特 征也日益凸显。根据 SimilarWeb 的数据,进入者如 KlingAI 和 HailuoAI 展 现出惊人的增长速度,尤其是 HailuoAI,从 9 月中旬开始迅速崛起,到 11 月初已超越 Loom 成为行业流量冠军,周流量突破 370 万。与此同时,从数 据中可以观察到AI文生视频产品往往在一个大幅提升后容易陷入颓势的特 点,这种现象可能源于 AI 文生视频的商业化价值尚未被充分挖掘,目前用 户多出于追求新鲜感而使用,缺乏持续的使用动力,AI 文生视频在用户留 存和商业化方面仍需进行更深入的探索。

3. AI 场景落地百花齐放,爆款应用异军突起

3.1. 头部玩家齐发力 AI 软件应用,云端应用创新步入快车道

云端 AI 应用在 2024 年迎来重要突破,全球科技巨头纷纷推出创新产品与 解决方案。从产品形态来看,呈现出明显的区域化特征:北美企业专注通用 性能力的突破,如 Microsoft、Anthropic 等推出的新一代企业 AI 工具;欧 洲企业强调合规与安全,以 SAP 为代表的解决方案深度整合行业需求;而 亚太企业则在场景适配方面展现优势,阿里云、字节跳动等在本土化应用层 面取得突破。这种差异化发展趋势,不仅体现在技术路线的选择上,更反映 在商业模式和市场策略的制定中,推动全球云端 AI 应用形成独特的区域竞 争格局。 欧美与中国企业在 AI 办公工具上呈现差异化创新路径,全面重塑企业生产 效率。微软 2024 年 2 月推出的 Microsoft 365 Copilot for Sales 实现了全流程 销售智能化,包括客户意向分析、销售文档生成、商机预测等功能,并通过 与 Dynamics 365 深度整合,打通了销售全链路数据,每用户 50 美元/月的 年费定价反映了其在提升销售效率方面的实际价值。2024 年 10 月 Anthropic 发布的 Claude 3.5 Sonnet 引入了新的计算机使用功能,使得用户能够通过 API 指导 Claude 像人类一样操作计算机,包括查看屏幕、移动光标和输入 文本。

头部玩家纷纷在自身优势领域发力 AI 革新应用。在中国市场,2024 年 5 月发布的阿里云通义千问 2.5 重点解决了中文语境下的商务写作和数据分析 问题,特别是在财务报表解读、商业计划书撰写等场景中展现出独特优势。 字节跳动火山引擎·云雀则创新性地将 AI 融入协同办公流程,实现了跨部 门文档智能流转、多语言实时协作等功能。欧洲市场的 SAP AI Core 着重于 解决企业数据安全问题,在保护企业数据隐私的同时,实现了 ERP 系统的 智能化升级,包括采购预测、库存优化等具体应用场景。

腾讯 ima 将 RAG 技术与个性化知识管理相结合,开创了 AI 助手从通用工 具向个人专属智能助理演进的新范式。2024年10月发布的腾讯ima Copilot, 通过"全网信源+个人知识库"的双层数据架构,实现了个性化的知识获取与 应用。特别是在知识库层面,其采用 RAG 技术将用户个人知识进行向量化 存储并挂载到大模型上,这种设计实现了 AI 助手的记忆功能,使其能够随 着用户使用逐步形成个性化的知识体系和表达风格。这种进化式的学习模 式,使 AI 助手从通用型工具转变为真正理解用户专业背景和思维方式的智 能伙伴,为 AI 助手的发展开创了新方向。AI 助手的竞争正从单纯的模型能 力比拼,转向更注重用户个性化体验和长期价值积累的方向发展。

3.2. 体验全模态输入自由,生态融合是 AI 应用的重要方向

多模态 AI 创作工具进入革新阶段,百度自由画布打通公私域数据,预计带 动行业进入生态融合新赛道。2024 年 11 月,百度在世界大会上发布的"自 由画布"标志着 AI 创作工具进入新阶段。该产品通过打通百度文库和网盘(用户超 10 亿)两大应用,首次实现了公域知识与私域数据的融合创作。 目前产品已进入邀测阶段,根据百度官方数据,该产品首日获得 20 万用户 预约。从商业模式看,自由画布的推出将带动整个 AI 生产力工具赛道向生 态融合方向发展。

自由画布的一站式全模态创作能力显著降低了用户使用门槛。该产品支持 100 多种格式的文件输入,包括文本类(doc、pdf、excel)和多模态类(jpg、 mp3/mp4 等)素材,用户只需通过拖拽或圈选即可完成素材导入。在内容创 作环节,平台采用直观的可视化操作方式,用户通过简单的鼠标圈选和提示 词输入即可完成复杂的创作任务。这种简化的操作流程显著降低了 AI 创作 工具的使用门槛,让普通用户也能轻松驾驭 AI 创作。 自由画布的多层次调用机制体现了深度的 AI 理解能力。产品支持对素材进 行预处理标记和分层利用,AI 系统能够理解并记住用户的标记偏好,在后 续创作中精准调用相关内容。这种基于深度理解的智能调用机制,让 AI 创 作突破了简单的内容拼接和生成,实现了更符合用户意图的精准创作,推动 了 AI 创作工具向更智能化的方向发展。

产品的闭环设计彰显了面向未来的产品思维。自由画布不仅整合了从素材 输入到内容创作的全流程功能,还提供了与主流社交平台的分享接口和云 端存储能力。这种端到端的闭环设计满足了创作者一站式的需求,更重要的 是为未来更多场景的拓展预留了空间。通过持续积累用户创作数据和使用 习惯,产品可以不断优化和进化,形成良性的数据增长闭环,这种面向未来的产品设计思路为 AI 创作工具指引了新的发展方向。

3.3. 深耕垂直领域的资深玩家抢占 AI 时代变现的先发优势

AI 在垂直领域实现从通用能力到场景深耕的转变,各地头部企业围绕行业 痛点推出创新解决方案。

3.3.1. 医疗 AI 加速产业化落地,诊疗服务全面升级

全球医疗 AI 加速产业化落地,医疗保健领域的 AI 应用得到更多重视。2024 年,全球大量 AI 医疗应用落地,IBM Watson Health 推出的 AI 药物研发平 台显著加速新疗法开发流程;微软 Azure AI Health Insights 平台强化了医疗 预测分析能力;飞利浦 HealthSuite 平台则通过实时数据整合提升患者管理 效率。在诊断领域,谷歌 Health 发布的乳腺癌检测 AI 工具较传统钼靶检查 展现出更高准确率,西门子医疗推出的 AI 增强型影像软件大幅提升了放射 诊断精度。医疗 AI 正从实验室走向规模化商业应用阶段。 润达医疗"CDx 良医小慧"通过突破数据处理和模型精度两大技术难点,实 现了医疗场景的全方位 AI 赋能。2024 年 9 月,润达医疗基于 6 年积累的 近 10 万条数据标注和治理规则,成功开发了 CDx 医疗数据基座,可将临床 文本记录转化为全结构化数据,目前已支持检验、超声、CT、核磁、病理 等近百个维度的医疗数据处理。在模型研发方面,该公司通过在盘古通用大 模型基础上构建医疗垂域大模型,并邀请北京阜外、华山等多家知名医院的 临床专家参与模型优化,有效解决了 AI 在医疗场景中的"幻觉"问题,确保 了模型输出结果的专业性和可靠性。

润达医疗的 AI 解决方案已在多个医疗细分场景实现商业落地。"CDx 良医 小慧"已在体检、药房、检验等多个医疗场景实现规模化应用。在美年大健 康的体检场景中,该方案通过 AI 机器人"健康小美"将服务模式升级为"体检 2 小时,健康服务 365 天";在智慧检验领域,通过与生物梅里埃合作打造 智慧微生物检测和管理体系;在药房场景中,已与广西柳药集团启动"桂中 大药房智慧升级计划"。

3.3.2. 金融大模型专注领域内知识,驱动行业能力跃迁

金融行业大模型应用进入产业化阶段,头部金融机构自研模型将重塑行业 竞争格局。全球领先金融机构正在加速布局专业金融大语言模型。彭博社 2023 年推出的 BloombergGPT 拥有 500 亿参数规模,专注于金融数据分析 和市场研究。2024 年 1 月,摩根大通发布 DocLLM,专门用于处理复杂的 金融文档。在开源领域,AI4Finance 社区推出的 FinGPT 为中小金融机构提 供了可定制化的解决方案。这些专业模型的出现标志着金融科技正从通用 AI 应用向行业专用模型演进,预计将在投研、风控、客服等场景率先实现 商业化落地。

恒生电子的 LightGPT 通过建立分层评测体系和场景化应用,形成了金融 大模型从通用能力向专业场景深度应用的系统性解决方案。2023 年 10 月 发布的 LightGPT 采用"L0-L1-L2"三层能力评测体系,将金融大模型的能力 划分为通用能力、金融领域能力和金融场景能力,这种分层设计确保了模型 在基础能力和专业应用之间的平衡。特别是在 L2 层面,模型覆盖了投顾、 投研、运营、合规等五大场景的 80 种金融专属任务,体现出显著的垂直领 域优势。在落地层面,恒生电子通过"重塑+嵌入"双模式推进大模型应用, 既打造了光子·文曲等独立产品,又通过插件形式将 AI 能力嵌入现有业务 系统,实现了技术创新与业务场景的深度融合。 金证股份通过 K-GPT 提供了自主研发的金融领域 AI 解决方案。金证股份 在 AI 领域的布局始于 2018 年,通过五年持续迭代,于 2023 年 12 月发布 了 K-GPT。K-GPT 基于 Transformer 架构,通过领域预训练和场景化精调, 将智能语义检索引擎与文档处理平台(IDP)紧密结合,形成了完整的金融 知识体系。其应用已实现从早期的单点智能监管突破,到如今覆盖营销、投 研、风控等多个核心金融场景的全面布局。

同花顺 HithinkGPT 通过强大的数据积累和技术创新,在金融垂域实现了 突破性进展。根据同花顺信息,2024 年 1 月发布的 HithinkGPT 基于万亿级 金融语料训练,在 17 个金融行业考试中平均得分达 75.9 分,显著优于主流 开源模型。问财产品基于 HithinkGPT 实现了五大能力升级,覆盖 15 个业 务矩阵和 50 余类技能,特别是在实时数据获取、专业投顾建议和风险控制 等方面形成独特优势,其 99.5%的风险召回率体现了金融场景下的高可靠 性,并成为首个通过网信办备案的金融对话大模型。

3.3.3. 法律大模型纵深发展,赋能司法效率提升

法律领域的垂直大模型呈现出专业化、安全性和实用性的特征。2023 年初 Harvey AI 发布的大模型和 Thomson Reuters 旗下 Casetext 发布的 CoCounsel 两大法律大模型的成功应用,展现了 AI在专业领域的突破。在专业性方面, 这些模型通过法律文献训练和律所实践数据的持续优化,能够胜任合同分 析、尽职调查等核心业务;在安全性方面,两者都采用专用服务器和加密技 术保护客户数据,确保法律信息的私密性;在实用性方面,Harvey AI 经过 全球最大律所之一 Allen & Overy 的 4 万次测试,证明 AI 在法律领域的应 用能显著提升律师工作效率。

华宇万象法律大模型在多个法律服务场景实现落地应用。产品于 2023 年 7 月的法律科技大会发布,已为法官提供智慧阅卷、庭审辅助等功能,为检察 官、律师提供文书写作辅助,同时在企业法务领域实现规章制度智能解读和 风险预警等应用。凭借与大模型独角兽企业智谱 AI 的战略合作关系,华宇 软件在 AI 法律应用领域的创新发展将获得坚实的技术保障。

通达海联合基层法院共建大模型,展现出法律科技公司服务基层的新路径。 2024 年 10 月,通达海与香洲法院共建的香法 AI 入驻珠海模数空间,该产 品实现了标准化法律业务指引、精准化法律知识推送、智能化司法决策辅助 等功能,并已在审判实务中显著提升效率。 通达海构建了"感知智能+认知智能"双引擎的法律人工智能架构。感知智能 引擎通过图像识别、OCR 识别等技术,对卷宗、证据等实体材料进行智能 分析,实现材料类型识别、内容识别和精细化编目,其中 OCR 综合识别正 确率达 95.5%,证据材料综合识别率达 98.5%;认知智能引擎则基于自然语 言理解和法律大模型技术,构建了 280 多个要素化信息抽取模型,在法律 咨询、量刑预测、智能文书生成、案件事实归纳等九大核心场景实现了 95% 的模型准确率和召回率。

3.3.4. AI 教育工具转向深度学科训练,多场景互动重塑学习体验

ChatGPT 正在颠覆传统教育科技企业的商业模式,在线搜题平台 Chegg 的 衰落就是典型案例。据《华尔街日报》2024 年 11 月报道,Chegg 面临用户 需求转变的严峻挑战:Needham 的调查显示,2024 年秋季使用 Chegg 的大 学生比例降至 30%,而选择 ChatGPT 的比例上升至 62%。这一转变的核心 在于用户不再满足于获取简单答案,而是希望通过 AI学习完整的解题思路。 尽管 Chegg 已与 Scale AI 合作开发 AI 系统,将服务重心转向提供更丰富的 解题帮助,但其收入持续下滑,反映出传统教育科技企业在 AI 时代转型的 困境。 教育领域的 AI 应用实现了从通用助教工具向专业学科辅导转变,头部产品 开始深耕学科能力训练场景。以专业领域切入为代表的是 Microsoft 推出的 Reading Coach,该产品专注于提升学生的英语阅读理解能力,通过 AI 生成 个性化故事内容来训练学生的阅读技能。在中国市场,好未来发布了九章大 模型,面向全球科研机构,以解题和讲题算法为核心。Coursera 正式在其所 有付费课程中引入 AI 辅导助手"Coach"功能,该功能可以根据学习者的课 程进度提供个性化的知识讲解。从交互方式看,这些产品均采用了实时对话 模式,并结合了知识图谱技术来保证答案的准确性。另外,后续 o1 思维链 模式的发展也将进一步拓宽教育 AI 的边界。

多邻国的 AI 布局展现出长期深耕的战略思维。早在 2021 年,公司就开始与 OpenAI 展开合作,将 GPT-3 应用于英语测试业务;后续又在 GPT-4 发 布首日推出 Max 订阅服务,提供 AI 解答和角色互动功能。公司通过自研 Birdbrain 模型优化教学内容,同时借助 OpenAI 模型提升对话生成能力,这 种"自研+合作"的双轮驱动模式,让多邻国在保持教学专业性的同时不断提 升用户体验。 多邻国在 2024 年 9 月底推出重要产品创新,通过 AI 视频通话及冒险功能 重构语言学习体验。新功能基于 OpenAI 及自研大模型支持,推出了 AI 角 色"拽姐",能实现接近真人的对话体验,包括自然的语气变化、思考停顿等 细节。用户可以与"拽姐"进行视频通话练习,也能在学校、商店、派对等多 个生活场景中共同探索和解决问题,将语言学习融入具体情境,实现从单向 练习到沉浸式学习的跃升。

3.3.5. AI 技术重构商业变现,数字营销加速落地

AppLovin 的 AI 广告引擎 AXON 2.0 凭借卓越的广告匹配效率,正引领数 字广告领域的技术革新。该产品于 2024 年第三季度展现出强劲的市场表现, 基于 AXON 2.0 开发的智能广告方案 eDiscovery 安装率从 2023 年的 17%显 著提升至目前的平均 82%,充分证实了 AI 在提升广告投放精准度方面的突 出优势。作为 AppLovin 转型的核心产品,AXON 2.0 不仅推动公司从游戏 发行商成功转变为 AI 广告技术先驱,更是通过其高效的应用内广告变现 (IAA)能力,提供了一条可靠的商业化路径。

3.3.6. 数字人技术赋能,情感与商业价值双向突破

数字人技术展现出情感陪伴和商业营销的双重应用价值。娱乐层面,数字 人可作为虚拟形象进行互动,或展开数字人直播;情感层面,数字人通过多 模态交互和专业知识库的支持,为用户提供个性化的心理陪伴服务;商业层 面,数字人降低了内容制作门槛,让营销视频的生产更高效且成本更低。这 种技术与场景的深度融合,正推动数字人从概念创新走向规模化应用。 科大讯飞在数字人技术上实现多维度突破,展现出数字人交互的新范式。 2024 年 1024 开发者节发布的星火超拟人数字人率先实现了语义贯穿的"口 唇-表情-动作"生成,使数字人的表现更加自然流畅。该产品通过统一的神 经网络实现端到端建模,支持语音视频实时对话,能精准匹配语音内容与肢 体动作,还具备场景识别能力,可以辨识摄像头中的具体物体和状态。更重 要的是,用户能够创建个性化的数字分身,自定义包括性格、背景在内的多 个维度,体现出数字人技术从标准化向个性化的演进。

魔珐科技推出了全栈式数字人解决方案。魔珐通过"有言"、"有光"、"有灵" 三款产品覆盖了数字人应用的主要场景:其中"有言"平台能够实现 3D 视频 一键生成,集成了 AIGC 三维动画、超写实形象、运镜和声音等技术,显著 提升视频制作效率;"有光"专注于 AI 驱动的 3D 超写实数字人直播,支持 实时语音驱动和智能互动;"有灵"则面向企业级应用,通过 AIGC 技术规模 化复刻"金牌员工"能力,支持全域多端的 7×24 小时专业服务。这些应用已 在培训、电商、金融、快消、广电等领域得到广泛应用,展现了 AI 数字人 技术的商业化落地潜力。

出门问问 WetaAvatar 4.0 数字人取得引擎技术突破。引擎采用"运动预测+ 人脸驱动"双模块架构,运动预测模块通过语音分析技术提取关键参数,实 现嘴型动画与语音的精准同步;人脸驱动模块则结合预生成驱动视频和静 态图片,生成包含嘴型变化、面部表情和肌肉运动的全面运动场,显著提升了数字人的表现力。新一代引擎在视频合成速度、背景渲染、人物分离等方 面均实现优化,其音画同步性指标 Sync-C 普遍高于上一代产品。目前引擎 已经应用于国内产品奇妙元和国际产品 DupDub。

万兴科技发布的万兴播爆展现了 AIGC 在商业领域的突破性应用价值。 2023 年 3 月发布的万兴播爆基于 AI 技术实现了真人视频的一键生成,通 过内置的百余套专业级场景模板和超逼真多国籍 AI 数字人,支持中英西法 德意日韩等 120 多个国家的语种和口音,可在几分钟内完成传统需要数周 的视频制作流程。这一产品显著降低了出海营销门槛,相比传统外籍演员拍 摄方式可节省 80%以上预算,特别适合电商带货、产品介绍等场景。

4. 端侧 AI 应用加速普及,推动智能化生活升级

AI 端侧应用通过本地处理实现快速响应与隐私保护,引领智能终端的下一 代技术革新。端侧 AI 应用通过在本地设备(智能手机、IoT 终端、车载系统 等)直接运行 AI 算法,将传统依赖云端的图像识别、语音交互等功能转移到 设备端实现。这种架构在降低网络延迟的同时确保数据隐私安全,使设备即 使在离线状态下也能持续提供智能服务。随着算力提升和模型优化,端侧 AI 正从简单的感知智能向复杂决策能力演进,在更多应用场景持续拓展。

4.1. AI AGENT 和机器人引领 AI 产业革命

AI Agent 作为新一代数字化员工,凭借理解、规划、执行的全链路能力, 正加速融入企业运营体系。AI Agent 不仅是简单的工具,更像是需要系统性 培养的数字员工,企业需要通过专业数据构建和技能训练,使其深度理解企 业文化和业务流程。这些数字员工可以执行营销活动、支持客户、优化芯片、 协助软件编写,甚至是作为实验室助理或首席执行官导师。为此,英伟达创 建了生命周期平台 nemo,让生态系统能够更容易地构建人工智能代理,能 够创建、交付、持续改进人工智能代理。nemo 为每个阶段提供库,从数据 创建、训练、微调、合成数据生成、评估到护栏。关于人和人工智能的关系, 英伟达认为人工智能不会取代 50%人的工作,而是人工智能将为 100%的人 完成 50%的工作。

人工智能为机械系统注入新动能,智能机器人有望成为世界上最重要的产 业之一。尽管机器人已显著提升制造业生产力,但机器人行业长期发展停 滞,扩张困难。主要原因在于传统机器人过于专用化、缺乏灵活性,难以适 应不同场景。相比之下,人工智能具备自适应和学习能力,灵活性更强。因 此,现在可以将这种通用人工智能技术应用到具身人工智能或物理机器人 领域,推动机器人技术实现突破。这一过程需要构建三个计算系统:首先是 传统的人工智能系统;第二是模拟训练系统,为 AI 提供学习环境和合成数 据;最后,经过验证、训练和评估后,将模型部署到物理机器人中。为此, 英伟达专门开发了面向机器人的 Jetson 处理器。借助这一技术,机器人不 仅能感知周围环境,还能将文本指令转化为关节运动,从而实现更灵活的操 作。

英伟达发布强化学习虚拟系统 IsaacLAB,致力于为人类和机器人提供系统 化训练方案。英伟达在该系统中构建了三个核心工作流程:第一个是群组模 仿,通过采集人类示范动作,并利用域随机化技术生成数百个类似场景,帮 助机器人掌握泛化能力;第二个是分组,运用生成式 AI 技术创建大量随机 化的环境和任务场景,丰富机器人的训练样本;第三个是群组控制,这是一 个模型提炼框架,能够将所有已习得的任务和技能整合到统一模型中,使机 器人实现多样化的运动技能。 AI 将赋能机器人引领工厂革命。传统软件一直扮演工具角色,而 AI 突破 了这一定位,成为具备技能、能够自主执行任务的智能主体。未来工厂将会 有两个 AI 系统,其一是数字化 AI Agent,与办公室员工协同工作;其二是 实体化的 AI 机器人系统,承担物理世界的生产任务。许多企业、媒体认为 制造实体产品才有真正的价值和意义,而软件是虚拟的东西,因此不信任软 件的价值。但未来机器人和 AI 的结合将会更加释放软件的价值。 英伟达宣布将与软银合作,为日本带来并建立人工智能基础设施,共同建 设日本最大的人工智能工厂。英伟达和软银计划整合无线通信、计算机和 5G-RAN 基带,将传统电信网络升级改造为 AI-RAN 系统,实现语音、数 据、视频的承载。未来双方还会将新型人工智能分布在软银的上万个站点中。 这一布局最终将形成覆盖全日本的 AI 智能网络。随着 AI 基础设施的建立, 新行业和新公司有望会孕育新的商机。 过去基站主要用于传输电信和互联网浏览等服务,但现在随着紧密相连的 智能网络的发展,AI 网络将成为日本基础设施的核心。英伟达和软银展望 未来,认为个人 AI 助手将如同 PC 和智能手机一样普及,成为个人生活的 智能伴侣,在旅行规划、教育指导等方面提供全方位服务,并通过深度了解 用户的健康、教育等状况,成为他们的“双胞胎 AI 助手”。因而,这也对每 个主权国家、政府都建立自己的主权数据中心提出了要求和挑战。

4.2. AI 手机:硬件升级提速,终端智能迈入新阶段

三星率先发布搭载端侧 AI 的 Galaxy S24 系列,带动 2024 年 AI 手机市场 快速起步。三星 Galaxy S24 系列于 2024 年 1 月首次实现了端云结合的 AI 架构,在通话翻译、图像处理和语音转写三大场景实现纯端侧处理。该系列 搭载高通骁龙 8 Gen3 处理器,通过端侧模型预处理确保个人信息不出设备, 同时实现毫秒级响应。其中,实时通话翻译功能完全在本地进行,无需联网 即可实现多语言实时对话;本地 AI 还能进行照片智能修复和多人会议实时 转写,体现了端侧 AI 在提升用户体验同时保护隐私的典型优势。

端侧 AI 应用成为 2024 年手机行业创新重点。小米在 2024 年 2 月发布的14 Ultra 搭载首个 AI 大模型计算摄影平台 Xiaomi AISP,通过整合 CPU、 GPU、NPU 和 ISP 实现 60TOPS 算力,首次将 AIGC 技术应用于 100 倍数 码变焦的实时处理;OPPO 在 2024 年 1 月的 Find X7 系列中率先集成了端 侧 AIGC 消除、AI 通话摘要功能;vivo 则在 2023 年底推出了从 10 亿到 1750 亿参数的五款不同规模端侧模型,构建起较为完整的 AI 能力矩阵。 终端厂商基于端云混合架构探索 AI 落地路径,行业共识逐步形成。根据联 发科、IDC、OPPO 在 2024 年 2 月发布的《AI 手机白皮书》,AI 手机需具 备高效算力调度、环境感知、自学习和创作四大核心能力。目前各大厂商采 用端侧预处理与云端协同的技术路线,在保护用户隐私的同时确保功能实 时性。根据 Counterpoint Research 预测,2024 年生成式 AI 手机出货量将突 破 1 亿部,到 2027 年市场占比有望达到 40%,显示出强劲的增长潜力。 华为在 HarmonyOS NEXT 中首次实现 AI 能力操作系统级下沉,开创端侧 智能新范式。根据 IT 之家 2024 年 6 月信息,华为不同于市面上简单集成 大模型的 AI 产品,而是通过软硬芯云整合构建了鸿蒙原生智能架构,使 AI 与操作系统深度融合。这种系统级融合使得小艺智能体能够常驻导航条,用 户可通过全局拖拽方式直接处理文字、图片、文档,实现摘要、润色、提取 表格等功能;同时,搭载盘古大模型的小艺具备 23 类 TOP 场景的记忆感知 能力,任务成功率达 90%,已实现与 300 多个重点服务的无缝对接。这种 将 AI 能力下沉到系统层的架构创新,极大提升了端侧 AI 的应用效率。

苹果通过 Apple Intelligence 构建全方位端侧 AI 架构。苹果在 iOS 18 中推 出了 Apple Intelligence 系统。基础 AI 能力通过设备端处理实现,包括文本 校对、图像清理和自然语言理解等,对于更复杂的计算需求,系统会调用基 于 Apple Silicon 的服务器集群进行 Private Cloud Compute,确保数据隐私不 被收集存储。这一架构支持多样化的端侧应用场景:在写作工具方面,能够 进行文本校对、重写和摘要;在图像处理上,支持移除干扰元素和自然语言 搜索;在个人助理方面,全新设计的 Siri 可通过设备端上下文理解实现更自 然的交互,并能跨应用执行复杂任务。

Agent 类 AI 应用迎来落地关键期,智谱 Phone Use 通过语音交互打开手机 控制新场景。2024 年 11 月,智谱 AI 基于 AutoGLM 智能体和 GLM-4-Voice 将AI应用扩展至"Phone Use"领域,可以模拟人类完成微信点赞、淘宝购物、 订票等复杂操作。目前这一 Phone Use 能力已适配微信、淘宝、美团等 8 款 主流应用。在交互效率方面,Phone Use 突破了传统语音助手的单一指令模 式,支持多轮对话和复杂任务执行,为用户提供更自然的操作体验。相比传 统 AI 助手仅能通过 API 调用的方式,AutoGLM 的 Phone Use 技术为端侧 AI Agent 在手机市场的拓展提供了参考方向。

端侧 AI 手机的竞争焦点已从功能堆砌转向用户隐私与体验的平衡突破。传 统云端 AI 模式虽然算力充沛,但隐私风险和网络依赖限制了其发展空间。 新一代手机厂商通过端云结合架构,既确保个人信息不出设备,又能实现毫 秒级响应,标志着终端智能已找到兼顾隐私与体验的最优解。这种基于用户 核心需求的创新,将成为未来 AI 手机竞争的关键砝码。 终端智能正从单一功能走向全场景协同,AI 手机的竞争逻辑已转向生态构 建。目前各大手机厂商纷纷布局系统级 AI 架构,不再局限于简单的功能集 成,而是着眼于打造端侧智能生态。这种转变意味着,手机厂商的竞争重点 将从硬件规格转向场景生态,谁能率先构建起完整的智能场景闭环,谁就能 在下一轮行业变革中占据先机。

4.3. AI PC:全场景智慧加速,应用生态革新

英特尔酷睿 Ultra 处理器为 AI PC 带来革命性突破。2024 年 9 月,英特尔 发布 Ultra 200V 系列处理器,为 AI PC 带来突破性的性能提升和能效优化。 这一新品在三大 AI 引擎架构上实现全面突破:CPU 整体功耗较上代降低 50%,NPU 性能提升 4 倍,GPU 首次采用 Xe2 图形微架构带来平均 30%的 性能提升,整体平台算力高达 120 TOPS。通过与 100 多家 ISV 和开发者的 合作,该处理器已支持超过 300 个 AI 加速功能,并针对 500 多种 AI 大模 型进行了优化。

联想新一代 ThinkPad 将端侧 AI 延伸至智能场景交互,开创商用电脑新形 态。联想于 2024 年 9 月推出的 ThinkPad X1 Carbon Gen 13 等新品,突破了 传统的 AI 应用方式,搭载高通骁龙 X Elite,支持 Copilot,新增 Smart Modes 智能模式可根据场景自动调整性能,如检测到背后有人时自动为屏幕打码; Smart Share 功能通过 AI 虚拟传感器实现手机与 PC 的触碰传输。联想还将 在 Yoga Pro 9i 等机型上率先搭载 Creator Zone 软件套件,基于 Stable Diffusion 模型提供自然语言生成视觉内容的能力。

鸿蒙生态春季沟通会上,华为首次将自研的盘古大模型引入 PC 端。华为 2024 年新发布的 MateBook X Pro 搭载了 AI 概要功能,通过盘古大模型可 实现会议实时转写、音视频快速总结等智能应用;同时还首发推出AI空间, 作为一站式 AI 能力聚合入口,不仅集成了文心一言、讯飞星火、智谱清言 等第三方大模型,还精选了超过 100 个 AI 智能体,覆盖办公、学习、创作 等多个场景。

华为 MateBook X Pro AI 算力在硬件层面得到突破,实现了多项智能体验 的升级。MateBook X ProAI 搭载英特尔酷睿 Ultra 9 处理器,在仅 980g 的 轻量机身中实现了 40W 的持续性能释放。通过 AI 赋能,该产品带来了多 项智能体验升级:AI 慧眼让视频会议中的人像清晰度提升 50%,AI 音效提 供三种智能降噪模式,AI 字幕支持实时翻译和会议记录导出,此外华为 AI 还积极赋能第三方应用,例如首发支持 WPS AI、与万兴喵影的合作,成为 市场首款支持 AI 特效调用 NPU 的笔记本。

华勤技术与荣耀深度合作,积极参与 AI PC 市场。2024 年 2 月的 MWC 2024 巴塞罗那发布会上,荣耀推出 MagicBook Pro 16,该产品由华勤提供 研发制造服务,搭载英特尔酷睿 Ultra 处理器,支持本地 AI 智能搜图、文 档总结等 AI 功能。作为联想等品牌的长期 ODM 合作伙伴,华勤依托 "2+N+3"产品线布局和在智能硬件领域的深厚经验,已具备从产品设计、硬 件配置到软件生态的全方位研发能力,有望在 AIPC 快速发展的浪潮中占据 重要位置。

AI PC 的差异化竞争已从硬件转向场景创新与生态构建的深水区。传统 PC 厂商曾依靠处理器性能和轻薄程度获取溢价,但在 AI 时代,联想通过 Smart Modes 等场景感知功能、华为通过 AI 空间生态平台的路径显示,未来的竞 争优势将更多来自对用户场景的深度理解和生态资源的整合能力。这意味 着 PC 行业的竞争模式正在发生根本性转变。 ODM 厂商有望通过 AI PC 浪潮实现向产业链上游的突破。华勤从单纯代 工向全方位研发服务转型的案例表明,AI PC 带来的不仅是终端形态的革 新,更是整个产业链重构的契机。在这轮变革中,具备深厚硬件积累和灵活 创新能力的 ODM 厂商,有机会突破传统代工模式的天花板,在产业链中获 得更大的话语权。

4.4. 智能驾驶:端到端模型破局,多模态感知提速

2024 年端到端 AI 驾驶模型成为技术发展主流,降低系统开发复杂度。端 到端大模型的引入使得智能驾驶功能更加接近真实的人类驾驶体验,减少 了人工规则的介入。从落地产品看,特斯拉 FSD V12.4 于 2024 年 6 月已开 始向首批用户推送测试,采用端到端神经网络架构;小鹏推出的 XNet+规控大模型 XPlanner 及大语言模型 XBrain 等端到端方案已在 2024 年 5 月实现 量产;华为 ADS 3.0 端到端类人驾驶技术也已发布,计划于 2025 年开始商 用。 多模态 AI 模型在端侧实现感知决策能力提升,推动 ADAS 功能进化。AI 技术在智能驾驶中的应用范围不断扩大,多模态 AI 模型在端侧实现了图像 识别、雷达和激光雷达数据处理等核心功能。华为推出的 ADS 3.0 系统采 用端云协同架构,将基础感知、预警等高频任务放在本地处理,有效提升了 系统响应速度。生成式 AI 技术也在 ADAS 领域得到应用,用于提升自适应 巡航、车道保持等功能的智能化水平。在视觉处理方面,飞凌微等企业推出 的车载视觉处理芯片,为端侧智能驾驶视觉解决方案提供了支持。 特斯拉 FSD V12 作为端到端 AI 应用的重要里程碑,在 2024 年持续迭代。 最新发布的 FSD 12.4.1 版本实现了从方向盘扭力监测向基于神经网络的摄 像头驾驶员监测系统的转变,通过 AI 技术实时分析驾驶员眼睛状态、视线 方向等行为数据,大幅提升了驾驶安全性。根据马斯克介绍,FSD V12.4 相 比 12.3 版本的接管率改善了 5-10 倍,且整合了此前割裂的 FSD 和非 FSD 分支,其改进幅度堪称 FSD V13,特斯拉预计通过持续的版本更新,有望实 现用户几乎无需手动接管的智能驾驶体验。

小鹏汽车率先推出了国内首个量产上车的端到端大模型。根据小鹏 520 AI DAY 披露,其端到端解决方案包含深度视觉感知神经网络 XNet、规划大模 型 XPlanner 和大语言模型 XBrain 三个核心组件,通过超过 10 亿里程的视 频训练数据支持,实现每两天一次的快速迭代。这套系统显著提升了智能驾 驶性能,使前后顿挫减少 50%、违停卡死减少 40%、安全接管减少 60%。 特别值得注意的是,基于这套端到端架构,XNet 能通过 200 万个网格实现 对现实世界的 3D 重构,感知范围扩大至 1.8 个足球场,而 XPlanner 则通过 海量数据(维权)训练实现更接近人类的驾驶策略。

地平线最新发布的 SuperDrive 方案展现了端到端架构的创新应用。根据地 平线披露,该方案采用动态、静态、OCC(Occupancy 占用网络)三网合一 的端到端感知架构,显著提升了系统性能,使遮挡准召率提升 70%,同时将 动态代码行数降低 90%、网络负载降低 50%。特别是在数据驱动的交互博 弈算法支持下,系统在复杂交通场景中展现出更接近人类驾驶员的决策能 力,使拥堵场景下的变道成功率提升 50%,路口通过率提升 67%。

黑芝麻智能发布第三代 DynamAI NN 神经网络处理器,在 AI 芯片端侧计 算进行创新。2024 年 5 月发布的该处理器通过原生支持 Transformer 架构强 化了对高阶自动驾驶算法的处理能力,同时采用新型存取架构在保证大模 型所需高带宽的前提下显著降低了 DDR 成本。可见车载端 AI 芯片已经开 始突破带宽瓶颈,向支持更复杂 AI 模型的方向演进。

端到端 AI 模型正在颠覆传统的智能驾驶技术路线。与传统的"感知-规划-控 制"分层架构不同,端到端模型通过直接从输入到输出的映射大幅简化了系 统架构,如小鹏 XNet 将违停卡死减少 40%、特斯拉 FSD V12 提升接管率 5-10 倍的数据都验证了这一路径的优势。这种范式转变不仅降低了开发复 杂度,更重要的是开创了一种更接近人类驾驶认知的技术方向,预示着智能 驾驶的发展将进入新阶段。

4.5. 从单一设备演进到智能助手,AI 赋能新型智能终端创新

小米小爱音箱 Pro 将 AI 在应用于智能音箱领域,实现更精准的空间感知。 新一代产品通过六麦阵列式声源定位和波束成型技术,结合 AI 深度学习算 法,实现了在复杂噪声环境下的精准空间感知。在多设备部署环境中,系统 能够基于说话人的朝向和距离自动判断最优响应设备,使声音交互更加自 然流畅。这些技术升级使智能音箱在实际应用场景中的识别准确率和响应 效率得到显著提升。

智能眼镜迎来 AI 赋能拐点,百度布局高端市场并带动供应链变革,新一轮 AIoT 创新周期显现。小度 AI 眼睛于 2024 年 11 月发布,产品整机重量 45g, 集成了 1600 万像素超广角摄像头、四阵列麦克风和防漏音扬声器单元,能 够实现第一视角拍摄、边走边问、视听翻译等多模态交互功能。基于文心大 模型和重构的 DuerOS AI 原生操作系统,小度 AI 眼睛使设备的多轮交互能 力提升 7 倍。此外,其创新电路架构实现了 56 小时待机、5 小时以上连续 聆听,并支持 30 分钟快充,为其作为 AI Agent 的持续服务提供了坚实保 障。

科大讯飞 iFLYBUDS 耳机通过多项 AI 技术的融合应用,推动办公体验变 革。在硬件层面,产品搭载双麦克风拾音系统,结合 CVC 通话降噪技术, 确保了清晰的语音质量。在软件层面,耳机采用语音活动检测和通道降噪算 法,显著提升了语音指令识别的准确性。产品支持实时录音转写功能,可无 缝对接微信、Skype、钉钉和腾讯会议等主流会议平台。在会议过程中,内 置的生成式 AI 能够自动过滤通话中的语气词和冗余内容,智能提炼重要信 息,帮助用户把握会议要点。 字节跳动 Ola Friend 耳机展现 AI 耳机多场景应用潜力。字节跳动推出的 Ola Friend 耳机通过接入豆包 AI 大语言模型,在多个生活场景中实现了 AI辅助功能的创新应用。在旅游场景中,耳机可以提供实时语言翻译和当地信 息查询服务;在英语学习场景下,能够进行发音纠正和口语练习指导;在日 常社交中,则可以通过 AI 助手提供实时交流建议。产品在音质方面也进行 了优化,满足用户在不同场景下的听音需求。

多模态感知技术正在重塑智能终端的交互边界。新一代终端通过集成先进 的感知硬件和 AI 算法,显著提升了环境理解能力。这种感知能力的跃升不 仅提升了产品体验,更重要的是拓展了人机交互的新维度,使设备能更好地 适应和响应复杂的现实场景需求。 AI 正在让智能终端从固定场景突围走向全场景融合。传统智能硬件往往囿 于单一功能定位,如音箱主打语音控制、耳机专注音频体验。而新一代终端 通过 AI 赋能实现了跨场景能力,从字节 OlaFriend 集成翻译、学习、社交 功能,到百度 AI 眼镜支持视听、导航、交互等多模态应用,都展现出智能 终端正从专用工具向全能助手演进。这种融合趋势将给智能终端市场带来 新一轮创新周期。 端侧 AI 的发展已从单一功能创新走向全方位突破。在手机、PC、智能驾驶 和新型智能终端等领域,厂商正通过端云协同架构和多模态技术提升用户 体验,通过场景创新和生态布局构筑竞争优势,只有抢占技术高地的厂商才 能够抢占市场先机。

5. 多方协力推动中文语料积累,AI 应用生态日益完善

5.1. 中文语料匮乏成发展瓶颈,数据共享与合规问题亟待解决

数据质量直接决定 AI 模型性能上限,成为产业发展瓶颈。GPT-3 在训练前 有 45TB 的纯文本数据,经过质量过滤后,有效数据仅占 1.27%,这种低效 率正在加剧算力资源的紧张。特别是在预训练+微调成为新范式的背景下, 高质量数据对模型性能的影响更为关键,这促使产业界从以模型为中心加 速转向以数据为中心。 高质量数据面临耗尽危机,亟需寻找新的突破路径。《Will we run out of data? An analysis of the limits of scaling datasets in Machine Learning》预测显示, 高质量语言数据将于 2026 年耗尽,这种稀缺性正在重塑产业格局。特别是 在中国 AI 领域,数据供给生态不完善、获取成本高等问题更为突出。面对 这一挑战,采用技术手段自动合成数据正成为重要解决方案,Gartner 预计 到 2024 年,用于训练大模型的数据中将有 60%来自合成数据。 中文数据短板让数据紧缺进一步加剧,制约着国产大模型的突破。根据阿 里研究院 2024 年 5 月的数据,目前全球网站中,中文语料内容占比仅为1.3%,远低于英文的 59.8%。特别是在金融、医疗、法律等专业领域,高质 量中文训练数据更为稀缺。这些问题不仅限制了国产大模型的性能提升,也 在一定程度上影响了中国AI技术在国际市场的竞争力。从产业发展趋势看, 中文语料建设的短板正催生巨大的市场机会,预计未来将有更多资本和技 术力量投入这一领域。

数据孤岛和共享障碍成为产业发展的掣肘,数据共享平台、提供数据中间 件服务等新型业态有望成为重要方向。与英语世界的 Common Crawl 等开 放数据机构相比,中文世界缺乏有效的数据共享机制。各大平台基于商业竞 争考虑,对数据共享持谨慎态度,这种封闭生态不利于行业整体发展。当前 中文数据的割裂状态不仅增加了数据获取成本,也影响了语料的整体质量 和覆盖面。特别是在用户行为数据、交互场景数据等高价值数据领域,行业 壁垒更为明显。开源共训模式的兴起有望改变这一现状,特别是在中国有望 成为全球最大数据圈的背景下,数据开放共享的价值更为突出。 语料建设从重规模向重质量转型,催生新的商业机遇。"大力出奇迹"的发展 模式已经难以为继,从数据清洗、标注到合规咨询,从中间件服务到数据交 易平台,一系列新型数据服务业态正在形成。特别是在构建合成数据和专业 数据集方面,具备相关能力的企业将获得更大的发展空间。 版权与监管约束限制数据开放,体系建设亟待完善。中文数据在开放共享 方面面临诸多法规政策限制,大量高价值公共数据因版权和合规问题难以 转化为训练语料。虽然政府部门和国有企业掌握着丰富的数据资源,但受制 于数据安全、隐私保护等监管要求,开放程度仍然有限。同时,现有中文大 模型过度依赖英文数据训练的问题也日益凸显,导致模型输出存在明显的 文化语境缺失,对本地化应用形成掣肘。这一现状催生了对合规数据服务的 迫切需求,专业的数据合规咨询、治理服务有望成为新的业务增长点。

5.2. 中文语料资源加速累积,行业联盟协同发力

中文语料建设进入快速发展期,产业化进程明显提速。2024 年上半年,中 国 AI 语料建设迎来多个具有里程碑意义的重大项目。其中最具代表性的是 智源研究院 4 月发布的中文互联网语料库 CCI 2.0,该项目总规模达 500GB, 涵盖 1.25 亿个网页的高质量数据内容,为大模型训练提供了可靠的中文语 料支撑。CCI 2.0 的重要性不仅体现在其规模上,更在于其建立了严格的数 据质量管理体系,通过多轮清洗和质量把控,确保了语料的准确性和可用性。 同期,中国互联网协会召开的"大模型中文语料库的发展现状与高质量发展 路径"研讨会,深入探讨了数据清洗和合规操作的标准化问题,为行业发展 指明了方向。 多方联动构建数据生态,产业协同效应逐步显现。2024 年 7 月世界人工智 能大会期间,语料主题论坛的召开成为行业发展的重要催化剂。会上发起的 "语料生态服务大模型可持续发展倡议"获得 50 余家企业响应,展现了产业 各方协同推进的决心。该倡议着重强调构建数据共享、资源合作和第三方服 务的生态机制,为打破数据孤岛提供了可行路径。特别值得关注的是论坛上 推出的语料运营平台 1.0,该平台集成了数据采集、清洗、标注、测试和应 用的全流程工具链,极大提升了语料供给的效率和质量。通过产业联盟的方 式推动技术创新和标准制定,不仅降低了单个企业的研发成本,也加快了行 业整体的进步速度。

数据交易与开源项目双轮驱动,市场空间持续扩大。伴随行业发展提速,中 文 AI 语料的基础设施建设也在加快推进。上海数据交易所 2023 年 9 月推 出的语料交易挂牌项目,为数据的规范化流通提供了重要渠道。云测数据、 浪潮信息等企业通过共建机制积极参与语料生态建设,形成了良性的市场 格局。在开源领域,多模态语料库"书生·万卷"和腾讯的"AI 向善语料库"为 行业发展注入了新的活力。基础设施的完善为新型商业模式的发展创造了 条件,特别是在垂直领域应用中,专业化的数据服务平台开始崭露头角,围 绕特定场景提供定制化的语料解决方案。从产业链角度看,基础设施的完善 将赋能整个生态的升级,为上下游企业创造更大的发展空间。

5.3. 语料产业链上下游协同发力,推动中国语料生态建设

5.3.1. 多元数据源构建 AI 语料上游基础,驱动模型专业化发展

数据供给正在从量变走向质变,合规授权成为重要分水岭。从供给端看,互 联网公司、媒体平台和专业出版机构通过多渠道采集构建了庞大的多模态 数据库,其中,中文在线等头部企业已累积超 60TB 高质量正版数据,并与 多家 AI 模型公司建立深度合作关系。数据授权和合规建设正成为产业链上 游的新焦点,这种趋势将加速淘汰不合规的数据供应商,推动市场向规范化 方向发展,具备优质数据源和完整授权体系的企业将在行业竞争中占据有 利地位。 随着 AI 应用向各行业渗透,垂直领域的专业数据价值日益突出。在金融领 域,同花顺、恒生电子等专业机构积累了大量交易和金融数据;消费领域中 的值得买汇纳科技等机构在零售和电商场景数据方面具有优势;大宗商品 领域的上海钢联卓创资讯等机构则在能源、物流等数据积累上占据重要地 位;航运领域以中远海科为代表的企业在交通运输数据方面也形成了独特 优势。这些专业数据的价值主要体现在三个方面:一是具有极强的时效性, 能支撑实时决策;二是专业性强,涉及核心业务流程;三是获取门槛高,需 要长期积累和专业处理。随着 AI 应用从通用场景向专业领域渗透,具备深 度行业积累的专业数据服务商有望在细分市场中获得更大发展空间。

5.3.2. 中游环节平台升级,寡头构建技术和数据的双重壁垒

AI 数据产业链中游呈现寡头竞争格局,技术和数据的双重壁垒强化了头部 企业的优势地位。核心企业普遍具备两大特征:一是拥有大规模专有数据资 产,如拓尔思积累的 2000 亿条高质量公开数据;二是掌握深厚的技术积累, 如科大讯飞在语音技术领域的领先优势。既掌握核心技术,又拥有大规模的 专有数据资产的双重壁垒将使企业在市场竞争中具备持续领先优势。此外, 这些企业正从单一技术服务商向整体解决方案提供商转型,通过"技术+数 据+服务"的深度整合提升市场壁垒。

5.4. 国产语料建设新锐,夯实语料根基

拓尔思已在 AI 语料建设领域形成全方位竞争优势,依托超 2000 亿条高质 量公开数据和强大的数据处理能力确立了领先地位。拓尔思拥有 40 多项发 明专利和 1000 多项软件著作权,特别是在自然语言处理领域,通过持续创 新已实现文本的语义理解、分类、情感分析等核心功能,为智能客服、智能 写作等应用场景提供了有力支撑。在多模态内容处理方面,公司掌握自主可 控的底层技术,能够同时处理文本、音视频等多种类型数据,并在虚拟人智 能对话、内容生成等新兴领域取得突破。 2023 年 6 月发布的拓天大模型在媒体、政务、金融等领域取得显著成果。 拓天大模型基于超过 10 年的高质量数据积累,以及万家以上企业级用户实 践,具备内容生成、多轮对话、语义理解等十大基础能力。2024 年 5 月拓 尔思与华为签署全面合作协议,共同推进数智化转型,这一战略合作有望进 一步提升公司的市场竞争力。同时,公司通过"海贝"数据库的数据资产平台, 已在政府、媒体、金融等行业积累了大量优质客户,持续巩固其行业领先地 位。

海天瑞声成为国内首批完成大模型全流程语料布局的企业。根据接待调研 公告,公司已构建包括预训练、指令微调和偏好对齐的全链条语料体系,涵 盖"中文对话预训练数据集"、"多语种语音模型预训练及微调数据集"、"视觉 模型预训练及微调数据集(图像-文本、视频-文本)"等核心产品。特别是在垂 直领域,公司重点开发了医疗、金融、法律、艺术等专业领域标注资源库, 截至 2024 年三季度已为近 20 家境内外大模型企业、科研机构提供训练语 料服务。

海天瑞声在多语种语料资源积累方面确立领先优势。截至 2024 年三季度, 海天瑞声已沉淀超过 205 个语种/方言的语料覆盖能力,特别是在一带一路 沿线国家的小语种资源建设上显著领先同业;同时构建了 130 个多语种发 音词典,积累词条超 1200 万条。2024 年公司联合清华大学启动多语种语音 大模型研发计划,通过自研数据清洗技术,进一步提升多语种语料处理效率, 强化了公司在语料建设领域的核心竞争力。

博彦科技通过"数据+技术+生态"的融合模式构建差异化优势。公司自主研 发的"人工智能计算平台"提供从数据样本标注、模型部署到推理服务的一站 式 AI 开发能力,通过"可视化"操作和"零代码"开发大幅降低了 AI 应用的开 发门槛。2024 年 7 月推出的"企业数据价值运营方案"致力于消除数据孤岛, 通过汇聚行业数据构建专业化语料库。特别是在医药等垂直领域,公司通过 系统性的数据整合,打造了专业度极高的 AI 模型训练体系。另外,公司拥 有全方位生态合作体系,创新驱动能力强劲。公司与百度、华为、阿里、科 大讯飞等国内外大模型厂商建立了深度的生态及技术合作关系,成为文心 一言等产品的首批生态合作伙伴。

(转自:金融小博士)

海量资讯、精准解读,尽在新浪财经APP

VIP课程推荐

加载中...

APP专享直播

1/10

热门推荐

收起
新浪财经公众号
新浪财经公众号

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)

股市直播

  • 图文直播间
  • 视频直播间

7X24小时

  • 12-13 中力股份 603194 --
  • 12-10 林泰新材 920106 19.82
  • 12-09 博科测试 301598 38.46
  • 12-06 蓝宇股份 301585 23.95
  • 12-02 先锋精科 688605 11.29
  • 新浪首页 语音播报 相关新闻 返回顶部