商汤上半年生成式AI增幅达256% 端侧大模型推动AI落地提速

商汤上半年生成式AI增幅达256% 端侧大模型推动AI落地提速
2024年09月02日 08:21 中国经营报

近日,商汤(0020.HK)交出了一份亮眼的半年报。在截至今年6月30日的六个月里,商汤实现营收17.4亿元人民币,同比增长21%,其中生成式AI业务在上半年实现了256%的大幅增长,在营收中的贡献占比超过六成,成为商汤的主导性业务。

商汤集团董事长兼CEO徐立表示:“生成式AI迎来黄金发展时期,我们正处于下一波增长的有利位置。商汤核心优势在于‘大装置+大模型’深度协同,具备打造对标一流的大模型能力,在原生多模态、视频流自然交互,以及低成本模型推理架构上构建独特的优势,从而在激烈的市场竞争中脱颖而出。从这次中期业绩反映,公司全面向生成式AI转型升级的战略目标已阶段性达成,未来我们将不懈地革新技术,引领行业迈向通用人工智能(AGI)时代。”

在AI大模型技术持续火热的同时,落地应用成为业内关注度最高的话题,也是对包括商汤在内的AI企业最重要的考验。行业普遍认为,“2024年AI落地的最大看点在于从App应用转向端侧部署。”商汤基于此瞄准端侧大模型布局,或许我们从半年报中能找到答案。

推出端侧小模型

覆盖多品类智能设备、提升交互体验

财报披露,商汤“日日新”大模型客户从互联网行业扩展至智能硬件、电动汽车、机器人、医疗、金融等行业。报告期内,“日日新”大模型整体调用量实现了400%的增长,客户数和客户平均调用规模均大幅增长。

亮眼的数据增长,一方面得益于我国在移动互联网时代积累的智能设备数量优势,另一方面离不开商汤的技术优势积累,在实现能力飞跃式提升的同时推动推理成本快速下降,为AI的应用与普及进一步降低了门槛。

商汤“日日新”大模型集合了该公司的尖端研发资源,自截至2024年8月运营GPU总数5.4万张。就在今年7月,商汤发布了“日日新SenseNova 5.5”,在多模态能力方面,“日日新5.5版本”在大多项核心测试集指标上对标。与此同时,商汤还面向端侧推理效率提升的需求与痛点发布了端侧小模型“日日新5.5 Lite”,推理速度可达每秒100字,延迟则可降至几十毫秒。技术的领先带来价格的优势 ,通过端云协同这样一种新的推理架构,接入商汤“日日新•商量”端侧大模型,单台设备成本低至9.9元/年。

国际数据公司(IDC)发布的《中国智算服务市场(2023下半年)跟踪》报告显示,商汤科技在中国云计算基础设施厂商中脱颖而出,与火山引擎、阿里巴巴共同跻身2023年下半年中国生成式AI IaaS服务厂商TOP 3,以显著的市场份额优势位居GenAI IaaS领域的第一梯队。商汤智算服务规模化效应逐渐显现,截至今年8月底,运营总算力规模已突破 20000 PetaFLOPS,相比3月时提升约70%。

截至目前,商汤“日日新”端侧模型已实现多元落地,与超过150家客户启动商业对接,覆盖智能手机、平板电脑、VR一体机、车载电脑、智能台灯等诸多IoT设备部署应用。报告期内,3000多家行业头部企业使用商汤的大模型及智算服务。

在智能终端领域,商汤的端侧小模型服务了全球主流安卓手机厂商客户。而在智能汽车领域,商汤“绝影”持续推进UniAD端到端自动驾驶的量产研发。在量产交付方面,商汤“绝影”智能汽车业务上半年新增交付70.5万辆,同比增长80%,累计交付车辆数达到260万辆、覆盖104个车型。

商汤表示,端侧是大模型的主要应用场景。相较于文字输入,语音、视频等多模态的输入是一种更自然的交互方式。借助端云协同的新推理架构,成本降低也有助于大模型覆盖到更多IoT设备,不仅是高端手机,还可以应用于中端、低端手机,电视、音箱等设备,实现智能交互功能。

端侧大模型推动AI更广泛应用

商汤在手机、车载端侧模型增长强劲

所谓“端侧”大模型是指将大模型部署在终端设备上。众所周知,千亿级参数大模型对计算基础设施提出了极高的要求,因此无论是训练,还是推理,大型复杂模型主要部署在云端。云端推理当前面临着成本较高且随着用户活跃数增加而提升,此外还有能耗过大、数据隐私安全难以有效保障等挑战,在这种背景下,端侧大模型成为产业界的重点发力方向。业内分析指出,端侧模型的主要优势在于本地化运行的特点,数据无须上传至云端,减少了数据泄露的风险;直接在本地进行推理和计算,依靠端侧AI芯片性能的支持,可以实现实时响应,提供更流畅的用户体验。除此之外,即使没有网络连接,端侧模型也可离线使用,满足各种场景的需求。

多家券商研报提出,十分看好端侧大模型的广泛应用前景。以智能汽车为例,今年7月,商汤“绝影”宣布在行业率先实现原生多模态大模型的车端部署,并在现场演示了搭载在200 TOPS+平台上的8B模型(即80亿参数)车端部署方案,展示出多模态感知和交互能力。“绝影”行业领先的车载端侧8B模型,首包延迟可低至300毫秒以内,推理速度40 Tokens/秒,并且能够覆盖主流算力平台。更早之前,在今年4月北京国际车展上,在没有高精地图的条件下,“绝影”UniAD仅靠视觉感知完成复杂的实况道路测试,实车测试效果惊艳。更为重要的是,商汤方面指出,受特斯拉FSD V12版本的端到端自动驾驶方案影响,行业号称“端到端”智驾方案不断涌现,大多由感知和决策两个模型组成的 “两段式”架构。商汤UniAD将感知、决策、规划等模块都整合到一个全栈Transformer端到端模型,实现感知决策一体化的“真·端到端”自动驾驶,被行业誉为“中国版的FSD”。2024年6月,国家相关部门公布了全国首批开展L3自动驾驶上路通行试点的9家车企,“绝影”为9家中的2家——广汽和一汽提供L3智驾解决方案。

在智能手机领域,商汤基于在智能终端多年的积累,构建起了行业领先的、不同规格的端侧模型。商汤在生成式AI端侧模型率先实现了业界领先的16 tokens/秒的推理速度,这些智能终端模型对于AI 手机来说至关重要,它们能够听取用户的指令,并调用手机上的各类应用程序完成复杂任务。

总结来说,相比大型模型,小模型的训练和部署成本较低,对计算资源的要求也相对较小。这使得更多的企业和开发者能够负担得起使用小模型的成本,从而推动人工智能技术在更广泛领域的应用。

据IDC最新发布的《中国大模型平台市场份额,2023:大模型元年——初局》报告,2023 年中国大模型平台及相关应用市场规模达 17.65 亿元人民币。另据共研产业研究院预测,2024年中国端侧大模型市场规模将达到21亿元。从市场格局来看,IDC数据显示,商汤科技受益于其对大模型的专注投入,以及其所建设的上海AIDC能够为客户提供一体化的大模型计算与应用解决方案,位居大模型市场份额第二,达16%。由这些数据不难看出,在生成式AI爆发的关键节点,商汤率先完成业务转型、占领先机。基于数十亿的市场需求、商汤领先的技术优势、商汤领先的市占率等因素,商汤科技在端侧大模型的发展前景可期,未来有望进一步释放企业价值。

海量资讯、精准解读,尽在新浪财经APP
AI 推理

VIP课程推荐

加载中...

APP专享直播

1/10

热门推荐

收起
新浪财经公众号
新浪财经公众号

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)

股市直播

  • 图文直播间
  • 视频直播间

7X24小时

  • 09-06 众鑫股份 603091 --
  • 09-03 中草香料 920016 7.5
  • 09-02 慧翰股份 301600 39.84
  • 08-26 富特科技 301607 14
  • 08-23 益诺思 688710 19.06
  • 新浪首页 语音播报 相关新闻 返回顶部