商汤推出“日日新”融合大模型,勇夺“双冠王”

商汤推出“日日新”融合大模型,勇夺“双冠王”
2025年01月10日 14:07 财经网

今年大模型还要如何进化,还有怎样的想象空间?

刚刚,商汤正式推出 “日日新”融合大模型,领先实现原生融合模态,深度推理能力与多模态信息处理能力均大幅提升,并在两大权威评测榜单夺得第一,成为“双冠王”。

国内权威大模型测评机构SuperCLUE最新发布的《中文大模型基准测评2024年度报告》:商汤“日日新”融合大模型以总分68.3的优异成绩,与 DeepSeek V3 一起并列国内榜首,成为年度第一。

在近期另一个权威综合评测机构OpenCompass的多模态评测中,商汤以同一款模型同样取得了榜单第一,分数大幅领先GPT-4o。

一个模型、双料冠军”,意味着商汤科技率先在原生融合模态训练取得实质性突破,这将引领业界从大语言模型和多模态大模型分立的普遍现状,走向真正意义的模型一统。

商汤“日日新”突破了模态融合的技术,跨越了模态之间的鸿沟,就为深度推理能力和多模态信息的结合铺平了道路。

文理兼修,能写能看能推理

商汤“日日新”融合大模型性能上文理兼修,在SuperCLUE年度评测中,文科成绩以81.8分位列全球第一,超越OpenAI的o1模型;理科成绩夺得金牌,其中计算维度以78.2分位列国内第一。

实现原生模态融合后,“日日新”融合大模型不止能达到人类“看”和“想”的水平,还可以帮助你解决更多复杂问题,看不清的字体、数据图表里的信息、文学创作与撰写……这些都可以实现。

英文“草书”难以辨认,发给“日日新”融合大模型看看,识别快速精准。

图表分析,关键要素提取、信息分析、给出结论,几个步骤合一迅速完成,省时省力。

也可以化身“数理老师”,给出详细的解答任务。

解数学题↓↓

解物理题↓↓

创意冷幽默没人懂?“日日新”懂你的奇奇怪怪创意冷幽默没人懂?“日日新”懂你的奇奇怪怪

融合模态开拓应用新维度

在实际应用场景中,相较于传统大语言模型仅支持单一文本输入的模式,"日日新"融合大模型展现出显著优势,尤其是在自动驾驶、视频交互、办公教育、金融、园区管理、工业制造等天然拥有丰富模态信息的场景中。

“日日新"融合大模型能够有效满足用户对图像、视频、语音、文本等多源异构信息的综合处理与识别需求。

例如,在办公、金融领域,其行业属性拥有很多复杂的富模态文档:表格、文本、图片、视频,以及融合上述形式的丰富信息,基于“日日新”融合大模型的商汤应用——办公小浣熊就可以高效地完成处理分析相关的复杂任务。

与此同时,基于融合大模型的优势,商汤“日日新”在视觉交互上也有丰富的应用场景,例如,在线上教育、语音客服等场景,均可以结合语音和自然语言来提升交互体验。

去年年底开始,原生多模态大模型就逐渐成为业内探讨的重要方向。然而由于数据和训练方法的局限,业内很多机构的尝试并不成功——多模态训练过程往往会导致纯语言任务尤其是指令跟随和推理任务的性能严重下降。

得益于在计算机视觉领域十年深耕以及人工智能赋能场景的丰富经验,商汤一直坚信多模态模型是 AI 2.0 进行场景落地的必由之路,对于多模态大模型的研发也有自己的独特见解。在推动语言模型和多模态模型融合的过程中,发展出两项关键的创新技术:融合模态数据合成与融合任务增强训练,进而完成“日日新”融合大模型的训练,推向市场。

在预训练阶段,商汤不仅采用了天然存在的海量图文交错数据,还通过逆渲染、基于混合语义的图像生成等方法合成了大量融合模态数据,在图文模态之间建立起大量交互桥梁,使得模型基座对于模态之间的丰富关系有更扎实的掌握,也为更好地完成跨模态任务打下坚实的基础,从而实现整体性能的提升。

在后训练阶段,商汤基于对广泛业务场景的认知,构建了大量的跨模态任务,包括视频交互、多模态文档分析、城市场景理解、车载场景理解等。通过把这些任务融入到增强训练的过程,商汤的融合模态模型不仅被激发出强大的对多模态信息进行整合理解分析的能力,而且还形成了对业务场景有效的响应能力,走通了应用落地反哺基础模型迭代的闭环。

免责声明:此文内容为本网站刊发或转载企业宣传资讯,仅代表作者个人观点,与本网无关。文章不构成投资建议,仅供读者参考,并请自行核实相关内容。

海量资讯、精准解读,尽在新浪财经APP
推理

APP专享直播

开播时间 | 1-17 19:00
南方基金:“出海”投资 QDII基金大揭秘
开播时间 | 1-17 19:00
创金合信基金 陈建军、刘毅恒:内需发力,消费能否破茧成蝶?
开播时间 | 1-17 16:00
招商基金 汪洋:债市波动加大,配置性价比还在吗?
开播时间 | 1-17 16:00
国君资管:步入2025,股债市怎么看?
开播时间 | 1-17 16:00
嘉实基金:【我是顾问 】守住钱袋子,过好幸福年
开播时间 | 1-17 16:00
光大证券李泉:四季度GDP提速,政策促进经济明显回升
开播时间 | 1-17 15:30
国投瑞银:“债”与你相遇 | 债券“牛市”还能持续吗?
开播时间 | 1-17 14:00
2025中国房地产年度趋势论坛:高培勇、伍戈、仇保兴等演讲
开播时间 | 1-17 14:00
摩根士丹利基金:“多元视角前瞻2025”摩根士丹利基金市场洞察2025年度主题策略会
开播时间 | 1-17 13:40
天弘基金:春季躁动,A股开启反弹行情?
开播时间 | 1-17 19:00
南方基金:“出海”投资 QDII基金大揭秘
开播时间 | 1-17 19:00
创金合信基金 陈建军、刘毅恒:内需发力,消费能否破茧成蝶?
开播时间 | 1-17 16:00
招商基金 汪洋:债市波动加大,配置性价比还在吗?
开播时间 | 1-17 16:00
国君资管:步入2025,股债市怎么看?
开播时间 | 1-17 16:00
嘉实基金:【我是顾问 】守住钱袋子,过好幸福年
开播时间 | 1-17 16:00
光大证券李泉:四季度GDP提速,政策促进经济明显回升
开播时间 | 1-17 15:30
国投瑞银:“债”与你相遇 | 债券“牛市”还能持续吗?
开播时间 | 1-17 14:00
2025中国房地产年度趋势论坛:高培勇、伍戈、仇保兴等演讲
开播时间 | 1-17 14:00
摩根士丹利基金:“多元视角前瞻2025”摩根士丹利基金市场洞察2025年度主题策略会
开播时间 | 1-17 13:40
天弘基金:春季躁动,A股开启反弹行情?
上一页下一页
1/10

热门推荐

TikTok呼吁美政府“立即明确”不强制执行禁令:否则将于19日被迫“关闭” 收起
TikTok呼吁美政府“立即明确”不强制执行禁令:否则将于19日被迫“关闭”

TikTok呼吁美政府“立即明确”不强制执行禁令:否则将于19日被迫“关闭”

  • 2025年01月18日
  • 01:34
  • APP专享
  • 广西台新闻910
  • 55,015
APP专享
呼和浩特市农牧局致歉:邀请“李维刚”直播带货期间,对经销商审核把关不到位

呼和浩特市农牧局致歉:邀请“李维刚”直播带货期间,对经销商审核把关不到位

  • 2025年01月17日
  • 15:20
  • APP专享
  • 我是山河君
  • 3,832
APP专享
董明珠被停职审查?格力刚刚回应

董明珠被停职审查?格力刚刚回应

  • 2025年01月18日
  • 07:22
  • APP专享
  • 我是山河君
  • 2,691
APP专享
新浪财经公众号
新浪财经公众号

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)

股市直播

  • 图文直播间
  • 视频直播间
更多>
股票简称 最新价 涨跌幅
以下为热门股票
三峡能源 4.22 +0.48%
京东方A 4.34 +0.70%
TCL科技 4.92 -0.61%
中远海控 14.28 -0.90%
格力电器 46.00 -0.65%
广告

7X24小时

  • 01-16 亚联机械 001395 --
  • 01-16 海博思创 688411 --
  • 01-14 富岭股份 001356 --
  • 01-13 兴福电子 688545 11.68
  • 01-13 超研股份 301602 6.7
  • 广告
    新浪首页 语音播报 相关新闻 返回顶部