交互效果对标 GPT-4o,商汤发布国内首个所见即所得模型“日日新 5o”

交互效果对标 GPT-4o,商汤发布国内首个所见即所得模型“日日新 5o”
2024年07月05日 13:51 IT之家

IT之家 7 月 5 日消息,商汤科技发布“日日新 SenseNova 5.5”大模型体系,并发布国内首个所见即所得模型“日日新 5o”,交互效果对标 GPT-4o。

通过整合跨模态信息,基于声音、文本、图像和视频等多种形式,“日日新 5o”带来全新的 AI 交互模式 —— 实时的流式多模态交互。

据介绍,“日日新 5o”能听、会看、更会找话题,就如同“真人聊天一般”,这种交互模式适用于实时对话和语音识别等应用,能够在同一模型中自然处理多种任务,且根据不同上下文自适应调整行为和输出。

日日新 5.5 是国内首个正式发布的流式原生多模态交互模型,模型训练基于超过 10TB tokens 高质量训练数据,包括大量高质量的人工合成数据,构建了高阶思维链。模型采用混合端云协同架构,拥有 6000 亿参数,可最大限度发挥云边端协同,达到 109.5 字 / 秒的推理速度。

据IT之家此前报道,商汤科技在世界人工智能大会上还发布了首个“可控”人物视频生成大模型 Vimi,通过一张任意风格的照片就能生成和目标动作一致的人物类视频,并支持多种驱动方式,可通过已有人物视频、动画、声音、文字等多种元素进行驱动。

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

it之家
新浪科技公众号
新浪科技公众号

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

创事记

科学探索

科学大家

苹果汇

众测

专题

官方微博

新浪科技 新浪数码 新浪手机 科学探索 苹果汇 新浪众测

公众号

新浪科技

新浪科技为你带来最新鲜的科技资讯

苹果汇

苹果汇为你带来最新鲜的苹果产品新闻

新浪众测

新酷产品第一时间免费试玩

新浪探索

提供最新的科学家新闻,精彩的震撼图片