生数科技下周全球发布Vidu Q1模型,强调高可控

生数科技下周全球发布Vidu Q1模型,强调高可控
2025年04月16日 13:33 TechWeb

【TechWeb】4月16日消息,在今日举办的第三届中国AIGC产业峰会上,生数科技产品副总裁、Vidu产品负责人廖谦透露,下周将全球发布即新的Vidu Q1模型,该大模型优化旨在大幅提升内容创作的可控性,尤其在位置控制、运动布局和音频生成上,以更贴近人类审美和自然法则。

廖谦表示,Vidu Q1模型将推动多模态大模型时代的变革,将极大增强个性化内容生成能力,对社交、游戏、VR/AR等领域产生深远影响。

生数科技(北京生数科技有限公司)成立于2023年3月,是一家专注于多模态生成式大模型与应用产品开发的高科技企业,核心团队来自清华大学人工智能研究院。

生数科技首创了基于Transformer的U-ViT架构,融合了Diffusion模型与Transformer的优势,支持多模态任务的统一建模。该架构在2023年开源的UniDiffuser模型中首次应用,成为全球首个基于Diffusion Transformer的多模态扩散模型,比Stable Diffusion 3采用的DiT架构领先一年。

基于U-ViT架构,生数科技2024年4月发布的视频大模型Vidu可一键生成16秒1080P高清视频,具备多镜头切换、高时空一致性和物理世界模拟能力,性能对标OpenAI的Sora。

新浪科技公众号
新浪科技公众号

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

创事记

科学探索

科学大家

苹果汇

众测

专题

官方微博

新浪科技 新浪数码 新浪手机 科学探索 苹果汇 新浪众测

公众号

新浪科技

新浪科技为你带来最新鲜的科技资讯

苹果汇

苹果汇为你带来最新鲜的苹果产品新闻

新浪众测

新酷产品第一时间免费试玩

新浪探索

提供最新的科学家新闻,精彩的震撼图片