对话宋亚宸:从 3D 生成到世界模型,VAST想搭一套「可交互世界」的底座

对话宋亚宸:从 3D 生成到世界模型,VAST想搭一套「可交互世界」的底座
2026年03月06日 14:31 雷锋网

“2023 年初我们就已经明确要做可交互的 3D 内容。”

作为 VAST 的创始人,宋亚宸回忆起当时创业的渊源,语气依旧笃定。在他的判断里,3D 生成迟迟没有真正普及,并不是因为技术路线不清晰,而是因为“到现在为止,其实都没有真正意义上的 3D UGC 平台”。(雷峰网雷峰网雷峰网(公众号:雷峰网)

这也是VAST选择从工具和模型入手,而不是等平台成熟后再进入的原因。在他看来,平台形态或许尚未出现,但内容生产方式的变化已经足够明确。

见到宋亚宸时,他正坐在办公室的桌前吃午饭。当天上午,一场访谈活动刚刚结束,他抓紧空档简单吃了几口,下午还有新的会面安排。月底,他还将飞往美国参加 GDC(游戏开发者大会)。

VAST 是一家成立于 2023年的人工智能公司,专注于通用 3D 大模型的研发与落地产品建设,其核心产品Tripo Studio(一站式 AI 3D 工作台),VAST 在 Tripo 系列中的两项核心突破,分别指向不同的 3D 生成方向:H3.1 强调高保真、高还原度的 3D 资产生成,而 P1.0 则聚焦于“可用性”——以接近人工建模的拓扑结构,实现极高速的 3D 资产生成。

对于游戏、XR 和 3D UGC 等实时引擎场景而言,真正决定资产能否被直接使用的,并不只是面数高低,而是拓扑是否干净、布线是否稳定,以及能否无缝进入 Unity、Unreal 等引擎管线继续编辑与部署。

打个比方,可以把 3D 模型理解成一件由很多小三角形拼成的“外壳”。三角形越多,细节就越丰富,但也越“费劲”。像 5000 面左右的低模,相当于一张分辨率不高、但足够清晰的图片,肉眼看来已经足以呈现出栩栩如生的逼真细节:轮廓和结构的完成度尚可,却不会给设备带来算力负担。

正因为如此,这类模型才能被广泛用在游戏、XR 和面向普通用户的 3D UGC 场景中,既能实时交互,又能规模化使用。

在商业落地上,生态合作覆盖阿里巴巴、腾讯、字节、网易、上汽、拓竹、优必选等头部企业与超过9万个开发者,旗下Tripo Studio平台已聚集超过650万创作者,累计生成近1亿个3D模型。

就在昨日,VAST宣布完成5000万美元A轮融资。本轮融资由阿里、恒旭资本(上汽旗下)联合领投,元禾璞华、百度风投、东方嘉富等跟投,老股东春华创投、北京市人工智能产业基金超额加注。

值得注意的是,这是阿里与百度同时在 AI 3D 赛道同框下注,也侧面反映出头部互联网与产业资本对 3D 生成赛道的共识正在形成。

与此同时,VAST 还同步更新了Tripo H3.1和Tripo P1.0大模型。

正如现场演示的一样,Tripo H3.1从输入指令到模型成型,系统在数秒内即可输出结构完整、贴图清晰的 3D效果图。而另一款Tripo P1.0,则进一步压缩了 3D 资产生成所需的时间成本——能够在2秒内输出专业建模师级别的3D模型,生成速度相当快。

VAST的创始人———宋亚宸,1997 年出生的他并非科班出身,而是文科背景,获得美国约翰霍普金斯大学国际关系学和经济学双学士学位,在创办 VAST之前,他曾任职于商汤科技,负责多个人工智能项目从 0 到 1 的战略分析与商业化落地;并联合创立 MiniMax。

在并不充裕的时间里,我们聊了3D大模型、Tripo Studio、世界模型、工业与创作,被问及模型相关时,宋亚宸现场为我演示了最新一版的Tripo Studio 的工作流程,仅需输入一张单图,进度条几乎在眨眼间跑完——仅仅一两秒钟,一个带有精细贴图材质、面数控制在 5000 面左右的可用 3D高精低模,便流畅地渲染在了屏幕中央。

这种需要专业人员耗费数天的“手工活”,直接被压缩至秒级就能完成。宋亚宸提到这些技术时认为,VAST 当前在跑的这套技术路线已经是“断崖式、断层式的领先”,甚至在谈到竞争格局时,他表示:“这两个技术一出,市面上基本没有什么对手”。

那是一种不太需要反复解释的自信,更像是已经在心里验证过多次后的结论。

其实,VAST 还是李飞飞World Labs 的 BP 里唯一提到的中国公司——李飞飞曾定义世界模型是由三大场景构成:3D 生成、XR 空间智能、机器人——前两个才是重点。

而 VAST 从成立之初,就押注了 3D 这一最原始、最自然、信息密度最高的内容模态。宋亚宸认为,世界模型是通用模型的终极形态,必须建立在对三维空间的原生理解之上。

以下是AI科技评论与VAST创业者宋亚宸的聊天实录:

AI科技评论:公司在创立初期的愿景是什么?为什么最终会选择切入 AI 3D 大模型赛道?

宋亚宸: 最早我们是想做一个世界级的交互内容平台,可以理解为“3D版的 TikTok” 。但在推进过程中我们发现,传统交互内容的创作门槛和成本太高了,如果不解决工具问题,就像是在“用毛笔写微博”,因此我们意识到,必须先打造一个大众级别的创作工具,让每个人能零门槛、零成本地实时创作。

当时平台形态还不存在,但我们觉得这件事一定会发生,所以选择先从底层工具和能力开始做。

因为创造一个世界需要两个能力:“造万物”(生成模型和场景)和“定规则”(编写代码和交互逻辑)两者结合,即构成创造世界的基础设施。基于此判断,我们确立了AI 3D大模型的定位:在AI coding已被广泛布局的背景下,专注于UGC交互内容平台,降低3D内容的生产门槛。

AI科技评论:在你们的产品出现之前,传统的 3D 内容生产面临哪些痛点?你们是如何改变工作流的?

宋亚宸: 传统的 3D 制作管线非常繁琐,需要基于十几种不同的引擎、建模软件,搭配几百种中间件和几千种插件,完全依靠手工搭建工作流 。 我们2025 年推出了全新的全链路 AI 工作流产品(Studio),它通过一系列自研算法,将几何、贴图、材质、绑定等环节整合在了一起,用 AI 工具替代了传统复杂的制作管线,极大地提升了生产力 。

AI科技评论:目前平台的用户体量如何?这些 3D 生成技术主要落地在哪些具体的行业场景中?

宋亚宸:目前我们的服务了超过9万家客户,工具平台拥有 650多万的专业开发者 ,我们的受众主要是海外用户,落地场景主要涵盖四大类:

重工业: 比如帮助车企(如上汽)快速生成海量 3D 车型,替代传统周期长、成本高的油泥模型评审,尤其是周期缩短才是核心变化。传统车型开发动辄一年,如今借助AI可压缩至数月;线下评审、层层审批的冗长流程,也被线上协作替代,效率提升的同时,设计方案的可选空间也更大。

轻工业与 UGC 制造: 涵盖首饰、玩具(如泡泡玛特)、鞋服包包的工业设计,以及彻底打通 3D 打印社区的建模门槛 。

虚拟内容: 包括游戏(网易等大厂及 UGC 游戏)、XR 元宇宙、动画和影视制作 。

交互展示展陈: 例如电商商品的三维展示、文博、教育课件等 。

AI科技评论:Tripo Studio 想解决的核心问题是什么?

宋亚宸:关于 Studio 的产品非常好理解,它本质上是打造了一个完整的 AI 工作流。在这个工作流中,用户可以顺畅地完成几何处理、贴图与材质赋予、PBR(基于物理的渲染)、拆分与补全、编辑与组合、笔刷风格化等一系列复杂操作。

核心还是生产效率和门槛。现在社会里几乎所有工业品,本质上都来自 3D 模型,但建模的成本、周期和专业门槛都非常高。

Tripo Studio 的目标,是让专业用户在工业设计、创意生成、产品外观等环节中,把原本需要几个月甚至一年的流程,压缩到几周甚至更短。

为了支撑这套全链路的工作流,我们在各个环节都自研了一系列全新的 AI 算法并重新定义了这一产品形态。产品推出后的市场反馈非常积极,无论是在收入还是用户规模上,都实现了爆发式的增长。

基于以上技术,我们目前主要提供两条产品线:第一条线是面向 PGC(专业内容生产)等用户的 Studio 工具平台;第二条线是面向企业客户的 API 服务。企业可以通过调用我们的 API,去赋能他们自身的 To B 或 To C 业务。截至目前,我们的 API 已经累计服务了超过 9 万家客户。

AI科技评论:公司近期在测试高模(高精度模型)和Smart Mesh(Tripo P1.0),两者在技术表现和应用落地上有什么差异?

宋亚宸: 这两款模型分别对应了不同的工业级需求:

高模(高精度模型): 它的面数高达数百万面,细节极其精细,连内部结构和螺纹都能精准呈现 。它非常适合工业设计、3D 打印和影视等对模型精度要求极高,但对实时渲染压力不敏感的场景 。

Smart Mesh(Tripo P1.0): Tripo P1.0 可以在2秒内直接生成专业建模师水平的3D模型——拓扑干净、布线稳定、引擎可用,并且我们发现在这一全新思路之下,模型的可编辑性和精度的可拓展性获得极高的优化潜力。

AI科技评论:为什么 3D内容一直没有像文字、图片、视频那样普及?

宋亚宸:在过去两年里,3D打印在硬件机型和新材料上并没有出现本质的技术突破,FDM 依然无法实现全彩,行业的传统痛点依然存在 。然而,3D 打印机的出货量却迎来了暴涨 。其核心原因在于,行业的目标用户群体从千万级别跨越到了十亿级别。

3D 打印普及的真正难点,其实不在于机器的操作按钮有多复杂,而在于普通用户缺乏 3D 建模能力,导致买完机器后“不知道能打什么” 。过去,普通用户哪怕只是想打印一个简单的手机壳,都需要去学习 Blender、3DMAX 或 Maya 等专业软件,这对大众而言显然是不现实的门槛 。而现在,3D 生成技术的出现真正解决了这个问题。

AI科技评论:数据显示目前海外用户占比很高,当时为什么会制定出海的商业化策略?

宋亚宸: 目前海外用户占比大约在 85% 。其实起初我们对全球市场是一视同仁的,但在实际跑数据的过程中发现,欧美等海外市场的付费率更高、用户的忠诚度和续费率更好,整体的 LTV(客户终身价值)也更高 。所以是真实的数据反馈决定了我们以海外市场为主的策略 。

AI科技评论:公司目前的团队规模如何?在内部团队管理上秉持什么样的理念?

宋亚宸: 我们团队目前有 100 多人,绝大部分是研发人员 。 我们的管理理念是非常实事求是的 。我们没有强制的打卡、复杂的职级或是 Title,前三年甚至都没有设置 OKR 。我们把市面上所有的管理机制当做一个“工具箱”,只有当公司发展到特定阶段、遇到了真实问题时(比如团队变大需要对齐目标时),我们才会从工具箱里拿出相应的管理工具来解决问题,而不是盲目照搬大厂机制。

AI科技评论:您个人并非传统理工科方向,这种跨界背景对您执掌一家硬核 AI 科技公司有什么独特影响吗?

宋亚宸: 创业的核心在于你想做成一件什么样的事,把这件事情的终局描述清楚是最重要的,而技术(无论是 AI 还是世界模型)只是达到这个终局的路径,并不是说做科技公司就必须是特定学科的教授或博士出身 。

AI科技评论:公司目前在做3D大模型和世界模型,这两者之间是什么关系?

宋亚宸: 其实它们本质上是一个东西。世界模型的底座就是基于 AI 3D大模型的算法建立的 。你可以这样理解,世界模型是 AI 加上图形学 。如果说原来的 3D 大模型是80% 的图形学加 20% 的 AI,那么世界模型可能就是 AI 和图形学各占一半的比例。

AI科技评论:世界模型的应用场景和目标用户群体是怎样的?

宋亚宸: 世界模型是给所有人、所有客户使用的,具体的应用场景非常广泛,你可以用它来做具身智能的仿真模型,也可以用来做数字孪生,或者应用于文娱等各种各样的场景,任何需要“在一个世界里运行和互动”的场景,都可能用到世界模型。

AI科技评论:近期公司完成了新一轮融资,您如何看待融资与公司战略“正确性”之间的关系?投资人为何在这个阶段选择下注?

宋亚宸: 融不融资与事情本身是否完全正确并没有必然联系,它更多代表的是市场和投资人对这件事情形成了一定的阶段性共识 。创业本身就是一个不断探索的过程,在最后一刻真正把事情做成之前,很难定论什么是绝对正确的 。

投资人之所以在这个阶段选择投资,主要基于三方面原因:首先,我们在世界模型等前沿方向上布局较早且走在比较前沿的位置 ;其次,AI 3D 大模型技术的成熟已经切实带来了不错的商业化收入 ;最后,市场对于可交互的 UGC 内容平台也产生了新的认知与共识 。(作者持续跟踪 AI 应用与模型更新,欢迎加微信Who123start交流)

3DAI
新浪科技公众号
新浪科技公众号

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

创事记

科学探索

科学大家

苹果汇

众测

专题

官方微博

新浪科技 新浪数码 新浪手机 科学探索 苹果汇 新浪众测

公众号

新浪科技

新浪科技为你带来最新鲜的科技资讯

苹果汇

苹果汇为你带来最新鲜的苹果产品新闻

新浪众测

新酷产品第一时间免费试玩

新浪探索

提供最新的科学家新闻,精彩的震撼图片