对话宋亚宸：从 3D 生成到世界模型，VAST想搭一套「可交互世界」的底座|3D|AI_新浪科技

“2023 年初我们就已经明确要做可交互的 3D 内容。”

作为 VAST 的创始人，宋亚宸回忆起当时创业的渊源，语气依旧笃定。在他的判断里，3D 生成迟迟没有真正普及，并不是因为技术路线不清晰，而是因为“到现在为止，其实都没有真正意义上的 3D UGC 平台”。（雷峰网雷峰网雷峰网(公众号：雷峰网)）

这也是VAST选择从工具和模型入手，而不是等平台成熟后再进入的原因。在他看来，平台形态或许尚未出现，但内容生产方式的变化已经足够明确。

见到宋亚宸时，他正坐在办公室的桌前吃午饭。当天上午，一场访谈活动刚刚结束，他抓紧空档简单吃了几口，下午还有新的会面安排。月底，他还将飞往美国参加 GDC（游戏开发者大会）。

VAST 是一家成立于 2023年的人工智能公司，专注于通用 3D 大模型的研发与落地产品建设，其核心产品Tripo Studio（一站式 AI 3D 工作台），VAST 在 Tripo 系列中的两项核心突破，分别指向不同的 3D 生成方向：H3.1 强调高保真、高还原度的 3D 资产生成，而 P1.0 则聚焦于“可用性”——以接近人工建模的拓扑结构，实现极高速的 3D 资产生成。

对于游戏、XR 和 3D UGC 等实时引擎场景而言，真正决定资产能否被直接使用的，并不只是面数高低，而是拓扑是否干净、布线是否稳定，以及能否无缝进入 Unity、Unreal 等引擎管线继续编辑与部署。

打个比方，可以把 3D 模型理解成一件由很多小三角形拼成的“外壳”。三角形越多，细节就越丰富，但也越“费劲”。像 5000 面左右的低模，相当于一张分辨率不高、但足够清晰的图片，肉眼看来已经足以呈现出栩栩如生的逼真细节：轮廓和结构的完成度尚可，却不会给设备带来算力负担。

正因为如此，这类模型才能被广泛用在游戏、XR 和面向普通用户的 3D UGC 场景中，既能实时交互，又能规模化使用。

在商业落地上，生态合作覆盖阿里巴巴、腾讯、字节、网易、上汽、拓竹、优必选等头部企业与超过9万个开发者，旗下Tripo Studio平台已聚集超过650万创作者，累计生成近1亿个3D模型。

就在昨日，VAST宣布完成5000万美元A轮融资。本轮融资由阿里、恒旭资本（上汽旗下）联合领投，元禾璞华、百度风投、东方嘉富等跟投，老股东春华创投、北京市人工智能产业基金超额加注。

值得注意的是，这是阿里与百度同时在 AI 3D 赛道同框下注，也侧面反映出头部互联网与产业资本对 3D 生成赛道的共识正在形成。

与此同时，VAST 还同步更新了Tripo H3.1和Tripo P1.0大模型。

正如现场演示的一样，Tripo H3.1从输入指令到模型成型，系统在数秒内即可输出结构完整、贴图清晰的 3D效果图。而另一款Tripo P1.0，则进一步压缩了 3D 资产生成所需的时间成本——能够在2秒内输出专业建模师级别的3D模型，生成速度相当快。

VAST的创始人———宋亚宸，1997 年出生的他并非科班出身，而是文科背景，获得美国约翰霍普金斯大学国际关系学和经济学双学士学位，在创办 VAST之前，他曾任职于商汤科技，负责多个人工智能项目从 0 到 1 的战略分析与商业化落地；并联合创立 MiniMax。

在并不充裕的时间里，我们聊了3D大模型、Tripo Studio、世界模型、工业与创作，被问及模型相关时，宋亚宸现场为我演示了最新一版的Tripo Studio 的工作流程，仅需输入一张单图，进度条几乎在眨眼间跑完——仅仅一两秒钟，一个带有精细贴图材质、面数控制在 5000 面左右的可用 3D高精低模，便流畅地渲染在了屏幕中央。

这种需要专业人员耗费数天的“手工活”，直接被压缩至秒级就能完成。宋亚宸提到这些技术时认为，VAST 当前在跑的这套技术路线已经是“断崖式、断层式的领先”，甚至在谈到竞争格局时，他表示：“这两个技术一出，市面上基本没有什么对手”。

那是一种不太需要反复解释的自信，更像是已经在心里验证过多次后的结论。

其实，VAST 还是李飞飞World Labs 的 BP 里唯一提到的中国公司——李飞飞曾定义世界模型是由三大场景构成：3D 生成、XR 空间智能、机器人——前两个才是重点。

而 VAST 从成立之初，就押注了 3D 这一最原始、最自然、信息密度最高的内容模态。宋亚宸认为，世界模型是通用模型的终极形态，必须建立在对三维空间的原生理解之上。

以下是AI科技评论与VAST创业者宋亚宸的聊天实录：

AI科技评论：公司在创立初期的愿景是什么？为什么最终会选择切入 AI 3D 大模型赛道？

宋亚宸：最早我们是想做一个世界级的交互内容平台，可以理解为“3D版的 TikTok” 。但在推进过程中我们发现，传统交互内容的创作门槛和成本太高了，如果不解决工具问题，就像是在“用毛笔写微博”，因此我们意识到，必须先打造一个大众级别的创作工具，让每个人能零门槛、零成本地实时创作。

当时平台形态还不存在，但我们觉得这件事一定会发生，所以选择先从底层工具和能力开始做。

因为创造一个世界需要两个能力：“造万物”（生成模型和场景）和“定规则”（编写代码和交互逻辑）两者结合，即构成创造世界的基础设施。基于此判断，我们确立了AI 3D大模型的定位：在AI coding已被广泛布局的背景下，专注于UGC交互内容平台，降低3D内容的生产门槛。

AI科技评论：在你们的产品出现之前，传统的 3D 内容生产面临哪些痛点？你们是如何改变工作流的？

宋亚宸：传统的 3D 制作管线非常繁琐，需要基于十几种不同的引擎、建模软件，搭配几百种中间件和几千种插件，完全依靠手工搭建工作流。我们2025 年推出了全新的全链路 AI 工作流产品（Studio），它通过一系列自研算法，将几何、贴图、材质、绑定等环节整合在了一起，用 AI 工具替代了传统复杂的制作管线，极大地提升了生产力。

AI科技评论：目前平台的用户体量如何？这些 3D 生成技术主要落地在哪些具体的行业场景中？

宋亚宸：目前我们的服务了超过9万家客户，工具平台拥有 650多万的专业开发者，我们的受众主要是海外用户，落地场景主要涵盖四大类：

重工业：比如帮助车企（如上汽）快速生成海量 3D 车型，替代传统周期长、成本高的油泥模型评审，尤其是周期缩短才是核心变化。传统车型开发动辄一年，如今借助AI可压缩至数月；线下评审、层层审批的冗长流程，也被线上协作替代，效率提升的同时，设计方案的可选空间也更大。

轻工业与 UGC 制造：涵盖首饰、玩具（如泡泡玛特）、鞋服包包的工业设计，以及彻底打通 3D 打印社区的建模门槛。

虚拟内容：包括游戏（网易等大厂及 UGC 游戏）、XR 元宇宙、动画和影视制作。

交互展示展陈：例如电商商品的三维展示、文博、教育课件等。

AI科技评论：Tripo Studio 想解决的核心问题是什么？

宋亚宸：关于 Studio 的产品非常好理解，它本质上是打造了一个完整的 AI 工作流。在这个工作流中，用户可以顺畅地完成几何处理、贴图与材质赋予、PBR（基于物理的渲染）、拆分与补全、编辑与组合、笔刷风格化等一系列复杂操作。

核心还是生产效率和门槛。现在社会里几乎所有工业品，本质上都来自 3D 模型，但建模的成本、周期和专业门槛都非常高。

Tripo Studio 的目标，是让专业用户在工业设计、创意生成、产品外观等环节中，把原本需要几个月甚至一年的流程，压缩到几周甚至更短。

为了支撑这套全链路的工作流，我们在各个环节都自研了一系列全新的 AI 算法并重新定义了这一产品形态。产品推出后的市场反馈非常积极，无论是在收入还是用户规模上，都实现了爆发式的增长。

基于以上技术，我们目前主要提供两条产品线：第一条线是面向 PGC（专业内容生产）等用户的 Studio 工具平台；第二条线是面向企业客户的 API 服务。企业可以通过调用我们的 API，去赋能他们自身的 To B 或 To C 业务。截至目前，我们的 API 已经累计服务了超过 9 万家客户。

AI科技评论：公司近期在测试高模（高精度模型）和Smart Mesh（Tripo P1.0），两者在技术表现和应用落地上有什么差异？

宋亚宸：这两款模型分别对应了不同的工业级需求：

高模（高精度模型）：它的面数高达数百万面，细节极其精细，连内部结构和螺纹都能精准呈现。它非常适合工业设计、3D 打印和影视等对模型精度要求极高，但对实时渲染压力不敏感的场景。

Smart Mesh（Tripo P1.0）： Tripo P1.0 可以在2秒内直接生成专业建模师水平的3D模型——拓扑干净、布线稳定、引擎可用，并且我们发现在这一全新思路之下，模型的可编辑性和精度的可拓展性获得极高的优化潜力。

AI科技评论：为什么 3D内容一直没有像文字、图片、视频那样普及？

宋亚宸：在过去两年里，3D打印在硬件机型和新材料上并没有出现本质的技术突破，FDM 依然无法实现全彩，行业的传统痛点依然存在。然而，3D 打印机的出货量却迎来了暴涨。其核心原因在于，行业的目标用户群体从千万级别跨越到了十亿级别。

3D 打印普及的真正难点，其实不在于机器的操作按钮有多复杂，而在于普通用户缺乏 3D 建模能力，导致买完机器后“不知道能打什么” 。过去，普通用户哪怕只是想打印一个简单的手机壳，都需要去学习 Blender、3DMAX 或 Maya 等专业软件，这对大众而言显然是不现实的门槛。而现在，3D 生成技术的出现真正解决了这个问题。

AI科技评论：数据显示目前海外用户占比很高，当时为什么会制定出海的商业化策略？

宋亚宸：目前海外用户占比大约在 85% 。其实起初我们对全球市场是一视同仁的，但在实际跑数据的过程中发现，欧美等海外市场的付费率更高、用户的忠诚度和续费率更好，整体的 LTV（客户终身价值）也更高。所以是真实的数据反馈决定了我们以海外市场为主的策略。

AI科技评论：公司目前的团队规模如何？在内部团队管理上秉持什么样的理念？

宋亚宸：我们团队目前有 100 多人，绝大部分是研发人员。我们的管理理念是非常实事求是的。我们没有强制的打卡、复杂的职级或是 Title，前三年甚至都没有设置 OKR 。我们把市面上所有的管理机制当做一个“工具箱”，只有当公司发展到特定阶段、遇到了真实问题时（比如团队变大需要对齐目标时），我们才会从工具箱里拿出相应的管理工具来解决问题，而不是盲目照搬大厂机制。

AI科技评论：您个人并非传统理工科方向，这种跨界背景对您执掌一家硬核 AI 科技公司有什么独特影响吗？

宋亚宸：创业的核心在于你想做成一件什么样的事，把这件事情的终局描述清楚是最重要的，而技术（无论是 AI 还是世界模型）只是达到这个终局的路径，并不是说做科技公司就必须是特定学科的教授或博士出身。

AI科技评论：公司目前在做3D大模型和世界模型，这两者之间是什么关系？

宋亚宸：其实它们本质上是一个东西。世界模型的底座就是基于 AI 3D大模型的算法建立的。你可以这样理解，世界模型是 AI 加上图形学。如果说原来的 3D 大模型是80% 的图形学加 20% 的 AI，那么世界模型可能就是 AI 和图形学各占一半的比例。

AI科技评论：世界模型的应用场景和目标用户群体是怎样的？

宋亚宸：世界模型是给所有人、所有客户使用的，具体的应用场景非常广泛，你可以用它来做具身智能的仿真模型，也可以用来做数字孪生，或者应用于文娱等各种各样的场景，任何需要“在一个世界里运行和互动”的场景，都可能用到世界模型。

AI科技评论：近期公司完成了新一轮融资，您如何看待融资与公司战略“正确性”之间的关系？投资人为何在这个阶段选择下注？

宋亚宸：融不融资与事情本身是否完全正确并没有必然联系，它更多代表的是市场和投资人对这件事情形成了一定的阶段性共识。创业本身就是一个不断探索的过程，在最后一刻真正把事情做成之前，很难定论什么是绝对正确的。

投资人之所以在这个阶段选择投资，主要基于三方面原因：首先，我们在世界模型等前沿方向上布局较早且走在比较前沿的位置；其次，AI 3D 大模型技术的成熟已经切实带来了不错的商业化收入；最后，市场对于可交互的 UGC 内容平台也产生了新的认知与共识。（作者持续跟踪 AI 应用与模型更新，欢迎加微信Who123start交流）