毫无疑问,开源正成为国内外大模型厂商的「战略共识」。从文本到视觉,从对话到推理,开源生态的繁荣正推动大模型技术快速迭代。在这一波生成式 AI 浪潮中,MiniMax、月之暗面等企业纷纷从应用层回归模型层,聚焦底层架构创新,而非仅依赖上层应用变现。这一趋势表明,模型本身的能力突破,而非单纯的产品包装,正成为行业竞争的核心。
在 3D 生成这一尚未被完全定义的领域,VAST 正以开源先锋的姿态重新划定行业标准。这家专注于 3D 生成赛道的企业,正通过自主研发打造面向三维内容创作的开源基础设施。
3 月 28 日,专注于构建通用 3D 大模型的VAST 一口气开源了两个 3D 生成项目 ——TripoSG 和 TripoSF。前者是一款基础 3D 生成模型,在图像到 3D 生成任务上远超所有闭源模型;后者则是 VAST 新一代三维基础模型 TripoSF 能在所有闭源模型中同样取得 SOTA 的基础组件,用于高分辨率的三维重建和生成任务。
VAST 宣布,即日起,TripoSG 15 亿参数小模型(非 MoE 版本、在 2048 token 的潜空间上运行)的权重、推理代码和交互式演示 Demo 将通过 GitHub 和 Hugging Face 统统提供给 AI 社区
然而,当前主流 3D 表示方法,比如隐式场(SDF/Occupancy)、显式网格、点云,要么对于细节的捕捉效果较差,并难以实现对高面数、复杂拓扑结构的直接重建;要么在高分辨率下实时渲染时产生巨大的内存开销。这就导致业界很少有模型能够生成媲美专业三维数字雕刻建模App ZBrush 所创作出的的高精细、高复杂度作品。
视频生成之后,人们都在期待 AI 带来的 3D 创作能力。在国内外社区,越来越多的设计师正在尝试把 3D 生成模型引入自己的工作流,改进游戏、视频、工业设计等领域的生产形态。由于 AI 生成的内容越来越精细、准确,很多一直以来面临的挑战迎刃而解。在 2024 年初与 Stability.ai 一起合作开源 TripoSR 时,VAST 曾定义 3D 生成技术当时第一次达到了 Midjourney V3 的成熟度,并判断 2025 年 3D 生成会达到 Midjourney V5 的水平,如今可见技术向前迈进的速度着实比预计的更快。
以 AI 技术发展的角度来看,3D 生成还是「世界模型」的基座,更强大的 3D 生成技术,将会拓展 AI 的前沿。