投资人信了。
作者|桦林舞王
编辑|靖宇
两年前,OpenAI 拿出 5 亿美元想买下 Medal,一个游戏录像分享平台。创始人 Pim de Witte 拒绝了。
这个决定当时看起来可能有点莽。
General Intuition 创始人 Pim de Witte|图片来源:techcrunch
但在 2026 年 6 月的今天,de Witte 旗下的 AI 公司 General Intuition 完成了 3.2 亿美元的 A 轮融资,估值达到 23 亿美元,由 Khosla Ventures 领投,Jeff Bezos、Eric Schmidt 以及 Google DeepMind 和 MIT 的研究人员也参与其中。算上去年 10 月启动时的 1.34 亿美元,他们的累计融资已经超过 4.54 亿美元。
OpenAI 当时出价 5 亿,今天 General Intuition 的估值已经是那个数字的将近五倍。市场用真金白银在告诉所有人:这堆游戏录像,比大多数人想象的值钱得多。
01
游戏录像里藏着什么
要理解 General Intuition 在做什么,需要先搞清楚一个前提问题——机器人到底缺什么训练数据。
传统的机器人 AI 训练,依赖两条路。一是在真实环境里采集数据,成本极高、周期极长;二是在仿真器里训练,速度快,但存在一个令所有人头疼的问题:「仿真与现实的差距」。你在 Unity 或者 Unreal 里训练出来的模型,放到真实的地板和墙壁前,往往表现得像个路痴。
General Intuition 的切入点是:游戏数据既不是纯仿真,也不是真实环境,但它可能是连接两者的桥梁。
Medal 作为一个游戏录像平台,积累了数十亿小时的游戏画面,但这些画面不是普通的视频。正如 Crypto Briefing 的分析所指出的,General Intuition 拥有的是「每一帧都配对了玩家实际输入——鼠标移动、按键操作、战略决策」的数据。
用来训练的游戏录像|图片来源:General Intuition
这是纯粹的游戏录屏做不到的:你看到的不只是角色在动,你还知道人类玩家在那个时刻做出了什么决策。
从《堡垒之夜》的第一视角穿越建筑,到《Apex 英雄》里快速识别地形并选择落点,这些游戏场景包含了大量的空间推理信息。人类玩家每天都在训练自己的大脑处理三维空间、预判物体轨迹、在动态环境中做出实时决策——这些能力,恰好是真实世界里的机器人最需要的。
de Witte 在接受采访时说过一句话,点出了 LLM 路线的局限:「作为人类,我们创造文字来描述世界上发生的事情,但这样做,你会丢失大量信息。」他们想要的是更原始、更接近感知层的数据,而不是人类事后用语言总结出来的文字。
02
8 分钟数据
在纽约的发布现场,General Intuition 做了一个展示,细节值得仔细看一下。
他们用游戏数据预训练了一个空间推理模型,然后用仅仅 8 分钟的真实机器人运动数据对其进行微调。这个机器人,在街道上采集了这 8 分钟的数据,然后被放进一个它从未去过的室内办公室,依然能够正常导航。
8 分钟,这个数字是核心。
游戏录像中汇集了各种虚拟空间数据|图片来源:General Intuition
通常的机器人训练需要在目标环境中反复采集大量数据,或者在高度精确的仿真环境中跑无数轮。而 General Intuition 的逻辑是:游戏数据已经给模型建立了足够强的空间推理基础,迁移到真实世界所需要的「真实数据微调量」因此被大幅压缩。
这条逻辑听起来足够优雅。但这里有一个地方目前还看不太清楚——这种迁移的泛化边界在哪里。
街道到办公室是一次演示,但复杂的真实工业场景、各种光线条件、地面材质的变化,这些能否同样被 8 分钟的数据桥接,目前还没有公开的基准测试来验证。AI CERTs News 的评论也提到了这一点:「仿真与现实的迁移差距仍然存在,需要严格的基准测试。」
General Intuition 承诺今年晚些时候会发布公开评估结果。
03
钱流向世界模型
General Intuition 的这轮融资,不是孤立事件,而是今年一波融资浪潮里的一部分。
World Labs 在 2 月完成了 10 亿美元融资;Decart 在 5 月拿到 3 亿美元;Odyssey 在 6 月关闭了 3.1 亿美元的轮次,亚马逊和 AMD 参与其中。这些公司的共同关键词,是「世界模型」——用大量真实或仿真的视觉数据,让 AI 建立对物理世界的理解。
资本正在一致押注一个判断:下一阶段的 AI 竞争,不在语言,在物理。
但这场竞争里,General Intuition 的护城河相对具体。游戏数据这条资产,别人很难复制。Medal 积累的数十亿小时录像,是多年积累的结果,不是今天开始采集明天就能有的东西。这也是 OpenAI 当年愿意出 5 亿美元来买的原因——数据本身就是壁垒。
新一轮融资的用途,公司透露大部分将投入算力扩容,同时计划在今年夏末把 API 开放给更多开发者。从封闭研发走向开放生态,这是 General Intuition 从一个「有趣的研究项目」,变成「平台级公司」的关键一步,也是这笔 23 亿美元估值能否撑住的真正考验。
对游戏开发者可能有的另一个疑问,de Witte 在播客采访中也回应过:他认为担心游戏模型取代开发者是「言过其实」,训练 AI agent 的空间推理,与游戏内容生成是两条完全不同的赛道。
游戏画面是原材料,而不是竞争对象。
04
这条路有多远
把游戏里的虚拟物理迁移到现实,这个想法并不是今天才有人想到。
游戏引擎在机器人仿真领域早就有广泛应用,NVIDIA Isaac、Unity Robotics 都在做类似的事。General Intuition 的不同之处,是它拥有的不是引擎本身,而是人类在游戏里实际行动的痕迹——带有意图的数据,而不是纯粹的物理仿真输出。
这个差异可以用一个简单的类比来理解:就像教一个学生开车,你可以给他看物理教材里关于摩擦力,和转弯半径的所有公式,也可以让他坐在老司机旁边,看一千个小时真实驾驶录像,然后感受方向盘在手里的力道。后者效率不一定更高,但建立的是一种更接近本能的能力。游戏录像对于机器人空间推理的价值,大概就在这里。
当然,驾驶游戏和真实驾驶之间有差距,《堡垒之夜》里的物理引擎和现实世界的物理规律也有差距。这个差距有多大、能被多少数据弥合,是 General Intuition 接下来需要用产品和基准来回答的问题,不是靠演示和估值来回答的问题。
在世界模型融资浪潮里,每家公司都在讲一个关于「物理 AI」的宏大故事。但真正的分水岭,往往出现在 API 开放之后——开发者拿到它,能做出什么,做不出什么,很快就会有结论。General Intuition 的夏末 API 计划,大概是比这轮融资更值得盯住的时间节点。
游戏行业用了几十年训练人类大脑处理三维空间,现在这些数据反过来训练机器人的大脑——这个轮回本身,就已经足够有意思了。
*头图来源:General Intuition
本文为极客公园原创文章,转载请联系极客君微信 geekparkGO
极客一问
你认为游戏里的虚拟物理,
能迁移到现实世界的机器人身上吗?