跳转至

2026-04-15.不摸鱼的独立开发者日报(第333期)

📰 资讯

Sora关停之后,世界模型还能继续吗?

Sora出来的时候,整个科技圈都在喊”世界模型成了”。

OpenAI放了几段几十秒的视频,像素逼真到以假乱真,所有人都觉得我们离模拟整个世界只差再堆几个数量级的算力了。

但NLP泰斗Chris Manning和他创办的Moon Lake公司,给了这个狂热的时代一记响亮的耳光。

视频生成模型根本不是世界模型。

这不是什么学术争论,这是AI下一个十年的路线之争。

漂亮的像素,空洞的大脑

Sora能生成一个保龄球撞倒球瓶的完美视频,但它不知道为什么球瓶会倒。

它不知道球的质量、不知道重力加速度、不知道碰撞的物理规律,更不知道如果我换一个角度扔球,结果会有什么不同。它只是记住了互联网上无数个保龄球视频的像素分布,然后用统计学的方法拼接出了一段看起来合理的画面。

这就像一个学生背下了整本习题集的答案,却从来没有理解过公式本身。考试遇到原题他能拿满分,但只要题目稍微变一下,他就彻底傻眼了。

这就是为什么所有纯像素路线的”世界模型”,都只能维持几十秒的一致性。超过这个时间,物体就会凭空消失、穿模、变成奇形怪状的东西。因为它们根本没有一个关于”世界是什么样”的抽象概念,它们只是在逐帧预测下一个像素应该是什么颜色。

真正的世界模型,不是预测像素,而是预测后果。

当你拿起一个杯子,你知道松手它会掉在地上摔碎。当你打开一扇门,你知道门后会是什么。当你走在马路上,你知道要躲开迎面开来的汽车。这些不是你从无数个视频里学来的,而是你对这个世界运行规律的理解。

这才是世界模型的核心:因果推理、动作条件、长期一致性。而这些,恰恰是纯像素路线永远也解决不了的问题。

结构不是规模

Moon Lake提出了一个可能是AI下一个十年最重要的论点:结构不是规模

过去五年,整个AI行业都被”苦涩的教训”洗脑了。只要堆数据、堆算力,什么问题都能解决。语言是这样,图像是这样,大家理所当然地认为世界模型也会是这样。

但Chris Manning指出了一个所有人都忽略的事实:语言本身就是一种高度抽象的符号系统。每个词都代表了一个概念,大语言模型其实是站在人类几千年抽象思维的肩膀上。

而像素是最底层的原始数据。从像素直接跳到对世界的抽象理解,需要的不是几个数量级的算力,而是五个数量级。这在经济上是不可行的,在时间上也是不可接受的。

人类也不是这么理解世界的。

神经科学告诉我们,我们的眼睛每秒接收数十亿比特的视觉信息,但我们的大脑只处理其中极小的一部分。我们不是在逐像素地扫描整个世界,而是在构建一个关于世界的抽象语义模型。我们知道桌子是硬的、水是湿的、火是烫的,这些抽象概念让我们能够在这个复杂的世界里生存。

Moon Lake走的就是这条路。他们没有试图从像素直接生成一切,而是先构建一个符号化的世界状态模型,处理所有的逻辑、物理、因果和一致性问题,然后再用一个独立的渲染模型把它变成漂亮的像素。

这是一个天才的架构设计。它把”世界是什么样”和”世界看起来什么样”彻底分开了。前者决定了游戏的玩法、机器人的行为、智能体的推理能力,后者只负责视觉效果。

你可以随时换一个渲染器,把同一个游戏世界变成赛博朋克风格、宫崎骏风格或者写实风格,但世界的底层逻辑永远不变。

路线之争,已经开始了

现在AI行业有两条完全不同的世界模型路线。

一条是OpenAI和大多数公司走的纯像素路线:用无限的数据和无限的算力,暴力破解世界模拟问题。

另一条是Moon Lake走的结构优先路线:用人类已经掌握的知识和工具,构建高效的抽象世界模型。

很多人说后者是反”苦涩的教训”,是开历史倒车。但Chris Manning说得很清楚:我们不反对规模,我们只是反对愚蠢的规模。

如果有两种方法能达到同一个目标,一种需要一万张A100,另一种只需要一百张,那后者显然是更正确的选择。更何况,纯像素路线可能根本就达不到那个目标。

当然,现在说谁赢谁输还太早。但有一点是确定的:那些只会生成漂亮视频的公司,永远也做不出真正的世界模型。

因为世界模型的终极目标,不是让你看一段好看的视频,而是让你能在这个世界里行动、探索、创造、学习。

🖥️ 软件

Tamagrow

Tamagrow是一款将GitHub推送自动生成社交媒体草稿的开发者工具,支持LinkedIn、X等平台。

Nebria

Nebria是一款面向盲/弱视用户的星空应用,通过触觉莫尔斯码传递星名与光程信息,支持夜间摄影模式。

sharpscreen

sharpscreen是一款AI驱动的简历筛选工具,可理解语境、评估经验深度与岗位匹配度,宣称99.6%准确率,提供1000次免费评估。

MapiLeads

MapiLeads是一款本地潜在客户挖掘与销售自动化工具,可自动抓取商家信息并生成个性化冷邮件。

PostPeer

PostPeer是一款面向社媒发布的内容自动化API工具,由独立开发者打造,支持内容工作流与自动化发布。

🎮 游戏

Gladiator Command

Gladiator Command是一款策略类独立游戏,现已发布。

Commitment

Commitment是一款由两人独立工作室在Steam上发布的首个游戏,主打叙事与合作玩法,现已发布。

🌐 网站

HistoryLens

HistoryLens是一个按地区并排查看历史事件的网页应用,支持欧洲、亚洲、美洲、非洲四区域的历史对比。

cvoice

cvoice是一个提供角色化文本转语音的在线服务,永久免费且开放API,支持多种角色音色。

Liaoliaokan

Liaoliaokan是一款基于真实面经的AI模拟面试网站,支持语音交互与错题记录,帮助求职者提升面试能力。

Yumoo

Yumoo是一个将食物照片转为吉卜力风格插画的网站,用于低成本记录饮食回忆。

✍️ 说明

日报相关信息:
网站:https://daily.nomoyu.com/
RSS:https://daily.nomoyu.com/rss/rss.xml
微信公众号:明航的AI副业
欢迎一起沟通交流