2026-04-15.不摸鱼的独立开发者日报(第333期)
📰 资讯
Sora关停之后,世界模型还能继续吗?
Sora出来的时候,整个科技圈都在喊”世界模型成了”。
OpenAI放了几段几十秒的视频,像素逼真到以假乱真,所有人都觉得我们离模拟整个世界只差再堆几个数量级的算力了。
但NLP泰斗Chris Manning和他创办的Moon Lake公司,给了这个狂热的时代一记响亮的耳光。
视频生成模型根本不是世界模型。
这不是什么学术争论,这是AI下一个十年的路线之争。
漂亮的像素,空洞的大脑
Sora能生成一个保龄球撞倒球瓶的完美视频,但它不知道为什么球瓶会倒。
它不知道球的质量、不知道重力加速度、不知道碰撞的物理规律,更不知道如果我换一个角度扔球,结果会有什么不同。它只是记住了互联网上无数个保龄球视频的像素分布,然后用统计学的方法拼接出了一段看起来合理的画面。
这就像一个学生背下了整本习题集的答案,却从来没有理解过公式本身。考试遇到原题他能拿满分,但只要题目稍微变一下,他就彻底傻眼了。
这就是为什么所有纯像素路线的”世界模型”,都只能维持几十秒的一致性。超过这个时间,物体就会凭空消失、穿模、变成奇形怪状的东西。因为它们根本没有一个关于”世界是什么样”的抽象概念,它们只是在逐帧预测下一个像素应该是什么颜色。
真正的世界模型,不是预测像素,而是预测后果。
当你拿起一个杯子,你知道松手它会掉在地上摔碎。当你打开一扇门,你知道门后会是什么。当你走在马路上,你知道要躲开迎面开来的汽车。这些不是你从无数个视频里学来的,而是你对这个世界运行规律的理解。
这才是世界模型的核心:因果推理、动作条件、长期一致性。而这些,恰恰是纯像素路线永远也解决不了的问题。
结构不是规模
Moon Lake提出了一个可能是AI下一个十年最重要的论点:结构不是规模。
过去五年,整个AI行业都被”苦涩的教训”洗脑了。只要堆数据、堆算力,什么问题都能解决。语言是这样,图像是这样,大家理所当然地认为世界模型也会是这样。
但Chris Manning指出了一个所有人都忽略的事实:语言本身就是一种高度抽象的符号系统。每个词都代表了一个概念,大语言模型其实是站在人类几千年抽象思维的肩膀上。
而像素是最底层的原始数据。从像素直接跳到对世界的抽象理解,需要的不是几个数量级的算力,而是五个数量级。这在经济上是不可行的,在时间上也是不可接受的。
人类也不是这么理解世界的。
神经科学告诉我们,我们的眼睛每秒接收数十亿比特的视觉信息,但我们的大脑只处理其中极小的一部分。我们不是在逐像素地扫描整个世界,而是在构建一个关于世界的抽象语义模型。我们知道桌子是硬的、水是湿的、火是烫的,这些抽象概念让我们能够在这个复杂的世界里生存。
Moon Lake走的就是这条路。他们没有试图从像素直接生成一切,而是先构建一个符号化的世界状态模型,处理所有的逻辑、物理、因果和一致性问题,然后再用一个独立的渲染模型把它变成漂亮的像素。
这是一个天才的架构设计。它把”世界是什么样”和”世界看起来什么样”彻底分开了。前者决定了游戏的玩法、机器人的行为、智能体的推理能力,后者只负责视觉效果。
你可以随时换一个渲染器,把同一个游戏世界变成赛博朋克风格、宫崎骏风格或者写实风格,但世界的底层逻辑永远不变。
路线之争,已经开始了
现在AI行业有两条完全不同的世界模型路线。
一条是OpenAI和大多数公司走的纯像素路线:用无限的数据和无限的算力,暴力破解世界模拟问题。
另一条是Moon Lake走的结构优先路线:用人类已经掌握的知识和工具,构建高效的抽象世界模型。
很多人说后者是反”苦涩的教训”,是开历史倒车。但Chris Manning说得很清楚:我们不反对规模,我们只是反对愚蠢的规模。
如果有两种方法能达到同一个目标,一种需要一万张A100,另一种只需要一百张,那后者显然是更正确的选择。更何况,纯像素路线可能根本就达不到那个目标。
当然,现在说谁赢谁输还太早。但有一点是确定的:那些只会生成漂亮视频的公司,永远也做不出真正的世界模型。
因为世界模型的终极目标,不是让你看一段好看的视频,而是让你能在这个世界里行动、探索、创造、学习。

🖥️ 软件
Tamagrow
Tamagrow是一款将GitHub推送自动生成社交媒体草稿的开发者工具,支持LinkedIn、X等平台。

Nebria
Nebria是一款面向盲/弱视用户的星空应用,通过触觉莫尔斯码传递星名与光程信息,支持夜间摄影模式。

sharpscreen
sharpscreen是一款AI驱动的简历筛选工具,可理解语境、评估经验深度与岗位匹配度,宣称99.6%准确率,提供1000次免费评估。

MapiLeads
MapiLeads是一款本地潜在客户挖掘与销售自动化工具,可自动抓取商家信息并生成个性化冷邮件。

PostPeer
PostPeer是一款面向社媒发布的内容自动化API工具,由独立开发者打造,支持内容工作流与自动化发布。

🎮 游戏
Gladiator Command
Gladiator Command是一款策略类独立游戏,现已发布。

Commitment
Commitment是一款由两人独立工作室在Steam上发布的首个游戏,主打叙事与合作玩法,现已发布。

🌐 网站
HistoryLens
HistoryLens是一个按地区并排查看历史事件的网页应用,支持欧洲、亚洲、美洲、非洲四区域的历史对比。

cvoice
cvoice是一个提供角色化文本转语音的在线服务,永久免费且开放API,支持多种角色音色。

Liaoliaokan
Liaoliaokan是一款基于真实面经的AI模拟面试网站,支持语音交互与错题记录,帮助求职者提升面试能力。

Yumoo
Yumoo是一个将食物照片转为吉卜力风格插画的网站,用于低成本记录饮食回忆。

✍️ 说明
日报相关信息:
网站:https://daily.nomoyu.com/
RSS:https://daily.nomoyu.com/rss/rss.xml
微信公众号:明航的AI副业
欢迎一起沟通交流