SANA-WM开源这事儿值得聊聊,26亿参数就能生成1分钟720p视频,没靠无脑堆卡,而是靠线性注意力这类架构创新把效率拉满。这让我直接想起当年折腾OpenResty和Nginx的日子,核心逻辑一模一样:不是给服务器无脑扩容,而是用事件驱动和LuaJIT协程把单核性能榨干,用聪明的调度替代笨重的线程池。
它定位是world model,不止生成画面,还尝试理解物理规律。开源社区终于拿到一个带“物理引擎”属性的基座,而不是只能围观的黑盒。对做游戏、机器人仿真的兄弟来说,这远比单纯生成大片来得实在。
其实闭源巨头还在卷算力垄断,开源这边用2.6B参数证明了轻量化路线走得通。关键是能微调、能二创,能从“看热闹”变成生产工具。视频生成要迎来真正的拐点,靠的恐怕不是更大的集群,而是这种小而美的开源方案。