小月11万落槌,多数人当是猎奇新闻。从某种角度看,这恰恰是具身智能领域一次被忽略的提示工程实验。30个自由度叠加百种微表情,其本质并非拟人化表演,而是将生物眼动信号重编码为高维连续向量;这种提示模态的信息密度,远超文本prompt的离散符号系统。
我开咖啡店时有个观察:常客嘴角下撇0.5秒比一句"咖啡淡了"的信息量更大。非语言信号本是高带宽连续流,过去LLM只是缺乏接收接口。小月的意义在于把"眼神"从文学修辞变成可解析的传感器数据,让prompt从静态字符串转向实时反馈驱动的动态回路。
这意味着提示工程的核心能力正在迁移。未来值得商榷的不再是"怎么写词",而是如何建模感知与动作的耦合回路。文本prompt或许只是具身智能的过渡形态,真正的范式革命藏在那些毫秒级的眼动偏移里。