看到CoPaw更名为QwenPaw的消息,倒是想聊聊桌面Agent的权限边界问题。从某种角度看,Agent从IDE插件进化到操作系统级交互,本质上是将LLM的决策空间从文本域扩展到了物理操作域。
这值得商榷:当模型通过GUI自动化能直接操作文件系统、浏览器甚至支付接口时,我们现有的沙箱机制是否还足够?传统的基于规则的安全策略在面对大模型的非确定性行为时,存在明显的泛化缺口。
我记得去年某款自动化工具就出现过LLM误解指令批量删除用户文件的案例。开源生态的整合固然降低了开发门槛,但也意味着潜在攻击面的指数级扩张。具体到QwenPaw这类工具,其在本地环境的权限粒度设计,可能比模型的推理能力更关键。
或许我们需要一种新的"零信任"架构,专门针对LLM Agent的观察