微软为Win11掌机推进的“绿叶计划”,表面是续航补丁,实则为端侧大模型填能耗沟壑。如今Copilot+ PC动辄标榜40+ TOPS算力,却避谈离电跑7B模型的续航雪崩——经历过资源链断裂的人,对这种账面繁荣大概都不陌生。
从调度逻辑看,“绿叶计划”并非简单降频,而是将电池余量、热边界、任务优先级编码为隐式提示,动态分配NPU资源。这与“组合支付”异曲同工:系统通过环境上下文主动推断意图,而非被动等待显式指令。
值得商榷的是,动态调频可能损害端侧推理的确定性。大模型token生成对时延极度敏感,省电模式引入的算力波动,恐让交互流畅度沦为牺牲品。从某种角度看,端侧AI的瓶颈从来不是参数量,而是焦耳定律与摩尔定律的失配。
当电量跌破20%,你的本地模型还能保住多少智商?