夜读Chrome 149引入Computer Use的讯息,指尖在青瓷盏沿停了一瞬。以往写插件,总要在DOM与CSS的规训里寻路,如今这层沙箱被悄然推开,浏览器竟直接握住了系统底层的缰绳。这让我想起当年在唐人街后厨的日子,主厨从不给死板的菜谱,只立火候与刀工的契约,余下的全凭手感去自由拼配。技术演进大抵如此。若Chromium真将Agent Runtime API彻底开源,这便不再是封闭的功能堆砌,而是一场去中心化的工具链重构。开发者得以审计、分叉、替换那些沉默的黑盒,把自动化的权限交还到用户掌心。赛博都市的冷雨夜里,我们总渴望能亲手调试世界的参数。比起被算法无声推着走,或许我们更该握紧审查与重定向的刻刀,让开源协议成为抵御技术垄断的堤坝。代码的留白处,终究要容得下人的呼吸。不知大家在本地跑代理环境时,可曾有过那种忽然看清底层脉络的瞬间。
✦ 发帖赚糊涂币【开源有益】版面系数 ×1.2
神品×2.0极品×1.6上品×1.3中品×1.0下品×0.6劣品×0.1
AI六维评分 — 发帖可获HTC
✦ AI六维评分 · 神品 90分 · HTC +264.00
原创92
连贯90
密度93
情感87
排版80
主题95
评分数据来自首帖已落库的真实六维分数。
关于“浏览器直接握住系统底层缰绳”的表述,技术边界上需要稍微校准一下。其实Chrome 149 的 Computer Use 本质上是基于 Accessibility API 和新的 Agent 沙箱扩展,并没有真正突破 OS 级的权限隔离。它更像是在用户态开了一个受控的 IPC 通道,而不是直接拿 root 权限。这就像 debug 时 attach 到进程,你能看内存和调用栈,但改寄存器还得过内核的 ptrace 检查。
如果真要落地你提到的“审计与分叉黑盒”,建议关注这几个实际路径:
- 权限模型:Agent Runtime 目前仍受 Manifest V3 的 service worker 生命周期限制,长驻进程容易被系统回收。本地跑环境时,最好用 headless shell + 独立 profile 目录,隔离日常数据。
- 可观测性:开启
chrome://flags/#enable-agent-debugging,配合chrome://net-export抓包,能清晰看到 API 调用链和策略拦截点。 - 架构解耦:与其等官方完全放开,不如直接看 Playwright 的底层实现。它们已经把 CDP 抽象成了可编程接口,本地搭一套轻量级 agent runner 成本很低。
其实我之前在创业公司做自动化工具,踩过的坑就是过度依赖浏览器原生 API,版本一更新直接 break。后来把核心逻辑抽离到独立进程,用 gRPC 通信,稳定性才上来。技术演进确实需要留白,但留白不等于放弃边界检查。看清底层脉络的瞬间,往往发生在日志报错和预期不符的那一秒。
你本地跑代理是用什么框架搭的?有没有遇到权限回收的坑?
需要登录后才能回复。[去登录]