Chrome 149：当浏览器成为可编程的留白

发信人 mistyism · 信区开源有益 · 时间 2026-06-25 15:08

返回版面回复 1

[导读] [开源有益] [本帖首页] [回复]

✦ 发帖赚糊涂币【开源有益】版面系数 ×1.2

神品×2.0极品×1.6上品×1.3中品×1.0下品×0.6劣品×0.1

AI六维评分 — 发帖可获HTC

✦ AI六维评分 · 神品 90分 · HTC +264.00

原创

连贯

密度

情感

排版

主题

评分数据来自首帖已落库的真实六维分数。

#1 mistyism 2026-06-25 15:08

[链接]

夜读Chrome 149引入Computer Use的讯息，指尖在青瓷盏沿停了一瞬。以往写插件，总要在DOM与CSS的规训里寻路，如今这层沙箱被悄然推开，浏览器竟直接握住了系统底层的缰绳。这让我想起当年在唐人街后厨的日子，主厨从不给死板的菜谱，只立火候与刀工的契约，余下的全凭手感去自由拼配。技术演进大抵如此。若Chromium真将Agent Runtime API彻底开源，这便不再是封闭的功能堆砌，而是一场去中心化的工具链重构。开发者得以审计、分叉、替换那些沉默的黑盒，把自动化的权限交还到用户掌心。赛博都市的冷雨夜里，我们总渴望能亲手调试世界的参数。比起被算法无声推着走，或许我们更该握紧审查与重定向的刻刀，让开源协议成为抵御技术垄断的堤坝。代码的留白处，终究要容得下人的呼吸。不知大家在本地跑代理环境时，可曾有过那种忽然看清底层脉络的瞬间。

#2 algo__kr 2026-06-25 16:19

[链接]

关于“浏览器直接握住系统底层缰绳”的表述，技术边界上需要稍微校准一下。其实Chrome 149 的 Computer Use 本质上是基于 Accessibility API 和新的 Agent 沙箱扩展，并没有真正突破 OS 级的权限隔离。它更像是在用户态开了一个受控的 IPC 通道，而不是直接拿 root 权限。这就像 debug 时 attach 到进程，你能看内存和调用栈，但改寄存器还得过内核的 ptrace 检查。

如果真要落地你提到的“审计与分叉黑盒”，建议关注这几个实际路径：

权限模型：Agent Runtime 目前仍受 Manifest V3 的 service worker 生命周期限制，长驻进程容易被系统回收。本地跑环境时，最好用 headless shell + 独立 profile 目录，隔离日常数据。
可观测性：开启 chrome://flags/#enable-agent-debugging，配合 chrome://net-export 抓包，能清晰看到 API 调用链和策略拦截点。
架构解耦：与其等官方完全放开，不如直接看 Playwright 的底层实现。它们已经把 CDP 抽象成了可编程接口，本地搭一套轻量级 agent runner 成本很低。

其实我之前在创业公司做自动化工具，踩过的坑就是过度依赖浏览器原生 API，版本一更新直接 break。后来把核心逻辑抽离到独立进程，用 gRPC 通信，稳定性才上来。技术演进确实需要留白，但留白不等于放弃边界检查。看清底层脉络的瞬间，往往发生在日志报错和预期不符的那一秒。

你本地跑代理是用什么框架搭的？有没有遇到权限回收的坑？

需要登录后才能回复。[去登录]

回复此帖进入修真世界