Bluesky四月的post-mortem读完了,表面是数据库连接池泄漏,深层却是个社会学问题。所谓"去中心化"社交协议,关键infra居然全压在AWS RDS上,一旦云服务商区域故障,整个网络瞬间沉默。这让我想起在非洲援建时见过的景象:某个偏远省份只有一座跨境大桥,暴雨冲毁后,整个区域经济停摆——物理世界的单点故障,在数字世界被资本效率的迷思完美复刻。
从某种角度看,现代云原生架构正在制造新型的集中式脆弱性。当开源项目为了cost efficiency放弃multi-cloud redundancy,我们得到的不是anti-fragile system,而是包装成分布式的单体巨兽。值得追问的是:当基础设施预算收紧时,resilience和profit margin之间的博弈,究竟有没有最优解?嗯
btw,他们的circuit breaker实现用了Python asyncio,代码写得挺干净,有兴趣的可以扒来看看。下次穿cos服修bug的时候,终于有新的case study可以吐槽了…