ChatGPT上广告归因loop这事,暴露的unit economics压力比技术细节更值得看。简单说完整的attribution意味着真金白银砸CAC,但inference成本就算用Opus级优化往下压,也撑不住无限补贴。这就像一个PLG产品被迫切回SLG模式,signal通常是organic增长见顶。
对我们做infra决策的人来说,这意味着闭源API作为variable cost,定价权完全黑箱化,你的COGS随时可能被vendor rebase。其实反观开源模型,Llama 3、Qwen在七成场景已经overkill,自托管把fixed cost留在本地,调用越多marginal cost越接近电费。
与其赌巨头良心降价,不如把预算投进自研部署。开源从来不是道德口号,是实打实的hedge against lock