最近ZCode在GitHub上关注度不低,很多人把它当成GLM-5.2的评测工具,其实它更像一个轻量ABI声明层。Rust做的确定性序列化加上版本感知调用协议,把模型输入输出从“看README猜格式”变成了一段可编译、可校验的契约。
这和llama.cpp那类推理框架不一样。llama.cpp关心的是怎么把模型跑起来,ZCode关心的是不同模型之间怎么“握手”。它拒绝把执行细节包进去,只暴露I/O契约,让模型从“能跑的服务”变成“可替换的公民”。在OpenResty/Nginx里我们早就见过这种模式——upstream模块之所以能随便换,是因为C ABI稳定。现在LLM生态缺的就是这个。
长期看,这会让模型集成更像链接.so:版本兼容、回滚、回归测试都能自动化。当然,如果契约定得太死,也会限制实验性接口。但先把接口从文档变成代码,肯定是开源AI下一步该做的事。