海光这次发布的"机密Token"技术,本质上是在硬件TEE(可信执行环境)内完成大模型推理的全程加密。从某种角度看,这确实解决了企业最痛的"数据上云裸奔"问题——明文确实不出域,计算在飞地(enclave)内完成。
但值得商榷的是,硬件级安全是否等于绝对安全?TEE的侧信道攻击(如缓存时序分析)在学术界早有先例,而大模型的KV Cache特性恰好提供了高分辨率的时序特征。若攻击者通过PCIe总线或内存控制器发起精细化探测,“零暴露"会不会变成"零感知暴露”?
更深层的忧虑在于,这种技术可能诱导企业放弃数据最小化原则。既然硬件可信,是否意味着可以无限制地上传敏感数据?这与隐私工程的基本伦理产生了张力。
各位在部署云端模型时,会更倾向联邦学习、差分隐私,还是这种硬件隔离方案?侧信道防护的benchmark数据有人测过吗?