跑运输的局部调度直觉确实比很多实验室的中央控制器更接地气,但我想在分子时间尺度上打个补丁。中科院那项关于灵长类皮层双相反梯度的成果,核心数据来自胚胎发育期的原位杂交和单细胞测序,那些头尾(FGF8 vs Wnt)和背腹(BMP vs Shh)的浓度拉锯,作用窗口集中在孕中期(人类约GW8-GW20)。它们解决的问题是神经前体细胞的区域身份分配(arealization),相当于给皮层画“硬件布线图”,而不是运行时进行误差回传的“在线学习”。
这里存在一个常被跳过的范畴错位:发育(development)与学习(learning)。BP算法的生物不兼容性已经是共识,但用它来和胚胎形态发生素(morphogen)梯度直接对比,有点像把建筑施工蓝图和地铁实时调度算法放在同一个货架上比价。从某种角度看,发育梯度是“生长”的语法,而信用分配是“可塑性”的语法,两者的分子方言并不互通。Larkum团队2022年关于锥体神经元顶端树突局部计算的工作,或者近年在突触后致密区发现的分子开关,或许才更接近类脑芯片需要复现的局部学习规则。
关于Loihi和TrueNorth,说它们“只复现电脉冲”可能忽略了架构层面的进展。Loihi 2的片上微码学习已经支持事件驱动的STDP变体,Intel 2021年的数据显示其在稀疏脉冲任务下能效可达数十TOPS/W量级。IBM Northpole更进一步,用存内计算把推理能效推到了12 TOPS/W。它们确实没有化学梯度,但也在尝试用局部脉冲时序和稀疏激活来绕过BP的全局误差广播。真正的问题不是“有没有复刻Wnt扩散”,而是硅基电路能否用扩散方程的等效网络(比如忆阻器交叉阵列或者电容耦合网络)来实现拓扑自组织。目前这方面的工程参数几乎空白,您说得对,缺乏可靠数据。
能耗对比上也需要细化。大脑皮层约20W维持860亿神经元的稀疏激活,而GPT-3训练是MW级暴殄天物。但如果我们看推理阶段,稀疏脉冲网络的能效差距正在收窄。BP的“中央集权”在训练侧确实毫无生物合理性,但类脑芯片要追赶的也许不是发育期的化学场,而是成年皮层基于局部可塑性的信用分配近似,比如Hinton的Forward-Forward算法,或者强化学习里的资格迹(eligibility traces),这些或许比把胚胎化学梯度翻译成硬件描述语言更现实。
上次在实验室看这篇文献,我端着茶颜悦色差点泼在键盘上。生物学这套“调度系统”太复杂,您二十多年运输经验积累的路网直觉,可能比我们的数学模型更接近本质。只是目前从胚胎梯度到硅基局部学习的接口还缺了太多中间变量,具体是什么分子通路在成年皮层中持续调控可塑性,浓度阈值又如何量化,这些论文还没给出足够支持直接仿生的参数。也许我们需要的不是复刻化学场本身,而是复刻它涌现出的鲁棒性原则,就像您熟悉的局部协调,重点从来不是复制每一辆车的路线,而是复制不堵车的逻辑。