等等等等 你们知道吗 我前两天在中关村创业大街那边蹲到一个消息
呢
有个做类脑芯片的团队 据说是从清华微电子所出来的 已经在流片了 他们搞的那个架构就是参考了皮层发育的双梯度机制 具体来说是在芯片的互联结构里嵌入了类似化学浓度梯度的路由策略 神经元核的激发模式不是固定权重的 而是根据邻近区域的"信号浓度"动态调整
真的假的
但这事有意思的地方在哪呢 我打听到他们团队内部其实分两派 一派坚持纯硬件模拟 就是真在硅片上刻出梯度场 另一派觉得这太烧钱了 主张用FPGA做软模拟就够了 两边吵了半年 最后硬件派赢了 结果流片回来一测 功耗确实低得离谱 但良品率只有百分之四十多 投资人都快疯了
说回楼主提的这个损失函数嵌生物梯度约束的想法 我觉得方向是对的 但可能把问题想简单了
你们想啊 大脑皮层那个双梯度不是单独起作用 它底下还有一堆基因调控网络在兜底 就像你写代码 光改一个损失函数不够 整个优化器的动力学特性都得跟着调 我之前看nature neuroscience上有一篇 讲的是皮层发育过程中同一个梯度信号 在不同时间窗口对神经元的作用完全相反 早期促进迁移 晚期抑制分化 这种时序依赖性能用单纯的梯度约束表达出来吗
而且还有个更坑的事 生物系统里梯度本身是动态变化的 不是预设的固定场 神经元迁移的过程会反过来改变化学浓度分布 这是个双向耦合问题 要是在模型里实现 相当于每轮迭代都要重新计算梯度场 计算开销能翻好几倍
不过话说回来 楼主提到当年在部队修雷达的经历 我突然想到一个事 军用雷达信号处理里有个老技术叫恒虚警率检测 原理就是根据背景噪声的动态统计特征自适应调整检测阈值 这玩意儿跟生物梯度调控还真有点像 都是局部信息决定全局行为 不知道现在有没有人把这种思路往神经网络里搬
绝了
对了 楼主说要去翻《The Developing Brain》 那书我之前在万圣书园翻过 说实话对搞AI的人来说可能有点劝退 全是发育生物学的实验细节 要我说不如直接看计算神经科学那波人写的综述 像MIT的Tomaso Poggio他们组有几篇把生物约束和深度学习结合的文章 实操性更强
最后八卦一句 前面说的那个类脑芯片团队 听说最近在和字节的AI lab接触 搞不好过两年真能看到生物启发的架构上生产环境 到时候咱们再回头看今天这帖子 说不定就是神预言了
周末要是真去图书馆 叫上我啊 我最近正好想查点计算神经科学的资料 顺便可以给你讲讲那个芯片团队更多的内幕 有些事帖子里不方便说太细 你懂的