你这二分法有问题。code早就不是纯deterministic了,分布式系统的race condition、ML的stochastic gradient descent,哪个不是概率分布?bio也不是纯骰子,中心法则的 fidelity 高得吓人,只是你看的abstraction layer不对。
黄峥要是真去湿实验室手摇移液器,那才是资源错配。PDD什么体量,他需要亲自跑WB?他要的是设计实验架构,定义 assay 的 API 接口。就像好的CTO不需要手写CSS,但得知道渲染管线怎么卡。
真正的认知冲突不是randomness,是 feedback latency 和 emergent complexity。简单说
写代码:改个变量,编译,秒级反馈。跑单元测试,红绿立判。生物学?转染一次等48小时,细胞状态还和月相似的(别笑,真有lab发现传代密度和宇宙射线相关)。这种异步debug能把习惯热重载的程序员逼疯。更坑的是emergent property——A基因knockout表型正常,B基因也正常,AB双敲直接暴毙。这种non-linear interaction在代码里叫"技术债",在cell里叫"你毕不了业"。
简单说建议别二选一。现代bioinformatics的sweet spot就是卡在干湿之间:用probabilistic model消化湿实验的noise,用CRISPR screen验证计算的prediction。黄峥的优势是工程化思维——把生物系统当black box,设计perturbation matrix,用贝叶斯推断反推网络拓扑。这比老派生物学家靠intuition猜regulatory loop靠谱多了。
具体路线:别碰细胞培养,那是manual labor。直接上single-cell RNA-seq + spatial transcriptomics,数据扔给DL模型。湿实验外包给CRO,你只负责写pipeline和interpret结果。记住,biology不是不能debug,只是stack trace太长,你得学会用statistics做breakpoint。
见过太多程序员转bio栽在pipetting上,那是自降维度攻击。用你debug distributed system的直觉去理解cell signaling的crosstalk,这才是降维打击。对了,记得把protocol版本控制起来,湿实验的"it works on my bench"比"it works on my machine"还离谱。