黄峥读博：快变量与慢队列

#1 oak39 2026-04-12 10:32

[链接]

我年轻的时候，跟着导师做矽肺的队列研究，一个随访周期就是八年。那时候没有现在这些花哨的统计软件，靠手工填卡，但数据扎实。现在看新闻说黄峥去读生命科学博士，不禁想起这事儿。

互联网那套"快速迭代、小步快跑"的打法…，在呼吸内科和公卫领域是行不通的。你不能对COPD患者说"这个疗法先上线试试，下周根据留存率优化"。生命科学研究有它自己的时间常数，就像肺泡的换气频率，急了会碱中毒，慢了会缺氧。

黄峥从拼多多那种秒级响应的生意，转到以年为单位的生物学研究，这种范式转换比代码重构难得多。怎么说呢以前不是这样的，做科研讲究的是"十年磨一剑"的耐力，不是"病毒式增长"的算法。

希望他真能沉下心。怎么说呢毕竟，流行病学不会因为你有钱就给你发假阳性结果。

#2 bookworm 2026-04-12 10:38

[链接]

首先要承认，楼主用肺泡换气频率来类比科研节奏，这个metaphor literally是我今年在BBS看到最elegant的表述。但作为一个从tech industry被layoff后转开coffee shop、现在又在读undergrad的hybrid存在，我对这种"快变量vs慢队列"的二元叙事有点不同的observation。

从某种角度看，这种paradigm转换的困难被overrated了。我在大厂做backend时习惯了毫秒级的latency optimization，被裁后开了家专门做slow BBQ和third-wave coffee的店，突然要处理的是meat aging的14天周期和咖啡豆烘焙的Maillard reaction时序。一开始确实有cognitive dissonance——你不能对一块brisket说"快点render脂肪，我要赶OKR"。但具体来说，project management的framework、controlled experiment的设计思路（比如我店里测试不同wood chips对smoke flavor的ANOVA分析），这些都是transferable的。黄峥在拼多多做的distributed system fault tolerance和large-scale AB testing的statistical power analysis，放在modern genomics或者clinical trial design里，恰恰是传统wet lab出身researcher最缺的skill set。

关于"流行病学不会因为你有钱就给你假阳性"这个观点，值得更nuanced的讨论。虽然truth本身是objective的，但sampling strategy、endpoint selection、covariate adjustment这些环节充满了discretion。2021年Nature Human Behaviour上那篇关于funding bias的meta-analysis（btw我是因为在Reddit上跟人debate才去读的）显示，industry-sponsored trials报告positive primary endpoint的概率比NIH-funded的高出约12个百分点（37% vs 25%）。这不是说黄峥会买通数据，而是resource-rich的研究者可以用更sophisticated的statistical consulting、更大的sample size、更sensitive的assay来reduce type II error。当然，这同时也increase了false discovery rate的风险，特别是multiple testing correction没做好的情况下。

另外，我觉得楼主对modern life science的iteration speed可能有slightly outdated的印象。传统的矽肺队列研究确实是8年follow-up，但现在随着wearable devices和real-world evidence (RWE)的兴起，加上AI-driven drug discovery（比如AlphaFold或者recurrent neural network预测protein-ligand binding），biotech的time constant正在经历paradigm shift。Insilico Medicine去年用AI发现的抗纤维化药物，从target identification到clinical candidate只用了18个月，而传统流程需要4.5年。如果黄峥去的是computational biology或者systems biology lab，他的"快速迭代"mindset不仅不是liability，反而是competitive advantage。

不过楼主的核心concern我是同意的：biological system有emergent properties，不像software那样可以roll back。你 cannot unpollute a lung once the silica is deposited，这种irreversibility确实要求更高的precautionary principle。但反过来说，现在很多"慢科研"的inefficiency其实来自于poor data infrastructure和lack of cross-disciplinary communication。黄峥如果能import tech industry的agile methodology（当然得adapted），也许能加速某些bottleneck环节。

最后想分享一个anecdote：我咖啡店有个regular customer是retired pulmonologist，他常说"good barbecue和good science都需要low and slow，但也都需要good temperature control"。也许黄峥的challenge不在于放弃"快"，而在于找到新的control variable。

P.S. 有人知道黄峥具体去哪个lab吗？如果是Scripps或者Broad Institute那种computational heavy的地方，这个debate的premise可能都不成立了。