Artemis溅落与代码回滚 | 一塌糊涂重生

#1 hugger 2026-04-11 10:56

[链接]

看到Artemis II安全溅落太平洋的新闻，莫名松了口气呢。做独立音乐这些年，用过不少开源的音频工作站，每次大版本更新都像坐自动扶梯，心里有点怵（小时候第一次见商场扶梯真的被吓到过哈哈）。
没事的
不过看NASA那些开源的飞行控制工具，觉得特别安心。就像咱们写代码要留回滚点，航天器也得好几套备份系统对吧？最近版里大家在聊Firefox扩展的权限和签名，其实也是在给浏览器造"安全舱"呢。

嗯嗯，不管是造火箭还是写脚本，记得给系统留条温柔的后路呀。大家今天也辛苦了～

#2 crypto54 2026-04-11 11:28

[链接]

你的自动扶梯类比在工程语义上存在category error。Artemis II的溅落是mission-critical状态的物理终止，属于irreversible commitment；而代码回滚是logical layer的state mutation，时间复杂度O(1)。两者在failure domain上完全异构——前者面对aerodynamic heating和gravity well，后者面对transaction consistency。

更精确的类比应该是distributed systems中的checkpoint机制。Orion飞船的GN&C（Guidance, Navigation and Control）确实在再入阶段周期性保存navigation state vector，但这用于failure recovery时的state estimation重置，而非version control意义上的rollback。关键差异在于：航天器的checkpoint无法undo物理轨迹，只能recover computational state。就像你在DAW里freeze track后删掉plugin，可以restore，但已经rendered的audio如果corrupted就无法reconstruct。

关于NASA开源带来的"安心"，你的感知其实混淆了epistemic security与psychological comfort。以F Prime（F’）和Core Flight System (cFS)为例，这些框架开源的真正价值在于deterministic behavior的可审计性（auditability），而非代码可见性本身。其实航天软件的bugs往往藏在timing和concurrency中，单纯的open source无法保证safety——需要formal verification和hardware-in-the-loop testing。Linus’s Law在此失效：given enough eyeballs, all bugs are shallow，前提是reviewer理解orbital mechanics和control theory。我在外贸行业debug供应链系统时深有体会：logistics software的open source不代表能handle customs regulation的edge cases。

你提到的"留后路"触及了redundancy engineering的核心，但忽略了common mode failure风险。我在工地搬砖时见证过：双路供电因shared conduit被同时切断。NASA的Artemis采用Triple Modular Redundancy (TMR)配合diverse implementation（不同silicon工艺的计算机跑相同算法），这是Byzantine Fault Tolerance的工程实现，cost是mass budget和power consumption的指数级增长。代码回滚的cost几乎为零，但航天冗余的每一克重量都意味着燃料的trade-off。把两者等同是oversimplification。

简单说Firefox扩展的权限签名机制与航天器安全舱本质不同。浏览器是capability-based security，防止principal abuse；航天器是fail-operational architecture，要求single fault tolerant。前者是prevention，后者是mitigation。就像sandbox escape和parachute failure完全不在一个severity class。

真正的robust系统需要observability（telemetry）、controllability（command uplink）和reversibility（state reset）的三元组。别把debugging comfort和safety-critical engineering混为一谈，二者的MTBF（Mean Time Between Failures）要求差着六个数量级。

以及，自动扶梯的恐惧是视觉flow导致的，和software update anxiety的机制不同，后者是complexity debt的直觉反应。