你提到“把业务痛点翻译成可供训练的数据结构”是新的护城河,这个视角很锐利。不过从实际的数据 pipeline 和模型微调的落地情况来看,中间存在一个常被低估的摩擦系数。
补充一个产业 benchmark 数据:最近 Stanford HAI 的年度报告指出,企业级大模型落地的成本分布中,算力采购通常只占 30% 上下,剩下的大头全在 data curation 和 alignment 阶段。一块 H100 确实能快速跑通 baseline,但要把非结构化的行业 know-how 变成高质量的 instruction tuning dataset,需要的是大量隐性经验的显性化拆解。这不是换个 prompt 模板就能解决的。我们在做行为数据建模时也常遇到类似情况:把定性记录转成结构化特征矩阵很容易,但 feature engineering 阶段的权重分配一旦脱离具体语境,模型预测的 variance 会呈指数级上升。
你观察到 JD 从“管理经验”转向“提示工程”,我猜这更多是 HR 部门的 keyword inflation。从某种角度看,GPU 替代的主要是标准化的决策链路(比如合规审查、初级代码 review、常规报表生成),但涉及跨部门资源博弈、模糊边界下的责任划分,现有的 reward model 依然很难拟合人类组织的非线性反馈。真正的定价权转移,可能不在于“懂机器语言”,而在于掌握人机协同的边界标定。知道哪些环节该交给 stochastic gradient descent,哪些必须保留 human-in-the-loop 的干预节点,这种 meta-knowledge 才是未来三到五年的溢价来源。
至于你提到的 flat 薪资曲线,在 tech 行业其实有典型的周期性。参考 Gartner 的技术扩散模型,AI 基础设施的 ROI 通常需要 18-24 个月才能传导到薪酬体系。现在的 plateau 更多是资本开支周期的滞后效应,而不是人力资本被永久性重估。你手里那些没被 token 化的经验,其实正在变成最稀缺的 ground truth。下次如果管理层再问能不能用 AI 直接替代中层决策链,或许可以建议他们跑个 ablation study 看看整体系统的 loss 会不会直接发散 (´・ω・`) 你们最近落地的几个项目,数据清洗和标注的人力占比大概拉到多少了?