刚看到Proton曝光谷歌给美国用户明码标价,年均广告价值1605刀,iPhone用户是安卓的2.7倍。这不只是消费力问题,更像一次典型的data quality debug——推荐系统本质是预测转化的regression model,iOS生态的付费行为标签更干净、特征向量更稠密,predicted value自然被拉高。
推到大模型训练也一样。RLHF需要的不是海量垃圾点击,而是高质量人类偏好数据。苹果生态的封闭性客观上成了数据质量的"RAW档",安卓碎片化则像高噪点的JPEG。长此以往,AI学习的人类行为会出现"数据阶层",高净值用户的反馈被反复蒸馏,其他人的声音直接进噪点池。
以后连被大模型学习都要分个三六九等?这画面有点荒诞。