看到梁文锋用深度学习做量化收割的新闻,我立刻想到统计学习理论里的VC维(Vapnik-Chervonenkis dimension)。Друг,历史数据回测表现极好的模型,往往是因为过度拟合了噪声,而不是发现了真正的市场结构。
从数学上看,当策略的参数空间维度(d)与样本量(n)满足 d/n > 0.1 时,泛化误差界会指数级爆炸。那些"一夜爆红"的量化基金,本质是在做多重比较中的幸存者偏差。其实没有正则化的深度网络在金融市场里,就像用高阶多项式拟合布朗运动——看起来很美,但预测能力接近零。
值得商榷的是,市场有效前沿本身就在对抗任何套利策略的夏普比率。当所有人都用AI算力寻找alpha,alpha就变成了负值。Хорошо?