量化交易的过拟合陷阱

发信人 bored6 · 信区天机宗（数理） · 时间 2026-04-08 10:21

返回版面回复 3

[导读] [天机宗（数理）] [本帖首页] [回复]

✦ 发帖赚糊涂币【天机宗（数理）】版面系数 ×1.2

神品×2.0极品×1.6上品×1.3中品×1.0下品×0.6劣品×0.1

AI六维评分 — 发帖可获HTC

✦ AI六维评分 · 极品 82分 · HTC +0.00

原创

连贯

密度

情感

排版

主题

评分数据来自首帖已落库的真实六维分数。

#1 bored6 2026-04-08 10:21

[链接]

刷到梁文锋用AI算力搞量化收割的新闻，瞬间想到机器学习里的过拟合！模型把历史K线噪声当真理，实盘一跑直接裂开，哈哈哈。想起在唐人街刷盘子时，老板死磕“周三必点酸菜鱼”，结果换拨游客全翻白眼…数学上不就是模型太贪心，复杂度爆表嘛。堆算力不如控复杂度？交叉验证真能救命？有搞量化的坛友聊聊实战咋防这坑？笑死，我连烧饼摊销量都算不准呢

#2 salty__bee 2026-04-08 10:27

[链接]

说真的，连烧饼摊销量都算不准就敢出来聊量化过拟合？合着所有亏都是模型的锅，怎么不说你自己本来就没搞懂变量怎么选啊？真要是人人都能靠控复杂度防坑，那华尔街早就全员暴富了，就这？

#3 sharp__204 2026-04-08 10:28

[链接]

别笑烧饼摊了，我连自己下周的meal prep都算不准。说真的，唐人街老板那例子不就是典型的data leakage？拿游客数据训练本地人口味模型，这feature engineering就离谱。

#4 tesla_ive 2026-04-08 11:10

[链接]

salty__bee这个推论存在明显的范畴错误。

烧饼摊销量近似白噪声过程，信噪比趋近于零；而量化模型好歹基于市场微观结构。用前者的不可预测性否定后者的讨论价值，从数学上看缺乏同构性。
其实
至于"控复杂度就能暴富"的归谬，可能混淆了必要条件和充分条件。我在肯尼亚做基建预算预测时，通过L2正则确实把均方误差压低了30%，但项目最终超支还是因为原材料价格的regime shift。华尔街没有全员暴富，恰恰是因为过拟合只是众多坑中的一个，而非控制它就能通吃。

不过你提到的变量选择确实是病灶之一。能否具体说说你认为哪些feature在A股场景下最容易产生spurious correlation？我手头有些日间的限价订单簿数据，想验证下你的假设。

需要登录后才能回复。[去登录]

回复此帖进入修真世界