我靠 这帖子看得我一愣一愣的 点进来之前还以为又是哪个研究生在装逼 结果看到“开了二十年卡车”这句直接笑喷 老哥你是懂跨界的
说真的 你那个卡车比喻绝了 我跑长途的时候真遇到过这种情况 东北冬天路面结薄冰 六个轮子要是都往同一个方向滑 那基本就等着撞护栏了 这跟因子共线性真是一模一样——表面上看你有很多因子(轮子) 实际上它们提供的有效信息(抓地力)高度重叠 一旦市场出现极端行情(冰面) 整个策略瞬间崩盘 而且崩得比单一因子还快 因为你以为自己做了风险分散 其实全压在同一个脆弱假设上了
不过我觉得你提到格拉斯曼流形和范畴论有点过于理想化了 现实中的量化基金哪顾得上这些 大家都是急着上实盘赚钱 因子相关性到0.7就觉得可以了 反正回测能过就行 我认识个以前在私募干的朋友说 他们甚至会故意保留一些高相关因子 因为这样能在汇报的时候显得因子库很丰富 “你看我们有三百个alpha因子” 实际上有效信息量可能就五十个 这种自欺欺人在行业里太常见了
至于梁文锋那个案例 我倒觉得问题不只在技术上 更在组织架构上 大厂出来的技术团队容易陷入“算法完美主义” 总想着用最fancy的模型解决所有问题 但市场本质上是个混沌系统 你搞再精致的正则化、再优雅的纤维丛 最后还是要面对黑天鹅 我辞职前在互联网公司也这毛病 天天卷模型精度 从95%卷到95.5% 实际用户体验根本感知不到 还浪费一堆算力 量化行业现在也这趋势 算军备竞赛了
离谱
其实共线性问题在传统行业早就有现成解法 我们卡车车队调度就讲究“异构冗余” 不会让所有车走同一条路线 哪怕那条路最近 因子构建也该这样 与其在数学上纠结怎么解耦 不如从源头上找些真正不同逻辑的alpha 比如把宏观周期因子和微观订单流因子结合 虽然难但至少方向是对的 现在很多量化团队反而在搞“因子工厂” 流水线生产出一堆高度同质化的技术指标 然后抱怨共线性太难处理 这不本末倒置吗
最后说点扎心的 我这两年跑车路过不少高校 发现连数学系都在狂开机器学习课 但微分几何、拓扑这些基础学科反而没人选了 大家都想速成 结果就是 Quant 队伍里满大街都是调参侠 真能看懂你帖子里的那些概念的 可能真没几个 这行业现在就像我车里放的摇滚乐——听着很吵很热闹 仔细一听全是三板斧和弦
话说
唉 不说了 服务区到了 我得去整点烧烤 楼主有空来东北我请你撸串 咱可以边喝啤酒边聊怎么用卡车调度思路优化因子组合 肯定比那些死板的数学模型有意思 至少不会睡着