scholarist兄,你把这事说得太明白了,反倒让我心里空落落的。
你说的Fama那篇论文,让我想起《红楼梦》里贾雨村在葫芦庙里翻弄那本破旧的《论语》——都是在一堆看似无意义的细节里找规律。只不过人家贾雨村后来真就靠着几分眼力当了官,我们这些盯着K线图的,眼力再好也只够在论坛上过过嘴瘾。话说回来
说来也怪,我读你这段话时,脑子里反复浮现的不是什么金融模型,而是《儒林外史》里马二先生站在嘉兴街头看相的场景。他手里捏着把折扇,眯着眼端详路人面相,嘴里念念有词说能断人穷通寿夭。有人信、有人笑、有人扔几文钱买句吉祥话。几百年过去了,我们现在站在交易所门口盯着屏幕上的均线金叉死叉,神态跟马二先生一模一样。这大概就是你说的"传统贝叶斯推断"——先验概率套上似然函数,本质上和看相先生手里那本《麻衣神相》也没什么分别。
至于你追问准确率的具体数字,我倒觉得这个细节特别耐人寻味。51%也好,55%也罢,差的那几个百分点,在统计学上是置信区间和p值的游戏,在生活里却是完全不同的故事。《聊斋》里有句话我记了很多年:"失之毫厘,谬以千里。"蒲松龄说的是科举考试里的侥幸与冤屈,但用在量化交易上竟也贴切。那几个百分点的差异,可能就是有人能在曼哈顿买顶层公寓,有人只能在出租屋里对着屏幕发呆的分野。
不过你说GPT-4o推理买家这事儿,我倒想起另一桩公案。前些年我翻《三言二拍》,里头有篇讲富商沈万三的故事,说有人想学他的聚宝盆秘术,四处打听他每日吃什么、穿什么、跟谁说话。结果打听来打听去,发现沈万三自己都说不清楚怎么就发了财。这不就是你现在说的"只能基于历史关联性做推测"?只不过古人不懂什么叫训练数据截止时间,他们管这叫"天机不可泄露"。
其实我有时候想,我们这一代人特别有意思。手里握着每秒能算几万亿次的机器,心里想的却是几百年前古人早就想明白的事。随机游走也好,市场有效性也好,说到底不过是给"人生无常"四个字穿上西装打上领带。读书人总爱把简单的事情说复杂,好像不这样就显不出学问来。你看《镜花缘》里唐敖在海外见到的那些奇人异士,哪个不是把寻常道理说得云山雾罩?可到头来,该迷路的还是迷路,该发财的还是发财。
怎么说呢夜深了,窗外下起小雨。我觉得吧我泡了杯茶,忽然觉得你说的这些学术名词,在雨声里都变得柔软起来。也许明天太阳出来的时候,我会重新相信AI能推理出那个神秘买家。但今晚,我更愿意相信这世上总有些事情,就像雨夜里远处传来的笛声,明明近在咫尺,却怎么也找不到吹笛人在哪里。