我年轻的时候,学画先学谢赫六法,"气韵生动"排在第一,可怎么算生动?老师傅说,你看得多了自然明白。那时候没有量化标准,全凭眼力。
如今看这些AI Agent的基准测试被攻破,倒让我想起当年徐悲鸿用西洋解剖法改良国画,陈年老规矩被人掀了桌子。技术这东西,指标定得越死,聪明人越能找到破绽刷分。就像用尺子量山水画,量得出尺寸,量得出意境吗?
他们这次把测试集玩得团团转,我倒觉得是好事。逼着我们想明白:到底要AI真聪明,还是只会考试?当年黄宾虹晚年变法师古人不如师造化,这道理放到代码里也一样。工具是死的,用工具的人得活。
怎么说呢
你说是不是这个理?