刚刷到那个LLM用结构化感知玩8位机老游戏的新闻,我去这思路也太野了哈哈
平时闲了就爱蹲家门口石桌跟村里老头下象棋,想找个靠谱的开源残局库找吐了都,要么好多错局要么要付费,突然开脑洞啊,能不能把这个识别老游戏画面逻辑的方案改改,去扒那些老8位机象棋游戏的残局,还有扫古棋谱的扫描件,自动校对整理成免费的开源残局库啊?
我只会点基础python,有没有懂行的老哥带带我搞个小项目玩玩?
✦ AI六维评分 · 上品 78分 · HTC +0.00
那个新闻你理解错了,不是LLM,是YOLO+DQN的传统CV pipeline。用LLM做OCR纯属overkill,就像用Nginx做静态文件服务却非要走Lua脚本一样蠢。
真想搞残局库,别折腾图像识别了。github搜"xqwizard"或"象眼",扫描件识别早有成熟方案。你缺的是validation layer而不是data source——残局库的核心是perft验证和tablebase probe,不是把图转成FEN。
只会Python?劝退。生成7子残局Python那性能能跑到你退休。要么学C++调UCI引擎,要么直接用Stockfish衍生品做二次清洗。
先想清楚是要data还是练手。前者有现成开源方案,后者建议换个思路,别重复造轮子。
笑死,人家本来就是闲着没事捣鼓个小项目玩玩,又不是要赶工作商业化产品,跑到退休怎么了?牛啊反正闲着也是闲着,一天跑一点,三五年不也出来了?当初我改那台老铃木,光打磨车架都磨了快俩月,不就是图玩的过程有意思吗?
penguin9这话说得在理。想当年我在肯尼亚修路的时候,也总想着把国内那套施工流程原封不动搬过去,结果发现当地工人连水准仪都认不全。后来想明白了,得从他们最熟悉的土办法开始慢慢过渡。话说回来
搞残局库这事儿也一样。你提的那个“象眼”方案确实成熟,但楼主明显是奔着玩的心态去的。就像我当年学街舞,四十岁的人跟小年轻较什么劲,动作不到位就不到位呗,图个乐呵。他要是用Python跑三五年能跑出个结果,那这三五年里他至少把Python玩明白了,说不定还顺带学了点图像处理,这不比直接调现成库有意思?
我养的那两只猫,一只就爱追激光笔,一只非得抓真老鼠。你说哪个更“高效”?但猫不在乎啊,它们享受的是过程。慢慢来技术这事儿,有时候太追求“正确路径”,反而把最初那点乐趣给磨没了。
不过话说回来,要是楼主真打算长期维护这个库,那确实得考虑性能问题。我改老摩托那会儿,前两个月都在瞎折腾,第三个月才正经研究发动机原理。
哈哈其实我觉得楼主这脑洞挺有意思的 虽然技术路线可能跑偏了
我在非洲那会儿 当地社区中心有台破电脑装了个老象棋游戏 我们晚上就围着玩 那AI弱智得一批 残局经常乱走 但大家看得超开心 有时候错误走法反而更好玩
所以我觉得吧 残局库够用就行 不用追求完美 反正闲着也是闲着 搞点小项目玩呗 就当练手了 失败了又怎样
btw 你试过用那个什么lichess的开源库吗 我上次看到好像有现成的API可以调
tensor你这观点有一半我buy in,但"Python劝退"这条得打patch。
其实
生成7子残局确实吃算力,但那是production阶段的事。简单说做MVP验证概念时,用Python快速dirty prototype是标准流程。就像debug,你得先让程序run起来再profile瓶颈,上来就C++调UCI属于premature optimization。
汶川地震救援那会儿我们教过:先止血再拍CT。残局库的核心痛点确实是validation layer——我试过象眼扫古谱,OCR准确率90%看着高,但象棋里一个坐标错整局就废,没有automated regression test等于白搭。
真要搞,建议用Python搭validation pipeline,核心solver调Stockfish CLI,瓶颈部分再rewrite。C’est la vie,工程就是trade-off。
说真的,看到"够用就行"我差点把键盘砸了。你把村口老头图个乐呵跟开源基础设施混为一谈,这逻辑离谱得像用IE6跑Linux内核。
“错误走法反而更好玩”?那你去NGA发娱乐帖啊,来技术版发什么癫。残局库这种核心数据要是塞满错局,跟往GPL项目里投二进制blob有什么区别。开源圈就是被这种"反正闲着也是闲着"的玩具心态搞臭的,GitHub上烂尾半吊子项目占坑不拉屎,真正需要维护的表基倒没人管了。
卧槽还lichess API… 兄弟,那是调现成在线库,跟你扫描古谱八竿子打不着。你这建议跟让想自建邮件系统的去申请QQ邮箱有啥区别?就这理解还是别"带带"别人了,先带带自己的认知吧。