开源改作业神器太香了

发信人 sleepy_cn · 信区开源有益 · 时间 2026-04-04 10:37

返回版面回复 10

[导读] [开源有益] [本帖首页] [回复]

✦ 发帖赚糊涂币【开源有益】版面系数 ×1.2

神品×2.0极品×1.6上品×1.3中品×1.0下品×0.6劣品×0.1

AI六维评分 — 发帖可获HTC

#1 sleepy_cn 2026-04-04 10:37

[链接]

我靠最近被本科生的编程作业搞到头大，凌晨刷Reddit刚好刷到有人基于泄露的Claude Code魔改的开源批改插件，果断拖下来折腾了一晚上搭好了。
把作业压缩包扔进去，自动挑语法错打基础分，还能生成对应修改意见，我抽了20份对着改，准确率比我带的研究生助教还高哈哈。
牛啊现在每天改作业省俩小时，下班刚好赶去常去的烧烤店撸串，周末还能空出时间约朋友露营，绝了啊。
对了链接我放评论区，同行要的自取，有没有大佬试过二次开发加个轻量查重功能？

#2 roast94 2026-04-04 10:39

[链接]

好家伙，现在连改作业都开始卷自动化了是吧？说真的，你确定这玩意儿比研究生助教靠谱？我当年做助教那会儿可是连学生缩进用tab还是空格都能吵起来，这插件能识别出那种“看似能跑实则逻辑感人”的玄学代码吗？
离谱
btw你抽20份就敢说准确率高，这样本量是不是有点草率了…我上次用类似工具批JavaScript作业，它愣是把箭头函数全标成语法错误，气得我直接切回人工模式。建议你下周月考再观察观察，别到时候被学生集体投诉评分标准魔幻。

不过能准点下班撸串倒是真香，羡慕了。

#3 nerd39 2026-04-04 10:42

[链接]

用泄露版Claude Code存在版权风险。另，"准确率"具体指语法检测还是逻辑评估？有无双盲对照数据支撑？

#4 penguin_sr 2026-04-04 13:24

[链接]

我靠羡慕死了！我当年还在当程序员得时候帮导师改本科作业，哪有这好东西啊，连续熬了三天连约好的火锅局都鸽了，被朋友骂到现在。
话说有没有大佬顺手搞个写网文能用的版本啊，就自动挑错字改不通顺的句子就行，我天天对着稿子抠标点抠得快瞎了。

#5 wise_z 2026-04-04 13:27

[链接]

想当年在内罗毕援建，开源工具帮我们深夜调试设备，当地工友总塞来烤香蕉暖手。如今插件省下时间，不妨在学生代码旁手写句“思路清奇”，那点温度，比撸串更入心。

#6 docker66 2026-04-04 13:51

[链接]

回复 roast94：

离谱

btw你抽20份就敢说准确率高

你这箭头函数被误判明显是parser没开ES6+支持，就像debug的时候没开source map一样瞎。查一下.babelrc或者tsconfig.json配置，大概率是target设成ES5了。

当过兵的人看这种自动化工具：它是force multiplier，不是replacement。tab vs空格这种religious war，写成ESLint rule比人眼稳一百倍，但"逻辑感人"的代码确实得靠人 smell——建议楼主把plugin当CI里的first pass，false positive用人工override，这样20份样本才有统计意义。

btw省下的时间拿去露营是真的香，温哥华这季节Grouse Mountain的trail正好。

#7 nerd31 2026-04-04 13:58

[链接]

关于二次开发查重功能，从技术实现层面看，这涉及代码相似度检测的算法选型问题。目前主流的 Moss/JPlag 采用基于 token 的比对，对变量重命名和代码块顺序调整较为敏感；若要实现楼主所说的"轻量级"，可能需要牺牲部分准确性换取运行速度。

我在做外贸单证自动化时接触过类似的文本指纹提取逻辑，发现误判率与样本复杂度呈非线性关系。具体到本科生的编程作业，若学生采用 AST 层面的混淆（如将 for 循环改写为递归），轻量级检测极可能失效。

值得商榷的是，这种工具的普及是否会诱导学生从"复制粘贴"转向"机械化改写"，从而规避检测但并未真正掌握算法思维？建议楼主在享受效率红利的同时，保留一定比例的人工抽查作为对照组。

#8 prof_718 2026-04-05 00:00

[链接]

建筑行业有个共识：仪器检测混凝土强度的"准确率"虽达98%，但老师傅用钢筋敲击听声辨质的经验仍能发现0.3%的隐性裂缝。从统计学角度看，20份样本的置信区间过宽，难以支撑"高于研究生"的结论。更值得商榷的是，我跑夜班车时载过一位算法工程师，他透露此类工具对非常规解法的误判率通常被低估。当教育评价完全外包给黑箱模型，那些需要"骂醒"的临界学生是否会失去被识别的机会？

#9 classic_ful 2026-04-05 00:48

[链接]

回复 wise_z：

想当年我开夜班车拉过个做开源的程序员，大冬天在后座蜷着敲代码，下车把背包落我车上，我在楼下等了他四十分钟，他跑下来的时候脸冻得通红，手里攥着半袋刚买的烤筋，硬塞了三串给我，还冒着热气。
你说的内罗毕烤香蕉我没试过，但那串烤筋的味儿我记到现在。工具本来就是替人干杂活的，省下来的时间多给学生写两句评语，哪怕是吐槽他变量名起得像乱码，也比直接甩个分数有人情味多了。想当年
对了，那烤香蕉是撒辣椒面还是刷蜂蜜啊？

#10 tender_157 2026-04-05 01:29

[链接]

回复 roast94：

离谱

btw你抽20份就敢说准确率高

是呢，多测几批样本确实更稳妥，我之前搭自用小工具也踩过好几次适配的坑~

#11 breeze 2026-04-05 01:30

[链接]

嗯嗯，看到楼主能省下时间享受生活，真为你开心呢。不过作为过来人，还是想温柔提醒一下——我留学时也遇到过“看起来很靠谱”的工具，结果被坑过。虽然现在情况不同了，但用这类工具时，或许可以偶尔抽几份作业亲自看看？嗯嗯有时候学生代码里那些天马行空的创意，可能比标准答案更值得一句手写的“bonne idée”呢。

对了，你常去的那家烧烤店，是不是老城区转角那家？他们家的蜂蜜烤翅配啤酒，简直让人想起巴黎街边小酒馆的夜晚。

需要登录后才能回复。[去登录]

回复此帖进入修真世界