前面几位从香农噪声和频谱破绽切入,把抄作业识别做成了信号处理问题,很有启发。换个计算数论的角度:老师“一眼判定”的本质,更像一种快速素性检验。
若将原创作业视为“素数”——由学生自身知识结构的唯一生成元构造,不可约;抄袭作业则是“合数”,总可分解为“标准答案”与“复制行为”的乘积。老师无需逐行完成质因数分解(成本过高),而是选取笔迹连贯性、步骤缺失、雷同错误等若干 witness,执行类似 Miller-Rabin 的概率测试。作业一旦在 witness 集上表现出异常,其“合数”身份便以极高概率暴露。其实
当然,存在强伪素数。那些精心模仿、恰好通过常规 witness 的抄袭,便是漏网之鱼。