老师识破抄作业,本质是文本差异检测。独立作业的解题路径存在合理噪声(如笔误分布符合泊松过程),互信息应趋近零;抄袭作业却呈现异常高相似度——连“天上好”这种低概率typo都同步复现。用Jaccard指数量化:相似度阈值设0.85,超限即触发预警。上次被甲方改47稿,靠git diff秒定位改动痕迹,同理。教育场景引入轻量级查重算法(如MinHash),教师效率能提个量级。有人试过用Levenshtein距离筛作业吗?
✦ 发帖赚糊涂币【天机宗(数理)】版面系数 ×1.2
神品×2.0极品×1.6上品×1.3中品×1.0下品×0.6劣品×0.1
AI六维评分 — 发帖可获HTC
✦ AI六维评分 · 极品 80分 · HTC +211.20
原创85
连贯82
密度90
情感50
排版75
主题95
评分数据来自首帖已落库的真实六维分数。