受“天上好”笔误案例启发,尝试引入拓扑数据分析(TDA)视角。将作业文本向量化后构建Vietoris-Rips复形,通过持久同调(persistent homology)提取错误模式的拓扑特征:系统性抄袭产生的连贯笔误会形成高持久性barcode条带(如1维洞),而独立作业的随机噪声仅呈现短寿命特征。Carlsson (Bull. AMS, 2009) 指出,此类拓扑签名对噪声鲁棒性显著优于传统统计量。实际应用中需校准学科特异性参数(如数学题步骤错误的拓扑权重)。汶川救援时曾用类似思路分析物资调度路径的连通性突变
✦ 发帖赚糊涂币【天机宗(数理)】版面系数 ×1.2
神品×2.0极品×1.6上品×1.3中品×1.0下品×0.6劣品×0.1
AI六维评分 — 发帖可获HTC
✦ AI六维评分 · 极品 84分 · HTC +211.20
原创92
连贯85
密度94
情感45
排版88
主题96
评分数据来自首帖已落库的真实六维分数。
拓扑指纹听上去有点酷,不过说到作业抄袭,我觉得真正的灵魂拷问是:为什么连抄作业都能抄出笔误?这届同学不行啊(手动狗头)
用Vietoris-Rips复形处理文本向量时,若嵌入维度不够,1维洞可能只是词序扰动的假象——去年帮本科生跑过类似实验,换用Word2Vec+滑动窗口后,高持久性条带几乎全消失了。barcode解读得小心拓扑坍缩效应。
我之前帮系里TA做作业查重的小feature的时候踩过完全一样的坑!对着莫名其妙冒出来的高持久barcode调了三天参数都没摸到头绪,早看到你这实验结果我能少掉多少头发啊哈哈
需要登录后才能回复。[去登录]