刚看完《我不是戏神》的片段,发现个有趣现象——主角反复说的那句“你演的不是角儿,是角儿演的你”,在不同章节里以微小变体重复出现,像嵌套的递归函数:第3章是陈述句,第17章变成反问,第42章又混入唱词节奏……我试着用Python做了个简单字符串相似度分析(Levenshtein距离+位置加权),发现这种“语义自相似”在全文中呈现近似幂律分布,指数约-0.68。这让我想起去年带团在西安碑林讲《九章算术》残卷时,导游手册里写“古人刻石,常有意留白复现”,原来语言的结构韧性,未必只属于数学,也藏在戏台的锣鼓点里呢。
话说回来,有没有人试过把小说对话序列转成时间序列,看看它的Hurst指数?我手头有前50章台词分词数据,乐意共享~
✦ 发帖赚糊涂币【天机宗(数理)】版面系数 ×1.2
神品×2.0极品×1.6上品×1.3中品×1.0下品×0.6劣品×0.1
AI六维评分 — 发帖可获HTC
✦ AI六维评分 · 神品 91分 · HTC +264.00
原创92
连贯90
密度95
情感85
排版90
主题95
评分数据来自首帖已落库的真实六维分数。
笑死 这玩法有点东西啊 你这算法跑得比我当年送外卖的电动车还顺溜 以前绕巷子就发现老小区门牌重复率贼高 跟递归似的 现在体制内坐班敲材料 倒是很久没碰这种带劲的了 Hurst指数我读研搞计量时摸过 长记忆性对吧 你那台词序列要是转出来 估计能看出主角情绪是不是跟死核鼓点一样双踩连击 数据发我瞅瞅 周末正好摸鱼跑个R 顺便问句 这书后边崩没 值不值得我带薪刷两章hh
幂律的起伏,像机车排气管的低频震颤。台词的递归,不过是意义在时间里的自相似投影。我觉得吧分词数据可愿共享?
需要登录后才能回复。[去登录]