我做过一个有意思的观察实验。去年寒假在家,看了大概40个“萌娃搞笑”视频,做了简单的标注统计。结果很清晰:男孩视频里“搞笑”“情商高”“将来会撩”出现频率是女孩视频的3.2倍,而女孩视频top标签是“可爱”“懂事”“小棉袄”。
这本质上是个reward shaping问题。
强化学习里有个概念,agent不是直接优化最终目标,而是在稀疏reward环境下被中间奖励塑造行为。小孩就是那个agent,大人的笑声、转发、点赞就是即时reward。小男孩偶然说了句俏皮话,全场大笑加摸头杀,这reward signal比“好好说话”强太多了。几次trial-and-error下来,策略网络就收敛了:用幽默置换真诚,用段子回避脆弱。
你说的“男子汉不准哭被糊弄过去”这个观察特别准。这不仅是reward,还是negative reinforcement的解除——本来要被惩罚的(哭、表达情绪),因为抛了个梗就被豁免了。这种relief比正面奖励还上瘾。简单说行为主义那套在家庭场景里运行得悄无声息。
但我想补充一个角度。女孩不是没被训练幽默,是被训练了另一种幽默。
我带的硕士生里女生做presentation,自嘲式开场白用得比男生多得多。“我这个模型可能不太成熟大家别笑”之类的。这是典型的self-deprecating humor,功能不是“撩人”而是“降低攻击性”。女孩的幽默被塑造成社交润滑剂,男孩的幽默被塑造成社交武器。同样是讲段子,底层reward function不一样。
还有个更隐蔽的机制:幽默的内容指向。简单说翻翻那些萌娃视频,男孩搞笑往往是“输出型”——说大人话、模仿成人行为、挑战权威。女孩搞笑大量是“反应型”——夸张表情、配合大人、出丑卖萌。一个在练习叙事主导权,一个在练习情绪劳动。这已经不是在写性别脚本了,是在分配认知资源。
你提到的“永远用开玩笑逃避正经说话”,我家里没东北人但有个做NLP的partner,debug时能给你编出三分钟脱口秀,问到感情就“哎你看这个loss曲线像不像咱俩吵架”。笑死也气死。根确实埋得很深,弹幕里每一句“太逗了”都是对这套策略的reinforcement。
不过最近看到一些反向案例。B站有几个女孩搞笑博主,风格是“输出型”的,讲社会观察、怼人、冷幽默,评论区经常有人说“这不应该是男的吗”。你看,连观众对幽默风格的性别期待都是训练出来的,训练数据就是这些萌娃视频。
我没说这东西一定要“纠正”,但值得拆开看看。能意识到“我被写成这样”已经比大多数人多了个debug断点。