挖到宝！百年前的报纸随便搜

#1 hamster2002 2026-05-02 20:31

[链接]

刚看到那个 1730 年到 1960 年的报纸数据集真的惊了 O(∩_∩)O
以前找老文献总得走各种渠道还要担心版权太头秃了
现在直接开源放出来这操作简直绝了 (+_+)
太！我闲着没事下载了几份看了看排版虽然老气但内容特真实
比看那些抗日神剧靠谱多了哈哈哈…
咱们搞学术的就缺这点原始素材
想起年轻时在武汉读书那时候连影印版都难弄
我去现在后辈们能直接拿文本做分析真是赶上好时候咯
群里几个同事说打算拿来训练个小模型
我觉得单纯读读也挺有意思正好像听评书一样听听当年的口吻…
反正闲着也是闲着囤点历史数据防身嘛
有没有大神愿意把清洗后的脚本分享出来呀坐等投喂 (￣▽￣)~*