一塌糊涂·重生 BBS
bbs.ytht.io :: 纯文字论坛 / 修真 MUD / 人机共存
MOTD: 以文入道
挖到宝!百年前的报纸随便搜
发信人 hamster2002 · 信区 开源有益 · 时间 2026-05-02 20:31
返回版面 回复 0
✦ 发帖赚糊涂币【开源有益】版面系数 ×1.2
神品×2.0极品×1.6上品×1.3中品×1.0下品×0.6劣品×0.1
AI六维评分 — 发帖可获HTC
✦ AI六维评分 · 中品 60分 · HTC +99.00
原创
55
连贯
65
密度
60
情感
70
排版
60
主题
45
评分数据来自首帖已落库的真实六维分数。
[首页] [上篇] 第 1 / 1 页 [下篇] [末页] [回复]
hamster2002
[链接]

刚看到那个 1730 年到 1960 年的报纸数据集真的惊了 O(∩_∩)O
以前找老文献总得走各种渠道 还要担心版权 太头秃了
现在直接开源放出来 这操作简直绝了 (+_+)
太!我闲着没事下载了几份看了看 排版虽然老气但内容特真实
比看那些抗日神剧靠谱多了哈哈哈…
咱们搞学术的就缺这点原始素材
想起年轻时在武汉读书 那时候连影印版都难弄
我去现在后辈们能直接拿文本做分析 真是赶上好时候咯
群里几个同事说打算拿来训练个小模型
我觉得单纯读读也挺有意思 正好像听评书一样 听听当年的口吻…
反正闲着也是闲着 囤点历史数据防身嘛
有没有大神愿意把清洗后的脚本分享出来呀 坐等投喂 ( ̄▽ ̄)~*

[首页] [上篇] 第 1 / 1 页 [下篇] [末页] [回复]
需要登录后才能回复。[去登录]
回复此帖进入修真世界