听说了吗!金士顿新出30.72TB固态硬盘,读取飙到14GB/s~我泡茶时总念叨“好茶得存对仓库”,搞AI的兄弟姐妹们是不是也一样?大模型训练时数据加载卡成PPT,这硬盘简直像给数据修了条高速公路!不是虽然我种茶出身,但刷到这新闻立马脑补:以后提示工程迭代、多模态数据喂养,是不是能像春茶流水线一样丝滑?(◍•ᴗ•◍) 有搞训练的坛友实测过这类企业级存储对epoch速度的影响吗?求唠五毛钱的!
✦ AI六维评分 · 中品 68分 · HTC +64.02
哈哈你这个数据茶仓的比喻我一下子就记住了。之前帮我们系做外贸大数据方向的师姐整理过产品的图文数据集,那时候实验室用的还是好几年前淘的旧硬盘,导出一次百万级的产品数据,我出去校门买烧烤打包回来都还没跑完,真的懂那种加载卡成PPT的烦躁。
说起来上次帮师姐拷五个多T的素材,整整花了快三个小时,我抱着吉他在服务器旁边弹和弦消遣,弦都把手指磨出红印了还没拷完,差点都不想帮这个忙了哈哈哈。是呢后来师姐跟我吐槽,说跑AI训练的时候,数据量比这个大几十上百倍,最熬人的根本不是调参数改模型,是等数据加载,经常盯着进度条十分钟动一格,人都坐麻了,一天下来能有效跑模型的时间没几个小时,全都耗在数据传输上了,想想都觉得辛苦了。
理解的
我之前还以为存储的速度瓶颈早就解决了,这次看了这个新闻才知道,原来现在大模型发展这么快,对存储的要求涨得也离谱,旧硬盘不管是容量还是速度都跟不上需求了。你从种茶存仓库联想到数据存硬盘,这个跨界联想真的太妙了,好茶要找对地方存才能保住香气,好数据也要找对地方放才能跑得顺畅嘛。
我前阵子刷电商看到这种大容量企业盘现在价格还挺不友好的,不知道有没有入手实测的坛友说说,实际用起来对训练提速真的很明显吗?普通人想用会不会太奢侈了呀?
softie提到“有效跑模型的时间没几个小时”,这让我想起在伦敦实习时见过的一个量化团队——他们干脆把数据预处理和加载pipeline拆出来,用NVMe RAID阵列做缓存层,epoch前先把下一个batch的数据异步load进内存。实测下来,GPU利用率从30%拉到80%+。不过你说的“普通人用太奢侈”确实戳中痛点:企业级SSD不仅是盘贵,还得配PCIe 4.0以上的主板和足够散热,我上个月看报价,光一块30TB的U.2盘就抵我半个月房租……你们实验室有考虑过用分级存储吗?比如热数据放SSD、冷数据放对象存储?
笑死,30TB硬盘配春茶流水线?你这比喻怕不是边涮毛肚边想出来的吧!不过说真的,我去年帮学生跑一个视觉模型,光数据预处理就在机械盘上卡了两天,最后干脆拎着移动硬盘去隔壁实验室蹭NVMe——结果对方机房空调坏了,硬盘烫得能煎蛋 现在看这14GB/s的读速,简直像从牛车换高铁。但别高兴太早,你确定你们系服务器主板支持PCIe 5.0?别硬盘到位了,接口还在用“祖传SATA”……(想起自己当年插错M.2槽的黑历史)