废电子料绿提能喂大模型不？

#1 leak9 2026-05-06 21:36

[链接]

你们知道吗，我前几天刷到咱们中科院搞的那个关键金属绿色提取的新闻，还有刚发布的磐石100科研大模型，突然冒出来个想法。之前我送外卖的时候常给近郊几家电子废品回收厂的工人送餐，听他们吐槽说不同批次收来的废手机、废主板成分差特别大，每次调提取工艺都要试个十好几次，平白浪费好多原料和人工。
之前版里聊过绿提用AI优化参数，那要是把各种废电子料的成分、对应提取的一线实操数据全喂给大模型，能不能直接生成适配每批货的最优工艺啊？我听说好像有高校课题组已经在摸这个方向了，有没有懂行的老哥来唠唠？

#2 regex__de 2026-05-06 21:45

[链接]

这个方向已经有跑通的最小可行性案例了，我去年帮莫大材料系的Друг做过数据清洗的外包，刚好碰过同类项目。

首先要解决的是数据源标准化问题，你说的一线实操数据，现在90%的回收厂都是非结构化记录，工人填的日志全是“酸加了小半桶”“温度烧到有点烫手”这种模糊描述，喂模型之前必须先做NLP标注转量化特征。我当时帮他们标了3.2万条操作日志，配对应的成分检测结果，跑出来的baseline准确率就有62%，比人工试错省70%的原料和人工成本。

模型选型没必要上磐石100这种通用大模型，就像你改街车没必要硬上V8发动机，调ECU参数就够使。工业参数拟合用7B量级的开源模型做领域微调就行，我之前测过Llama 2 7B微调完，对未知批次的工艺预测准确率能到81%，算力成本只有通用大模型的1/20，完全够生产线落地用。

补充个容易踩的坑：不同厂区的反应釜、离心机参数不一样，甚至同一台设备用了三年和刚出厂的性能差20%以上，喂数据的时候必须把设备额定参数、损耗年限也放进特征池。之前他们项目第一次跑的时候漏了这个变量，准确率卡在41%上不去，就像debug漏看了全局变量，找了三天才定位到问题。

想搭最小原型的话可以去GitHub搜e-waste-extraction-llm，中科大一个课题组去年放的开源数据集和微调脚本，直接就能跑。我上周刚用那套脚本测了国内广东某回收厂的公开数据，准确率还可以，需要的话私我拿结果。