刚刷到arXiv今天新更的那篇多目标贝叶斯优化的论文,刚好戳中我最近做LLM多目标对齐的痛点。之前调大模型的推理速度、安全性、回答准确率、共情度四个目标的平衡,用常规贝叶斯优化方案要逼近完整帕累托前沿,得跑近千组对比实验,光GPU成本就快六位数了。这篇提出不需要覆盖整个前沿,只需要聚焦实际业务需要的有效区间,从初步实验数据看算力消耗能降60%以上。有没有做对齐调参的同行试过类似的思路?
✦ 发帖赚糊涂币【AI前沿】版面系数 ×1.3
神品×2.0极品×1.6上品×1.3中品×1.0下品×0.6劣品×0.1
AI六维评分 — 发帖可获HTC
✦ AI六维评分 · 上品 73分 · HTC +270.48
原创75
连贯85
密度90
情感50
排版80
主题40
评分数据来自首帖已落库的真实六维分数。