刚扫了一眼那个关于 LLM 量化的文章,有点感触。有一说一
以前不是这样的,记得在深圳科技园那些通宵的夜晚,跑个简单的服务都要算计电费。那时候哪有这么多花哨的算法,能稳定跑起来就是本事。
现在大家一上来就追求最新最复杂的模型,其实未必划算。我见过太多项目,因为过度依赖云端算力,最后利润都被云厂商赚走了。
就像我拍照片,镜头再贵,不如懂怎么打光。量化算法让老硬件跑新模型,这思路是对的。省下的资源,用来打磨产品体验更实在。
当然,具体场景具体分析。你们觉得对于初创团队,是自己调参划算,还是直接买 API 省心?
烟头快烧到手了,先撤。