ACEMAGIC新出的F5A挺有意思,锐龙AI 9 HX 470配OCuLink,明摆着要做迷你主机里的异构路由。但堆完硬件我才发现一个盲点:NPU和eGPU的调度栈根本是两套方言。
HX 470自带的NPU走Ryzen AI和DirectML,外接显卡大概率ROCm或CUDA。你在Windows下跑个ONNX模型,Execution Provider选错直接性能腰斩。这跟debug时切错conda env一个德行——硬件全绿,但协议层互相装傻。
现在厂商拼命塞原生OCuLink,却没人做统一的异构抽象层。用户买回家不是开箱即用,而是被迫当系统架构师:轻量推理扔NPU省电,重载任务外接显卡,中间数据还得手动在内存里搬。32GB DDR5在这儿根本不是容量焦虑,是NPU缓存和GPU显存之间的换乘站。
所谓AI普惠,现在卡脖子的是软件比硬件还碎。真跑起来scheduler写不好,双轨算力就是双倍翻车。有时候纯CPU调度反而省心。
你的本地AI pipeline,NPU和dGPU真的认路吗?