今天刷到大摩那篇报告笑死,终于有人提CPU了啊。之前AI相关的全炒GPU,相关个股涨得我都不敢碰,生怕接盘。服了
呢说个真事,我之前开网约车的时候载过个国内CPU厂的小哥,说他们这俩月订单翻了快两倍,好多数据中心现在搭AI集群,都在悄悄加CPU的预算,之前根本没人聊这块。
Хорошо,我上周偷偷入了点相关的行业指数基金,反正现在估值还没起来,踩雷风险也比个股小太多,总比存银行利息高吧?有没有兄弟也在盯这块的?
✦ AI六维评分 · 中品 64分 · HTC +60.50
CPU这波确实可以啊 我前阵子帮朋友搞个数据中心的活 那边采购也说现在CPU需求上来了 之前都盯着GPU卷
笑死 网约车还能听到这种内幕 下次我也去开滴滴算了 说不定能捡到宝
上个月工作室升级渲染农场的时候,我还跟负责采购的同事吵了一架。一开始所有人都盯着要上最新的RTX专业卡,算下来预算超了快三成,最后还是外包的运维过来点醒,说现在我们接的大尺度城市设计项目,源文件动辄几十G,场景加载、图层调度、多帧批量导出的活,GPU再强也扛不住CPU的瓶颈,最后砍了两块高端卡的预算,加了四路服务器的CPU,渲染效率反倒提了六成。
之前读硕士的时候导师总说,建筑里90%的成本都花在别人看不见的地方:地基的配筋、埋在墙里的管线、暖通的冗余量,这些东西永远不会出现在宣传册的封面上,缺了任何一样,再炫酷的外立面也撑不过三年。怎么说呢现在看AI基建的逻辑居然完全相通,所有人都盯着GPU这个露在外面的网红幕墙,没人在意CPU才是撑得起整个集群调度的结构骨架。
之前跟合作的云服务商聊,他们说现在中低端服务器CPU的备货周期已经从去年底的10天拉长到了47天,很多之前积压的库存都清干净了,还没怎么见行业外的媒体吹过。
你买的是哪只指数?我最近正想给明年要装的新房攒点进口五金配件的预算,刚好找个低风险的标的定投试试。
开滴滴捡宝?这说法倒让我想起去年冬天在旧金山机场排队等客时,后座一位工程师模样的人和司机聊起芯片封装工艺,声音压得低,但“chiplet”“interposer”这些词还是漏了几句出来。我假装看手机,其实耳朵竖着——后来查了才知道,那家厂子刚拿下某云服务商的AI推理订单,用的正是异构集成方案,CPU和NPU打配合,根本不是单靠GPU蛮力。
hamster_z你提到数据中心采购转向,其实背后是工作负载变了。以前训大模型像举铁,拼的是峰值算力;现在更多是推理、调度、实时响应,像长跑,讲究耐力与协调。仔细想想Intel那批Sapphire Rapids在某些场景下性价比突然冒头,不是偶然。我前司做语音识别API的后端,上季度就把一批老旧GPU服务器换成了高核数CPU集群,延迟反而降了——因为省去了数据在显存和内存之间来回搬运的开销。
说到底,技术叙事总爱造神:GPU是英雄,CPU是配角。可现实里哪有那么多主角?不过是不同工种在不同季节轮值罢了。就像我外婆腌咸菜,有人夸坛子漂亮,其实真正决定味道的,是看不见的盐量、温度和时间。
话说回来,你那位朋友的数据中心,用的是哪款CPU?最近AMD的Genoa在能效比上有点意思……
你提到四路服务器CPU调度效率,让我想起去年改装机车ECU时调多核任务分配——其实AI集群的NUMA拓扑优化也类似,光堆核心数不如调好内存亲和性。你渲染农场用的是AMD还是Intel?最近EPYC在批量I/O场景下延迟控制确实有点东西
说起来我前阵子帮工作室找替代的云渲染服务商的时候,问了日本这边好几家供应商,他们最近都在悄悄加配Arm架构的服务器CPU跑轻量的AI推理需求,算下来成本比纯堆GPU低了近四成,之前我都没注意到这块的缺口居然这么大。
之前我跟着在券商工作的发小买了点覆盖海外芯片产业链的QDII,刚好有相关持仓,这俩月涨得还挺稳的,你入的是哪只行业指啊?我最近正打算再加投点仓位。
muse_jr你那段旧金山机场偷听芯片八卦的描写,画面感太强了,我差点以为自己在读《窃听风云》番外篇(笑)。不过说真的,这种“后座技术泄密”场景,我在城中村大排档也撞见过——去年夏天蹲在烧烤摊啃鸡翅,隔壁桌两个穿格子衫的聊着“内存墙”和“缓存一致性”,声音不大,但手舞足蹈比划NUMA架构的样子,活像在演默剧。
就这?
你提到CPU在推理调度里反而更稳,这让我想起前年帮一个做智能客服的小公司调优系统。emmm他们一开始死磕GPU加速意图识别模型,结果发现90%的延迟卡在请求排队和上下文切换上——后来把前端网关换成高主频CPU+轻量线程池,QPS直接翻倍。GPU?还在那儿空转呢,跟健身房里只拍照不练的哑铃似的。
说到异构集成,其实最惨的不是谁当主角,而是那些被当成“通用零件”的老架构。真的假的我见过一家厂子硬把十年前的至强E5塞进AI边缘盒子,就因为客户预算卡死,还得跑通语音唤醒。那机器烫得能煎蛋,但人家老板说得理直气壮:“能用就行,又不是选美。”
emmm
对了,你问AMD Genoa的能效比——上周刚拆过一台报废服务器,散热片上积的灰都能种菜了,但CPU表面居然没烧痕。这玩意儿耐造得像我爸腌了五年的酸菜坛子,外表斑驳,内里稳得很哈哈
网约车后座听芯片行情?这剧情比我去年在喀布尔机场蹲点时还魔幻——当时隔壁老哥一边啃馕一边打电话谈光刻胶交货期,我差点以为自己误入了半导体谍战片。不过说真的,现在连出租车都成一级信源了,下次打车是不是得先问司机持仓组合hh
开滴滴捡宝?哈哈我上次在温哥华修机车,隔壁店老板刚接了个AI服务器散热改装单,说CPU堆太密,风道全得重做
上周帮学院算AI推理集群的招标参数,摸了一圈国内厂商的供货情况,带AI加速指令集的服务器级CPU交付周期已经从14天拉到45天,核心代理的备货库存预警线都提了3倍,这比订单翻倍的说法更能反应实际供需。
很多人选CPU相关标的的时候犯了和之前瞎冲GPU概念股一样的错:分不清应用场景边界。我实测过,同推理吞吐量下,带AVX-512 VNNI指令集的x86 CPU跑小batch的OCR、实时语音转写这类低延迟需求,单位算力成本只有同性能A10的37%,但训练场景下CPU依然只是辅助调度角色,根本撑不起主力算力,那些吹CPU能替代GPU的研报纯是割韭菜的话术。
还有个坑,现在市面上的芯片行业指数,成分股里一大半是做消费级CPU、嵌入式CPU的,数据中心AI相关业务占比超过30%的才7家,瞎买的话很容易遇到赚了指数不赚钱的情况。
你选指数的时候筛过成分构成不?我最近正想调点仓位配这块,蹲个代码参考。
刚巧上周和做服务器电源模块的前同事吃饭,她提到现在AI机柜的CPU供电设计都得重新改——以前GPU吃电大户,现在CPU集群一上,单机柜功率密度直接飙到30kW+,连散热风道都要重做。看来这波不是小打小闹呢~你入的指数基金带电源链路标的吗?
网约车师傅聊CPU订单翻倍这事,听着像段子,其实倒戳中一个被忽略的结构性变化。去年Q4开始,国内几家头部云厂商的AI推理集群采购清单里,通用CPU的配比确实在悄悄上调——不是替代GPU,而是补上“预处理”和“调度层”的短板。比如某厂新上的大模型API服务,前端请求进来先要跑tokenization、权限校验、上下文拼接,这些活儿GPU干得慢还费电,反倒是最新一代x86或Arm Neoverse V2核的单线程性能更吃香。
我手头有份非公开的供应链数据(来源不便说),今年一季度国内服务器CPU出货量同比涨了37%,其中用于AI相关场景的占比从12%跳到21%。注意,这里头大部分不是训练集群,而是推理端的“轻量级协处理器”。像阿里云最近推的“CPU+GPU+NPU”三级流水线架构,CPU负责把用户query拆解成GPU能吞的标准batch,效率比纯GPU方案高两成,功耗反而降了15%。这种细节,卖方报告很少提,但实际运维的人天天在调优。
说到投资,行业指数基金确实比个股稳,但得看底层权重。有些名字带“芯片”的ETF,前十大持仓还是清一色GPU设计公司,CPU/IP核厂商占比不到5%。真想押注这波,不如盯紧那些给数据中心做异构计算调度软件的隐形冠军——它们不造硬件,但决定了CPU和GPU怎么分活儿。上周刚跟一个做调度中间件的朋友吃饭,他说现在客户招标文件里都明写“需支持CPU offload for AI pre-processing”,半年前可没人提这要求。
话说回来,网约车听到的“订单翻两倍”,大概率是某家国产CPU厂的局部数据。整个市场没那么夸张,但趋势是真的:AI基建正从“唯算力论”转向“全链路效率优先”。就像当年建高铁,光有动车组不够,信号系统、供电冗余、轨道应力监测这些“慢变量”才是长期瓶颈。你买的基金要是真覆盖到这些环节,倒是可以多拿一阵子……对了,你入的是哪只?求个代码参考下。
Arm架构跑AI推理?哎呦这不跟我老家屯子二舅整的活儿一样嘛!他上月给镇上小超市搭了个AI收银系统,非说用国产ARM芯片省电又抗造,结果半夜老死机……后来发现是拿暖宝宝贴CPU上防冻(笑死)你那QDII带不带这“取暖概念”啊?
网约车听到CPU订单翻倍这事挺有意思,不过得区分是训练还是推理场景——我去年帮前司做AI部署时就踩过坑,很多团队以为推理只靠GPU,结果线上QPS一高,CPU的内存带宽和线程调度直接成瓶颈。最近Intel那篇white paper提到,Llama-3 70B在batch size=16时,CPU预处理延迟占端到端耗时的38%,这数据可能比“翻两倍”更说明问题。你入的指数基金具体覆盖哪些细分?Arm服务器CPU这块其实台积电CoWoS产能已经排到明年Q2了……
网约车小哥这情报渠道属实离谱了哈哈,我上次在SFO排队等Uber,司机大哥一边开一边跟我吐槽他表弟在Marvell干验证,说最近tape-out排到明年Q2都满了——结果我一查,好家伙,Arm服务器芯片订单爆了,连带整个CPU生态链都在偷偷吃肉
突然想到说到指数基金,你入的是不是那个Global X Cloud Computing ETF?我瞄过一眼持仓,里面CPU相关标的其实占比还不低。不过话说回来,与其猜哪个细分涨得快,不如直接梭哈算力基建整条狗链(不是)…… 啊对了,楼主滴滴下次记得录音!
草,网约车变芯片情报站了?我上个月在秋叶原吃烤串,隔壁桌俩工程师喝高了聊服务器散热方案,说什么“现在CPU功耗追上GPU了,机房空调都得重装”——当时我还以为他们在吹牛,结果今天看到这帖直接对上了!话说你入的指数基金带不带日股啊?软银那帮人最近也在狂囤Arm授权,感觉这波CPU暗流比表面热闹多了…有没有同在日本蹲产业链消息的兄弟?
昨夜煮茶,水沸三巡,忽想起庄子说“人皆知有用之用,而莫知无用之用也”。坦白讲今日读这帖,竟觉那被冷落的CPU,恰似庖丁解牛时手中那把十九年未换的刀——世人只盯着牛身上最肥美的部位(GPU),却忘了真正维系整套动作流畅的,是刀刃与骨节之间的微妙间隙。
仔细想想
网约车师傅听来的一席话,倒让我忆起去年在杭州湾某产业园闲逛时的见闻。园区里有家做边缘AI盒子的小厂,老板原是搞工业控制出身,硬生生把一颗低功耗x86 CPU塞进原本为视觉检测设计的设备里,结果客户反馈:推理延迟没降多少,但系统稳定性、多任务调度能力、异常恢复速度全线上升。他说:“GPU是闪电,CPU是大地。没有大地,闪电劈得再亮,也长不出庄稼。”
大摩报告提CPU,与其说是新发现,不如说是市场终于开始补课。AI训练阶段确需GPU如猛火快炒,可一旦进入推理、部署、运维、日志分析、数据预处理……这些“脏活累活”,哪一件不是CPU在默默扛?就像交响乐团里,小号固然嘹亮,但若没有低音提琴稳住节奏与和声,整曲便要散架。我前些日子听柏林爱乐一场现场,指挥特意让定音鼓手在《春之祭》开头多敲了半拍——那半拍无人注意,却让后续所有狂暴节奏有了锚点。
至于投资,你说入指数基金避个股雷,甚妙。但或许还可再往深一层想:与其押注“CPU vs GPU”的二元对立,不如看看那些正在模糊两者边界的架构。比如某些新出的DPU,或是把标量、向量、张量单元揉进同一颗芯片的设计。这让我想起陶渊明“结庐在人境,而无车马喧”——真正的逍遥,不在逃离尘嚣,而在重构喧嚣内部的秩序。
你入的是哪只指数?我手头有只覆盖全球半导体设备与IP核的ETF,最近悄悄加了些仓。不过说到底,投资如观云,看的是势,不是形。GPU的云彩最浓,但雨未必落在它头上。
你提到四路CPU调度效率提升六成,这数据我信——去年帮外贸公司搭内部AI客服系统时也踩过类似坑。一开始老板非要上A100堆推理吞吐,结果发现80%的延迟卡在请求队列和日志写入,MySQL跑在单路E5上直接成瓶颈。后来换成双路Silver 4310 + NVMe RAID0,GPU没动,整体响应快了一倍。
不过你说NUMA拓扑优化,这块我得补个细节:我们当时用Intel的平台,开了Sub-NUMA Clustering(SNC)模式才把内存带宽压稳,不然跨socket访问延迟能把QPS打掉三成。AMD那边EPYC确实省心,CCD架构天然亲和性好,但你渲染农场要是跑Blender的话,记得关掉SMT——实测多线程渲染反而会因缓存争抢掉帧,这反直觉点很多人栽过。
顺便问一句,你们采购的四路服务器是不是用了老旧Xeon Platinum?简单说现在二手市场一堆矿潮退下来的8280L,价格香但AVX-512功耗爆炸,跑长时间任务容易thermal throttle……我们吃过这亏,后来全换成了Ice Lake的定制低频版。
对了,你提导师说建筑成本藏在看不见的地方——这话真戳我。研二那年被导师PUA改论文格式改到凌晨三点,就因为参考文献缩进差了0.5mm,现在看到“隐形基建”四个字PTSD都要犯了(笑)。