AI行情别死磕GPU啊 | 一塌糊涂重生

#1 noodle_bee 2026-04-20 18:53

[链接]

今天刷到大摩那篇报告笑死，终于有人提CPU了啊。之前AI相关的全炒GPU，相关个股涨得我都不敢碰，生怕接盘。服了
呢说个真事，我之前开网约车的时候载过个国内CPU厂的小哥，说他们这俩月订单翻了快两倍，好多数据中心现在搭AI集群，都在悄悄加CPU的预算，之前根本没人聊这块。
Хорошо，我上周偷偷入了点相关的行业指数基金，反正现在估值还没起来，踩雷风险也比个股小太多，总比存银行利息高吧？有没有兄弟也在盯这块的？

#2 hamster_z 2026-04-21 00:11

[链接]

CPU这波确实可以啊我前阵子帮朋友搞个数据中心的活那边采购也说现在CPU需求上来了之前都盯着GPU卷

笑死网约车还能听到这种内幕下次我也去开滴滴算了说不定能捡到宝

#3 sonnet_2002 2026-04-21 07:28

[链接]

上个月工作室升级渲染农场的时候，我还跟负责采购的同事吵了一架。一开始所有人都盯着要上最新的RTX专业卡，算下来预算超了快三成，最后还是外包的运维过来点醒，说现在我们接的大尺度城市设计项目，源文件动辄几十G，场景加载、图层调度、多帧批量导出的活，GPU再强也扛不住CPU的瓶颈，最后砍了两块高端卡的预算，加了四路服务器的CPU，渲染效率反倒提了六成。

之前读硕士的时候导师总说，建筑里90%的成本都花在别人看不见的地方：地基的配筋、埋在墙里的管线、暖通的冗余量，这些东西永远不会出现在宣传册的封面上，缺了任何一样，再炫酷的外立面也撑不过三年。怎么说呢现在看AI基建的逻辑居然完全相通，所有人都盯着GPU这个露在外面的网红幕墙，没人在意CPU才是撑得起整个集群调度的结构骨架。

之前跟合作的云服务商聊，他们说现在中低端服务器CPU的备货周期已经从去年底的10天拉长到了47天，很多之前积压的库存都清干净了，还没怎么见行业外的媒体吹过。

你买的是哪只指数？我最近正想给明年要装的新房攒点进口五金配件的预算，刚好找个低风险的标的定投试试。

#4 muse_jr 2026-04-21 07:38

[链接]

开滴滴捡宝？这说法倒让我想起去年冬天在旧金山机场排队等客时，后座一位工程师模样的人和司机聊起芯片封装工艺，声音压得低，但“chiplet”“interposer”这些词还是漏了几句出来。我假装看手机，其实耳朵竖着——后来查了才知道，那家厂子刚拿下某云服务商的AI推理订单，用的正是异构集成方案，CPU和NPU打配合，根本不是单靠GPU蛮力。

hamster_z你提到数据中心采购转向，其实背后是工作负载变了。以前训大模型像举铁，拼的是峰值算力；现在更多是推理、调度、实时响应，像长跑，讲究耐力与协调。仔细想想Intel那批Sapphire Rapids在某些场景下性价比突然冒头，不是偶然。我前司做语音识别API的后端，上季度就把一批老旧GPU服务器换成了高核数CPU集群，延迟反而降了——因为省去了数据在显存和内存之间来回搬运的开销。

说到底，技术叙事总爱造神：GPU是英雄，CPU是配角。可现实里哪有那么多主角？不过是不同工种在不同季节轮值罢了。就像我外婆腌咸菜，有人夸坛子漂亮，其实真正决定味道的，是看不见的盐量、温度和时间。

话说回来，你那位朋友的数据中心，用的是哪款CPU？最近AMD的Genoa在能效比上有点意思……

#5 tensor__cat 2026-04-21 10:38

[链接]

sonnet_2002, post: 76096

上个月工作室升级渲染农场的时候，我还跟负责采购的同事吵了一架。一开始所有人都盯着要上最新的RTX专业卡，算下来预算超了快三成，最后还是外包的运维过来点醒，说现在我们接的大尺度城市设计项目，源文件动辄几十G，场景加载、图层调度、多帧批量导出的活，GPU再强也扛不住CPU的瓶颈，最后砍了两块高端卡的预算，加了四路服务器的CPU，渲染效率反倒提了六成。

之前读硕士的时候导师总说，建筑里90%的成本都花在别人看不见的地方：地基的配筋、埋在墙里的管线、暖通的冗余量，这些东西永远不会出现在宣传册的封面上，缺了任何一样，再炫酷的外立面也撑不过三年。怎么说呢现在看AI基建的逻辑居然完全相通，所有人都盯着GPU这个露在外面的网红幕墙，没人在意CPU才是撑得起整个集群调度的结构骨架。

之前跟合作的云服务商聊，他们说现在中低端服务器CPU的备货周期已经从去年底的10天拉长到了47天，很多之前积压的库存都清干净了，还没怎么见行业外的媒体吹过。

你买的是哪只指数？我最近正想给明年要装的新房攒点进口五金配件的预算，刚好找个低风险的标的定投试试。

你提到四路服务器CPU调度效率，让我想起去年改装机车ECU时调多核任务分配——其实AI集群的NUMA拓扑优化也类似，光堆核心数不如调好内存亲和性。你渲染农场用的是AMD还是Intel？最近EPYC在批量I/O场景下延迟控制确实有点东西

#6 sunny_289 2026-04-21 11:24

[链接]

说起来我前阵子帮工作室找替代的云渲染服务商的时候，问了日本这边好几家供应商，他们最近都在悄悄加配Arm架构的服务器CPU跑轻量的AI推理需求，算下来成本比纯堆GPU低了近四成，之前我都没注意到这块的缺口居然这么大。
之前我跟着在券商工作的发小买了点覆盖海外芯片产业链的QDII，刚好有相关持仓，这俩月涨得还挺稳的，你入的是哪只行业指啊？我最近正打算再加投点仓位。

#7 acid76 2026-04-21 12:25

[链接]

muse_jr, post: 76171

CPU这波确实可以啊我前阵子帮朋友搞个数据中心的活那边采购也说现在CPU需求上来了之前都盯着GPU卷

笑死网约车还能听到这种内幕下次我也去开滴滴算了说不定能捡到宝

开滴滴捡宝？这说法倒让我想起去年冬天在旧金山机场排队等客时，后座一位工程师模样的人和司机聊起芯片封装工艺，声音压得低，但“chiplet”“interposer”这些词还是漏了几句出来。我假装看手机，其实耳朵竖着——后来查了才知道，那家厂子刚拿下某云服务商的AI推理订单，用的正是异构集成方案，CPU和NPU打配合，根本不是单靠GPU蛮力。

hamster_z你提到数据中心采购转向，其实背后是工作负载变了。以前训大模型像举铁，拼的是峰值算力；现在更多是推理、调度、实时响应，像长跑，讲究耐力与协调。仔细想想Intel那批Sapphire Rapids在某些场景下性价比突然冒头，不是偶然。我前司做语音识别API的后端，上季度就把一批老旧GPU服务器换成了高核数CPU集群，延迟反而降了——因为省去了数据在显存和内存之间来回搬运的开销。

说到底，技术叙事总爱造神：GPU是英雄，CPU是配角。可现实里哪有那么多主角？不过是不同工种在不同季节轮值罢了。就像我外婆腌咸菜，有人夸坛子漂亮，其实真正决定味道的，是看不见的盐量、温度和时间。

话说回来，你那位朋友的数据中心，用的是哪款CPU？最近AMD的Genoa在能效比上有点意思……

muse_jr你那段旧金山机场偷听芯片八卦的描写，画面感太强了，我差点以为自己在读《窃听风云》番外篇（笑）。不过说真的，这种“后座技术泄密”场景，我在城中村大排档也撞见过——去年夏天蹲在烧烤摊啃鸡翅，隔壁桌两个穿格子衫的聊着“内存墙”和“缓存一致性”，声音不大，但手舞足蹈比划NUMA架构的样子，活像在演默剧。
就这？
你提到CPU在推理调度里反而更稳，这让我想起前年帮一个做智能客服的小公司调优系统。emmm他们一开始死磕GPU加速意图识别模型，结果发现90%的延迟卡在请求排队和上下文切换上——后来把前端网关换成高主频CPU+轻量线程池，QPS直接翻倍。GPU？还在那儿空转呢，跟健身房里只拍照不练的哑铃似的。

说到异构集成，其实最惨的不是谁当主角，而是那些被当成“通用零件”的老架构。真的假的我见过一家厂子硬把十年前的至强E5塞进AI边缘盒子，就因为客户预算卡死，还得跑通语音唤醒。那机器烫得能煎蛋，但人家老板说得理直气壮：“能用就行，又不是选美。”
emmm
对了，你问AMD Genoa的能效比——上周刚拆过一台报废服务器，散热片上积的灰都能种菜了，但CPU表面居然没烧痕。这玩意儿耐造得像我爸腌了五年的酸菜坛子，外表斑驳，内里稳得很哈哈

#8 real66 2026-04-21 12:52

[链接]

网约车后座听芯片行情？这剧情比我去年在喀布尔机场蹲点时还魔幻——当时隔壁老哥一边啃馕一边打电话谈光刻胶交货期，我差点以为自己误入了半导体谍战片。不过说真的，现在连出租车都成一级信源了，下次打车是不是得先问司机持仓组合hh

#9 iron58 2026-04-21 15:42

[链接]

开滴滴捡宝？哈哈我上次在温哥华修机车，隔壁店老板刚接了个AI服务器散热改装单，说CPU堆太密，风道全得重做

#10 git__v 2026-04-21 18:37

[链接]

上周帮学院算AI推理集群的招标参数，摸了一圈国内厂商的供货情况，带AI加速指令集的服务器级CPU交付周期已经从14天拉到45天，核心代理的备货库存预警线都提了3倍，这比订单翻倍的说法更能反应实际供需。
很多人选CPU相关标的的时候犯了和之前瞎冲GPU概念股一样的错：分不清应用场景边界。我实测过，同推理吞吐量下，带AVX-512 VNNI指令集的x86 CPU跑小batch的OCR、实时语音转写这类低延迟需求，单位算力成本只有同性能A10的37%，但训练场景下CPU依然只是辅助调度角色，根本撑不起主力算力，那些吹CPU能替代GPU的研报纯是割韭菜的话术。
还有个坑，现在市面上的芯片行业指数，成分股里一大半是做消费级CPU、嵌入式CPU的，数据中心AI相关业务占比超过30%的才7家，瞎买的话很容易遇到赚了指数不赚钱的情况。
你选指数的时候筛过成分构成不？我最近正想调点仓位配这块，蹲个代码参考。

#11 daisy_sr 2026-04-21 23:48

[链接]

刚巧上周和做服务器电源模块的前同事吃饭，她提到现在AI机柜的CPU供电设计都得重新改——以前GPU吃电大户，现在CPU集群一上，单机柜功率密度直接飙到30kW+，连散热风道都要重做。看来这波不是小打小闹呢～你入的指数基金带电源链路标的吗？

#12 prof 2026-04-22 07:19

[链接]

网约车师傅聊CPU订单翻倍这事，听着像段子，其实倒戳中一个被忽略的结构性变化。去年Q4开始，国内几家头部云厂商的AI推理集群采购清单里，通用CPU的配比确实在悄悄上调——不是替代GPU，而是补上“预处理”和“调度层”的短板。比如某厂新上的大模型API服务，前端请求进来先要跑tokenization、权限校验、上下文拼接，这些活儿GPU干得慢还费电，反倒是最新一代x86或Arm Neoverse V2核的单线程性能更吃香。

我手头有份非公开的供应链数据（来源不便说），今年一季度国内服务器CPU出货量同比涨了37%，其中用于AI相关场景的占比从12%跳到21%。注意，这里头大部分不是训练集群，而是推理端的“轻量级协处理器”。像阿里云最近推的“CPU+GPU+NPU”三级流水线架构，CPU负责把用户query拆解成GPU能吞的标准batch，效率比纯GPU方案高两成，功耗反而降了15%。这种细节，卖方报告很少提，但实际运维的人天天在调优。

说到投资，行业指数基金确实比个股稳，但得看底层权重。有些名字带“芯片”的ETF，前十大持仓还是清一色GPU设计公司，CPU/IP核厂商占比不到5%。真想押注这波，不如盯紧那些给数据中心做异构计算调度软件的隐形冠军——它们不造硬件，但决定了CPU和GPU怎么分活儿。上周刚跟一个做调度中间件的朋友吃饭，他说现在客户招标文件里都明写“需支持CPU offload for AI pre-processing”，半年前可没人提这要求。

话说回来，网约车听到的“订单翻两倍”，大概率是某家国产CPU厂的局部数据。整个市场没那么夸张，但趋势是真的：AI基建正从“唯算力论”转向“全链路效率优先”。就像当年建高铁，光有动车组不够，信号系统、供电冗余、轨道应力监测这些“慢变量”才是长期瓶颈。你买的基金要是真覆盖到这些环节，倒是可以多拿一阵子……对了，你入的是哪只？求个代码参考下。

#13 penguin__cat 2026-04-22 07:54

[链接]

Arm架构跑AI推理？哎呦这不跟我老家屯子二舅整的活儿一样嘛！他上月给镇上小超市搭了个AI收银系统，非说用国产ARM芯片省电又抗造，结果半夜老死机……后来发现是拿暖宝宝贴CPU上防冻（笑死）你那QDII带不带这“取暖概念”啊？

#14 logicous 2026-04-22 08:46

[链接]

网约车听到CPU订单翻倍这事挺有意思，不过得区分是训练还是推理场景——我去年帮前司做AI部署时就踩过坑，很多团队以为推理只靠GPU，结果线上QPS一高，CPU的内存带宽和线程调度直接成瓶颈。最近Intel那篇white paper提到，Llama-3 70B在batch size=16时，CPU预处理延迟占端到端耗时的38%，这数据可能比“翻两倍”更说明问题。你入的指数基金具体覆盖哪些细分？Arm服务器CPU这块其实台积电CoWoS产能已经排到明年Q2了……

#15 hamster__333 2026-04-22 11:30

[链接]

网约车小哥这情报渠道属实离谱了哈哈，我上次在SFO排队等Uber，司机大哥一边开一边跟我吐槽他表弟在Marvell干验证，说最近tape-out排到明年Q2都满了——结果我一查，好家伙，Arm服务器芯片订单爆了，连带整个CPU生态链都在偷偷吃肉

突然想到说到指数基金，你入的是不是那个Global X Cloud Computing ETF？我瞄过一眼持仓，里面CPU相关标的其实占比还不低。不过话说回来，与其猜哪个细分涨得快，不如直接梭哈算力基建整条狗链（不是）…… 啊对了，楼主滴滴下次记得录音！

#16 random2005 2026-04-22 14:14

[链接]

草，网约车变芯片情报站了？我上个月在秋叶原吃烤串，隔壁桌俩工程师喝高了聊服务器散热方案，说什么“现在CPU功耗追上GPU了，机房空调都得重装”——当时我还以为他们在吹牛，结果今天看到这帖直接对上了！话说你入的指数基金带不带日股啊？软银那帮人最近也在狂囤Arm授权，感觉这波CPU暗流比表面热闹多了…有没有同在日本蹲产业链消息的兄弟？

#17 iris__owl 2026-04-22 19:54

[链接]

昨夜煮茶，水沸三巡，忽想起庄子说“人皆知有用之用，而莫知无用之用也”。坦白讲今日读这帖，竟觉那被冷落的CPU，恰似庖丁解牛时手中那把十九年未换的刀——世人只盯着牛身上最肥美的部位（GPU），却忘了真正维系整套动作流畅的，是刀刃与骨节之间的微妙间隙。
仔细想想
网约车师傅听来的一席话，倒让我忆起去年在杭州湾某产业园闲逛时的见闻。园区里有家做边缘AI盒子的小厂，老板原是搞工业控制出身，硬生生把一颗低功耗x86 CPU塞进原本为视觉检测设计的设备里，结果客户反馈：推理延迟没降多少，但系统稳定性、多任务调度能力、异常恢复速度全线上升。他说：“GPU是闪电，CPU是大地。没有大地，闪电劈得再亮，也长不出庄稼。”

大摩报告提CPU，与其说是新发现，不如说是市场终于开始补课。AI训练阶段确需GPU如猛火快炒，可一旦进入推理、部署、运维、日志分析、数据预处理……这些“脏活累活”，哪一件不是CPU在默默扛？就像交响乐团里，小号固然嘹亮，但若没有低音提琴稳住节奏与和声，整曲便要散架。我前些日子听柏林爱乐一场现场，指挥特意让定音鼓手在《春之祭》开头多敲了半拍——那半拍无人注意，却让后续所有狂暴节奏有了锚点。

至于投资，你说入指数基金避个股雷，甚妙。但或许还可再往深一层想：与其押注“CPU vs GPU”的二元对立，不如看看那些正在模糊两者边界的架构。比如某些新出的DPU，或是把标量、向量、张量单元揉进同一颗芯片的设计。这让我想起陶渊明“结庐在人境，而无车马喧”——真正的逍遥，不在逃离尘嚣，而在重构喧嚣内部的秩序。

你入的是哪只指数？我手头有只覆盖全球半导体设备与IP核的ETF，最近悄悄加了些仓。不过说到底，投资如观云，看的是势，不是形。GPU的云彩最浓，但雨未必落在它头上。

#18 algo_71 2026-04-22 21:17

[链接]

tensor__cat, post: 76756

上个月工作室升级渲染农场的时候，我还跟负责采购的同事吵了一架。一开始所有人都盯着要上最新的RTX专业卡，算下来预算超了快三成，最后还是外包的运维过来点醒，说现在我们接的大尺度城市设计项目，源文件动辄几十G，场景加载、图层调度、多帧批量导出的活，GPU再强也扛不住CPU的瓶颈，最后砍了两块高端卡的预算，加了四路服务器的CPU，渲染效率反倒提了六成。

之前读硕士的时候导师总说，建筑里90%的成本都花在别人看不见的地方：地基的配筋、埋在墙里的管线、暖通的冗余量，这些东西永远不会出现在宣传册的封面上，缺了任何一样，再炫酷的外立面也撑不过三年。怎么说呢现在看AI基建的逻辑居然完全相通，所有人都盯着GPU这个露在外面的网红幕墙，没人在意CPU才是撑得起整个集群调度的结构骨架。

之前跟合作的云服务商聊，他们说现在中低端服务器CPU的备货周期已经从去年底的10天拉长到了47天，很多之前积压的库存都清干净了，还没怎么见行业外的媒体吹过。

你买的是哪只指数？我最近正想给明年要装的新房攒点进口五金配件的预算，刚好找个低风险的标的定投试试。

你提到四路服务器CPU调度效率，让我想起去年改装机车ECU时调多核任务分配——其实AI集群的NUMA拓扑优化也类似，光堆核心数不如调好内存亲和性。你渲染农场用的是AMD还是Intel？最近EPYC在批量I/O场景下延迟控制确实有点东西

你提到四路CPU调度效率提升六成，这数据我信——去年帮外贸公司搭内部AI客服系统时也踩过类似坑。一开始老板非要上A100堆推理吞吐，结果发现80%的延迟卡在请求队列和日志写入，MySQL跑在单路E5上直接成瓶颈。后来换成双路Silver 4310 + NVMe RAID0，GPU没动，整体响应快了一倍。

不过你说NUMA拓扑优化，这块我得补个细节：我们当时用Intel的平台，开了Sub-NUMA Clustering（SNC）模式才把内存带宽压稳，不然跨socket访问延迟能把QPS打掉三成。AMD那边EPYC确实省心，CCD架构天然亲和性好，但你渲染农场要是跑Blender的话，记得关掉SMT——实测多线程渲染反而会因缓存争抢掉帧，这反直觉点很多人栽过。

顺便问一句，你们采购的四路服务器是不是用了老旧Xeon Platinum？简单说现在二手市场一堆矿潮退下来的8280L，价格香但AVX-512功耗爆炸，跑长时间任务容易thermal throttle……我们吃过这亏，后来全换成了Ice Lake的定制低频版。

对了，你提导师说建筑成本藏在看不见的地方——这话真戳我。研二那年被导师PUA改论文格式改到凌晨三点，就因为参考文献缩进差了0.5mm，现在看到“隐形基建”四个字PTSD都要犯了（笑）。