過去數(shù)年間,英偉達(dá)憑借AI算力需求的爆發(fā)式增長(zhǎng),一度穩(wěn)坐行業(yè)頭把交椅。然而近期,行業(yè)風(fēng)向悄然轉(zhuǎn)變,資本市場(chǎng)對(duì)英偉達(dá)的態(tài)度從“不可替代”轉(zhuǎn)向“存在替代可能”,其市值在一個(gè)月內(nèi)蒸發(fā)超7000億美元,折射出技術(shù)競(jìng)爭(zhēng)格局的深層變化。這場(chǎng)變局的觸發(fā)點(diǎn)并非傳統(tǒng)意義上的芯片巨頭對(duì)決,而是谷歌以TPU(張量處理器)為核心的專用芯片路線,正從幕后走向臺(tái)前。
11月27日,英偉達(dá)創(chuàng)始人黃仁勛在臺(tái)北公開表示“我真的超級(jí)累”,這一罕見情緒流露,被外界解讀為應(yīng)對(duì)新競(jìng)爭(zhēng)壓力的信號(hào)。與此同時(shí),行業(yè)頭部玩家meta被曝正與谷歌洽談一項(xiàng)規(guī)模達(dá)數(shù)十億美元的芯片采購協(xié)議——從2027年起,meta計(jì)劃將谷歌TPU引入其數(shù)據(jù)中心。這一動(dòng)作的象征意義遠(yuǎn)超商業(yè)價(jià)值:作為全球AI基礎(chǔ)設(shè)施投入最大的公司之一,meta的選擇被視為對(duì)谷歌技術(shù)路線的重要背書。
面對(duì)挑戰(zhàn),英偉達(dá)迅速亮出防御牌。公司強(qiáng)調(diào)其GPU平臺(tái)仍“領(lǐng)先業(yè)界一代”,是“唯一能運(yùn)行所有人工智能模型并實(shí)現(xiàn)跨場(chǎng)景計(jì)算的解決方案”。其核心論點(diǎn)在于CUDA生態(tài)構(gòu)建的開發(fā)者護(hù)城河,以及GPU在通用性和靈活性上的不可替代性。但行業(yè)討論的焦點(diǎn)已悄然轉(zhuǎn)移:當(dāng)AI訓(xùn)練與推理規(guī)模持續(xù)擴(kuò)張,能耗正成為新的約束條件,而谷歌TPU在能效比上的優(yōu)勢(shì)開始顯現(xiàn)。
半導(dǎo)體專家張國(guó)斌指出,TPU作為為深度學(xué)習(xí)定制的ASIC芯片,通過犧牲通用性換取極致性能。例如,谷歌最新一代Ironwood TPU的能效比是初代產(chǎn)品的30倍,在同等工藝下遠(yuǎn)超GPU。這種技術(shù)優(yōu)勢(shì)已轉(zhuǎn)化為實(shí)際成果:OpenAI開始使用TPU進(jìn)行部分訓(xùn)練,Anthropic宣布將TPU v5e作為下一代大規(guī)模訓(xùn)練平臺(tái),理由正是“性能與成本的平衡”。更關(guān)鍵的是,谷歌通過“硬件即服務(wù)”(HaaS)模式,將TPU部署在合作伙伴數(shù)據(jù)中心并按使用量分成,大幅降低了中小云廠商的硬件投入門檻。
谷歌的野心不止于此。其正在構(gòu)建“TPU+OCS(光路交換系統(tǒng))+Gemini大模型+云服務(wù)”的全棧體系,實(shí)現(xiàn)從芯片到應(yīng)用的深度整合。這種系統(tǒng)級(jí)優(yōu)化使得數(shù)據(jù)中心網(wǎng)絡(luò)拓?fù)渫耆?wù)于TPU超節(jié)點(diǎn),例如最新發(fā)布的第七代TPU Ironwood,通過ICI scale-up網(wǎng)絡(luò)可支持9216顆芯片的超大規(guī)模集群,峰值性能達(dá)4614TFLOPS,是上一代的10倍。華泰證券分析認(rèn)為,谷歌正以“游擊戰(zhàn)”策略滲透市場(chǎng),其全棧生態(tài)可能對(duì)英偉達(dá)的通用算力體系構(gòu)成長(zhǎng)期威脅。
技術(shù)競(jìng)爭(zhēng)的維度正在從“單卡性能”轉(zhuǎn)向“系統(tǒng)效率”。盡管英偉達(dá)在單卡算力上仍占優(yōu)勢(shì),但超節(jié)點(diǎn)集群的互聯(lián)能力成為新的戰(zhàn)場(chǎng)。華為、阿里、百度等中國(guó)廠商在這一領(lǐng)域動(dòng)作頻頻:華為推出的Atlas 960 SuperPoD支持15488張昇騰卡互聯(lián),阿里云磐久128超節(jié)點(diǎn)服務(wù)器單柜容納128顆AI芯片,百度昆侖芯則通過百舸5.0實(shí)現(xiàn)超節(jié)點(diǎn)量產(chǎn)部署。國(guó)產(chǎn)GPU廠商也在加速追趕,壁仞、燧原、沐曦、摩爾線程等企業(yè)通過光互連技術(shù)、分布式并行架構(gòu)等創(chuàng)新,推動(dòng)超節(jié)點(diǎn)規(guī)模向千卡級(jí)邁進(jìn)。
華龍證券觀察指出,中美AI競(jìng)爭(zhēng)已進(jìn)入“體系化”階段。中國(guó)廠商通過集群建設(shè)、開源生態(tài)和工程化交付,正在AI基建領(lǐng)域形成差異化優(yōu)勢(shì)。例如,曦智科技聯(lián)合壁仞、中興推出的光互連GPU超節(jié)點(diǎn)LightSphereX,實(shí)現(xiàn)了跨芯片的高速數(shù)據(jù)傳輸;燧原云燧ESL系統(tǒng)單節(jié)點(diǎn)支持64卡全帶寬互聯(lián),沐曦曦云C600則通過metaXlink技術(shù)擴(kuò)展超節(jié)點(diǎn)規(guī)模。這些突破表明,當(dāng)算力競(jìng)爭(zhēng)從“芯片之爭(zhēng)”升級(jí)為“生態(tài)之爭(zhēng)”,系統(tǒng)效率、能效比和規(guī)模化交付能力正在重新定義行業(yè)規(guī)則。
對(duì)于英偉達(dá)而言,挑戰(zhàn)與機(jī)遇并存。其CUDA生態(tài)仍擁有全球最龐大的開發(fā)者社區(qū),GPU的通用算力在多元場(chǎng)景中難以被完全替代。但谷歌TPU的崛起,以及云服務(wù)廠商自研ASIC的擴(kuò)散,正在打破原有的技術(shù)壟斷格局。當(dāng)meta愿意將數(shù)十億美元投向競(jìng)爭(zhēng)對(duì)手,當(dāng)中國(guó)廠商在超節(jié)點(diǎn)領(lǐng)域?qū)崿F(xiàn)局部領(lǐng)先,行業(yè)格局的微妙變化已不容忽視。這場(chǎng)關(guān)于“夠用、便宜、可規(guī)模化”的競(jìng)爭(zhēng),或許才剛剛拉開序幕。










