Google一口氣推出兩款TPU,首度拆分訓練與推理晶片,企業AI智能體全面 鋪開
Alphabet旗下Google Cloud於年度開發者大會上動作頻繁,同步推出新一代自研晶片與企業級AI智能體工具,在硬體和軟體兩條戰線同時向Nvidia、OpenAI及Anthropic發起挑戰。
當地時間週三,Google Cloud於拉斯維加斯舉行的Google Cloud Next 2026大會上,發佈了第八代張量處理器(TPU)的兩款新品:專為AI模型訓練設計的TPU 8T,以及專為推理(inference)階段優化的TPU 8i,預計於今年稍晚上市供應。這是Google首次將訓練與推理任務拆分至獨立晶片,標誌著其AI硬體戰略的重大轉向。

同時,Google還推出了Gemini Enterprise Agent Platform等一系列AI智能體開發工具,直指企業自動化市場。
新晶片的發佈正值AI推理需求急速擴張之際。Google雲端運算與AI基礎設施副總裁Mark Lohmeyer表示:「關鍵在於如何以最低的每筆交易成本實現最低的回應延遲。交易量正在大幅攀升,而每筆交易的成本必須大幅下降,才能實現規模化。」兩款新晶片將於今年稍晚正式上線。
訓練與推理分離,晶片效能大幅躍升
Google此次將第八代TPU拆分為兩款獨立產品,是針對AI工作負載日益分化趨勢的直接回應。
Google高級副總裁兼AI與基礎設施首席技術官Amin Vahdat在部落格中寫道:「隨著AI智能體的興起,我們判斷業界將受益於針對訓練和推理各自需求專門優化的晶片。」
TPU 8t專為AI模型訓練優化,號稱能夠「將前沿模型開發週期從數月壓縮至數週」。
在效能層面,TPU 8t的每瓦效能較上一代提升124%,TPU 8i則提升117%。與去年11月發佈的第七代Ironwood TPU相比,TPU 8t在同等價格下效能提升2.8倍,TPU 8i的效能則提升80%。
訓練晶片TPU 8t最多可將9600顆晶片組合成一套系統,Google表示,在部署如此大規模系統時,電力已是資料中心的核心限制因素,更高的能效比因此至關重要。
TPU 8i則主要面向推理場景,適用於運行AI模型及處理AI智能體任務。其架構設計重點在於大容量片上儲存。每顆晶片整合384MB的靜態隨機存取記憶體(SRAM),是上一代Ironwood的三倍。
兩款晶片均計劃於2026年稍晚正式對外供應。
Alphabet執行長桑達爾·皮查伊在部落格中表示,這一架構旨在「以具成本效益的方式,提供同時運行數百萬個智能體所需的大規模吞吐量和低延遲」。片上儲存的增加意味著晶片無需頻繁從外部調用資料,對需多步驟推理的AI任務尤為關鍵。
AI智能體平台全面鋪開,直指OpenAI與Anthropic
在軟體層面,Google此次發佈了一套完整的企業AI智能體工具鏈,正面迎戰OpenAI和Anthropic在企業市場的佈局。
據彭博報導,多位初創公司創辦人表示,矽谷工程師在AI程式設計工具的選擇上通常在Anthropic的Claude Code與OpenAI的Codex之間切換,Google往往不在考慮之列——這一現狀令Google高層深感憂慮。
Google Cloud CEO Thomas Kurian在部落格中表示:「這不是提供可拼湊在一起的單項服務,而是提供一個全面的創新基礎骨架。」
新推出的Gemini Enterprise Agent Platform新增了Memory Bank和Memory Profile功能,幫助智能體記住與用戶的歷史互動,彌補早期AI工具的記憶短板;Agent Simulation功能則允許開發者在上線前對工具進行更充分的測試。
Google還推出了協作平台Projects,整合來自Workspace、微軟OneDrive及企業內部聊天工具的資訊,為智能體提供必要的上下文支持。此外,Google還發佈了面向一般員工的Gemini Enterprise應用,定位為「每位員工的AI前台」,用戶無需編寫任何程式碼即可創建智能體。
TPU採用加速,Nvidia合作並行推進
雖然Google在自研晶片上持續加碼,但其與Nvidia的合作關係並未中斷。
Mark Lohmeyer表示,Google計劃成為今年下半年Nvidia新一代晶片設計的首批部署方之一,同時將繼續為希望使用Nvidia系統的客戶提供相關服務。
同時,Google TPU的商業採用正在加速。
對沖基金Citadel Securities已基於Google TPU構建量化研究軟體,美國能源部旗下全部17個國家實驗室均在使用基於TPU構建的AI協作科學家軟體。Meta已與Google簽署一項多年期、數十億美元的TPU使用協議,AI新貴Anthropic也已承諾使用數吉瓦級別的Google TPU算力。
DA Davidson分析師去年9月估計,TPU業務與Google DeepMind AI部門合計價值約9000億美元。
值得注意的是,Google並未將新晶片的效能與Nvidia產品直接對比。Nvidia方面,其即將推出的新品線將整合其以200億美元收購Groq所獲得的技術,專門針對超低延遲推理場景。
Nvidia執行長黃仁勳此前表示,超過20%的AI工作負載可能最適合由此類晶片處理。Groq由一批前Google工程師於2016年創立。
為進一步擴大TPU的可及性,Google還在測試將TPU部署至客戶自有資料中心的方案,並推進與第三方軟體工具的相容性。不過,晶片供應瓶頸以及AI模型快速迭代與多年期晶片研發週期之間的錯位,仍是Google擴大規模過程中需要面對的主要不確定因素。
免責聲明:文章中的所有內容僅代表作者的觀點,與本平台無關。用戶不應以本文作為投資決策的參考。
您也可能喜歡
5月22日美市更新支撐阻力:18品種支撐阻力(金銀鉑鈀原油天然氣銅及十大貨幣對)

HOKA的DTC又跑起來了
狂歡落幕?美股「最強財報季」見頂,下週三大宏觀重磅恐引爆美債風暴
MAPO 24小時內波動45.8%:橋接漏洞引發大量代幣鑄造導致價格劇烈波動
