Vera Rubin全面量產 黃仁勳:供應鏈規模是Grace Blackwell兩倍

輝達(NVIDIA)執行長黃仁勳。記者朱子呈/攝影

輝達(NVIDIA)執行長黃仁勳1日於全球技術大會臺灣場(GTC Taiwan)宣佈,輝達新一代人工智慧(AI)平臺Vera Rubin已進入全面量產。他指出,AI已成爲可獲利的生產力引擎,全球算力需求居高不下,且算力正是當前最大限制,Vera Rubin量產將支撐全球人工智慧工廠(AI factory)建置進入下一階段。

黃仁勳表示,爲Vera Rubin打造的供應鏈規模,是Grace Blackwell的兩倍;同時,過去組裝一座Grace Blackwell機架約需兩小時,如今相關組裝流程已縮短至五分鐘,不僅產能擴大,製造效率也大幅提升。他並指出,爲支撐Grace Blackwell與Vera Rubin,相關供應鏈已新增數百萬平方英尺產能,顯示臺灣AI供應鏈正全力支援全球AI工廠需求。

黃仁勳強調,Vera Rubin不是隻爲執行AI模型而打造,而是專爲AI代理人(AI agent)時代設計的新一代系統。他指出,Hopper時代主要聚焦AI預訓練(pre-training),Grace Blackwell因應高效率推論(inference)需求;到了Vera Rubin,運算負載已從推論進一步走向代理型AI系統,必須支撐模型思考、工具調用、記憶管理、資料存取與低延遲互動。

黃仁勳現場展示Vera Rubin NVLink 72系統,並指出Vera Rubin不是單一GPU,而是由Vera Rubin NVLink 72、Vera中央處理器(CPU)、BlueField儲存與安全系統、Mellanox網路,以及共同封裝光學(CPO)等技術共同構成的端到端AI工廠平臺。Vera Rubin架構透過中間印刷電路板(PCB)連接兩側,取代過去滿布線纜、管線與風扇的設計,以提升可靠度、韌性與量產效率。

其中,Vera CPU是黃仁勳特別着墨的關鍵。他表示,過去CPU主要爲人類使用情境打造,人類等待時間以秒計算;但AI代理人運作節奏以奈秒計算,當代理人調用工具、存取資料庫或讀取記憶時,都需要極低延遲迴應,因此Vera CPU是「爲代理人打造的CPU」。

黃仁勳指出,Vera CPU設計重點包括極高單執行緒效能、高每核心頻寬、高整體系統頻寬,以及高能源效率。Vera CPU每時脈可擷取、解碼並執行10個指令,內部網狀架構頻寬達3.6TB/s,支援第六代PCI Express(PCIe Gen 6),並具備低功耗雙倍資料率第五代記憶體(LPDDR5)、1.2TB/s頻寬。他並將Vera CPU與高效能x86 CPU比較,強調Vera在真實單執行緒效能、系統頻寬與能源效率上均大幅領先。

黃仁勳也強調,AI工廠的經濟價值來自詞元(token),運算能力已成爲營收與利潤來源。他指出,1GW等級AI工廠投資金額已從早期約200億至300億美元,升至500億至600億美元,未來甚至將達800億至1,000億美元;在如此龐大的資本支出下,首次產生詞元時間(time to first token)、每瓦詞元產出(tokens per watt)、系統可靠度與資產使用壽命,將成爲AI基礎建設競爭的關鍵。