輝達傳將推出新的推論晶片 加速AI處理
輝達(NVIDIA)執行長黃仁勳今年1月在拉斯維加斯消費電子展上,介紹Vera Rubin AI平臺,並答覆媒體提問。法新社
輝達(NVIDIA)傳出計劃推出一款全新晶片,專爲協助OpenAI等客戶打造更快速、更高效率的人工智慧(AI)工具。做爲AI晶片龍頭,輝達的這項重大業務調整,勢將重塑AI競賽的格局。
知情人士向華爾街日報透露,輝達設計了一套全新的「推論」(inference)運算系統,這套新系統平臺整合了新創公司Groq所設計的晶片,預定在3月舉行的輝達GTC開發者大會上亮相。
一些消息人士表示,OpenAI已同意成爲輝達新顆新推論晶片的最大客戶之一。若真如此,這將是輝達的一大勝利。因爲過去多個月來,OpenAI一直在尋找比輝達晶片更高效率的替代方案,上月還與晶片新創公司Cerebras簽署了價值數十億美元的算力合作協議,Cerebras的專長正是推論晶片。
推論運算是一種讓AI模型能迴應查詢的處理方式;現在這種運算方式已成爲業界激烈競爭的領域。Google與亞馬遜(Amazon)均已在這方面設計出可與輝達旗艦系統抗衡的晶片。
週五(27日)稍早,OpenAI宣佈獲得輝達300億美元投資,並將向輝達大規模採購「專用於推論的算力」,其實已暗示了輝達新的推論處理器的存在。
過去一年來,隨着企業加速部署AI代理及其他AI工具,市場對高階運算的需求已從訓練轉向推論。AI代理,是一種相對能更自主代表使用者執行任務的AI系統。
輝達執行長黃仁勳一向主張,輝達的繪圖處理器(GPU)在訓練與推論兩方面皆爲市場領導者,強調輝達晶片的多功能性,正是公司產品的核心吸引力所在。
然而,許多開發與營運AI代理的公司發現,輝達GPU成本過高、耗能過大,且未必最適合實際應用。部分輝達的大型客戶就發現,某些AI代理的工作,只以CPU執行,反而更有效率。輝達因而面臨壓力,必須開發成本較低、能源效率更高的推論晶片。
輝達新的推論運算系統要整合Groq晶片,雙方合作成形於輝達去年底同意以200億美元,取得Groq的關鍵技術授權,同時延攬Groq的高層團隊。Groq是以「語言處理單元」爲架構設計晶片,在推論功能上具有高度效率。